Fórum Root.cz

Hlavní témata => Software => Téma založeno: Petr V. 15. 12. 2015, 08:12:02

Název: Diakritika v názvech souborů po unzipu
Přispěvatel: Petr V. 15. 12. 2015, 08:12:02
Dobrý den,
prosím o radu. Mám ZIP soubor vytvořený nejspíš ve Windows 7, ale není to jisté. Pomocí příkazu 'unzip' byl soubor rozpakován a provedeny pokusy o nápravu diakritiku n vázvech soborů a adresářů.
Podle návodů jsem zoušel přejmenovávat pomocí 'convmv' či na prácovat s názvy pomocí 'iconv',  zkoušel jsem vstupní kódovnání cp1250, windows-1250, cp852, iso-8859-2, latin2, ale nic nezabralo, diakrtika není v pořádku.

convmv -f cp852 -t UTF8 *
ls | iconv -f windows-1250 -t UTF-8
...

Evidentně něco opomíjím nebo dělám špatně, ale už jsem bezradný. Budu vděčný za radu.
Děkuji, Petr
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: trubicoid2 15. 12. 2015, 08:54:50
zkus primo v unzipu
Kód: [Vybrat]
unzip -O 852pripadne prvne s -t
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: Petr V. 15. 12. 2015, 09:30:42
Diky za nasměrování... volbu "-O 852" tu sice nemám, ale samotná volba "-O" to udělá s kódováním iso-8859-2 a pak to s 'convmv' je hračka :-)

unzip -O file.zip
convmv -f iso-8859-2 -t utf-8 *
convmv -r --notest -f iso-8859-2 -t utf-8 *

P.
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: reb 15. 12. 2015, 09:48:32
Jinak zip/unzip by to měly umět automaticky, ale je na to potřeba knihovna rcc (librcc0).
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: trubicoid2 15. 12. 2015, 09:56:25
u mne (Gentoo) je potreba unzip prelozit s USE="unicode natspec" coz pouzije libnatspec http://natspec.sourceforge.net/
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: JardaP . 15. 12. 2015, 12:13:13
Coz takle vzit krename a soubory prejmenovat zpet? V Krename se da nadefinovat substituce znaku a skupin znaku za jine. Takze i kdyz se nevi, co to bylo za kodovani a proc se to zepsulo, melo by byt mozne se tam dopracovat k normalnim jmenum.
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: trubicoid2 15. 12. 2015, 14:01:07
myslim unzip bez toho -O to nejak uplne dodela, ze uz to ani neni v zadnem kodovani
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: x14 15. 12. 2015, 14:24:41
Jména souborů v ZIPu byla původně pouze v ASCI, ale už dlouho je možné u každého vloženého souboru ve flagu nastavit speciální bit (general purpose bit 11) a pak se jméno tohoto souboru chápe jako UTF8 bez BOM. Bohužel Windows 8 používají tento bit. Co tam ukládají Windows do té doby fakt netuším (ale tipl bych si, že to zkoušejí v lokální kódové stránce, u nás tedy Windows 1250).
Název: Re:Diakritika v názvech souborů po unzipu
Přispěvatel: x14 15. 12. 2015, 15:38:14
Bohužel Windows 8 používají tento bit.
Omlouvám se, chtěl jsem napsat: Bohužel Windows 8 používají tento bit.