Fórum Root.cz
Hlavní témata => Software => Téma založeno: Petr V. 15. 12. 2015, 08:12:02
-
Dobrý den,
prosím o radu. Mám ZIP soubor vytvořený nejspíš ve Windows 7, ale není to jisté. Pomocí příkazu 'unzip' byl soubor rozpakován a provedeny pokusy o nápravu diakritiku n vázvech soborů a adresářů.
Podle návodů jsem zoušel přejmenovávat pomocí 'convmv' či na prácovat s názvy pomocí 'iconv', zkoušel jsem vstupní kódovnání cp1250, windows-1250, cp852, iso-8859-2, latin2, ale nic nezabralo, diakrtika není v pořádku.
convmv -f cp852 -t UTF8 *
ls | iconv -f windows-1250 -t UTF-8
...
Evidentně něco opomíjím nebo dělám špatně, ale už jsem bezradný. Budu vděčný za radu.
Děkuji, Petr
-
zkus primo v unzipu
unzip -O 852
pripadne prvne s -t
-
Diky za nasměrování... volbu "-O 852" tu sice nemám, ale samotná volba "-O" to udělá s kódováním iso-8859-2 a pak to s 'convmv' je hračka :-)
unzip -O file.zip
convmv -f iso-8859-2 -t utf-8 *
convmv -r --notest -f iso-8859-2 -t utf-8 *
P.
-
Jinak zip/unzip by to měly umět automaticky, ale je na to potřeba knihovna rcc (librcc0).
-
u mne (Gentoo) je potreba unzip prelozit s USE="unicode natspec" coz pouzije libnatspec http://natspec.sourceforge.net/
-
Coz takle vzit krename a soubory prejmenovat zpet? V Krename se da nadefinovat substituce znaku a skupin znaku za jine. Takze i kdyz se nevi, co to bylo za kodovani a proc se to zepsulo, melo by byt mozne se tam dopracovat k normalnim jmenum.
-
myslim unzip bez toho -O to nejak uplne dodela, ze uz to ani neni v zadnem kodovani
-
Jména souborů v ZIPu byla původně pouze v ASCI, ale už dlouho je možné u každého vloženého souboru ve flagu nastavit speciální bit (general purpose bit 11) a pak se jméno tohoto souboru chápe jako UTF8 bez BOM. Bohužel Windows 8 používají tento bit. Co tam ukládají Windows do té doby fakt netuším (ale tipl bych si, že to zkoušejí v lokální kódové stránce, u nás tedy Windows 1250).
-
Bohužel Windows 8 používají tento bit.
Omlouvám se, chtěl jsem napsat: Bohužel až Windows 8 používají tento bit.