Diakritika v názvech souborů po unzipu

Petr V.

Diakritika v názvech souborů po unzipu
« kdy: 15. 12. 2015, 08:12:02 »
Dobrý den,
prosím o radu. Mám ZIP soubor vytvořený nejspíš ve Windows 7, ale není to jisté. Pomocí příkazu 'unzip' byl soubor rozpakován a provedeny pokusy o nápravu diakritiku n vázvech soborů a adresářů.
Podle návodů jsem zoušel přejmenovávat pomocí 'convmv' či na prácovat s názvy pomocí 'iconv',  zkoušel jsem vstupní kódovnání cp1250, windows-1250, cp852, iso-8859-2, latin2, ale nic nezabralo, diakrtika není v pořádku.

convmv -f cp852 -t UTF8 *
ls | iconv -f windows-1250 -t UTF-8
...

Evidentně něco opomíjím nebo dělám špatně, ale už jsem bezradný. Budu vděčný za radu.
Děkuji, Petr


trubicoid2

Re:Diakritika v názvech souborů po unzipu
« Odpověď #1 kdy: 15. 12. 2015, 08:54:50 »
zkus primo v unzipu
Kód: [Vybrat]
unzip -O 852pripadne prvne s -t

Petr V.

Re:Diakritika v názvech souborů po unzipu
« Odpověď #2 kdy: 15. 12. 2015, 09:30:42 »
Diky za nasměrování... volbu "-O 852" tu sice nemám, ale samotná volba "-O" to udělá s kódováním iso-8859-2 a pak to s 'convmv' je hračka :-)

unzip -O file.zip
convmv -f iso-8859-2 -t utf-8 *
convmv -r --notest -f iso-8859-2 -t utf-8 *

P.

reb

Re:Diakritika v názvech souborů po unzipu
« Odpověď #3 kdy: 15. 12. 2015, 09:48:32 »
Jinak zip/unzip by to měly umět automaticky, ale je na to potřeba knihovna rcc (librcc0).

trubicoid2

Re:Diakritika v názvech souborů po unzipu
« Odpověď #4 kdy: 15. 12. 2015, 09:56:25 »
u mne (Gentoo) je potreba unzip prelozit s USE="unicode natspec" coz pouzije libnatspec http://natspec.sourceforge.net/


JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:Diakritika v názvech souborů po unzipu
« Odpověď #5 kdy: 15. 12. 2015, 12:13:13 »
Coz takle vzit krename a soubory prejmenovat zpet? V Krename se da nadefinovat substituce znaku a skupin znaku za jine. Takze i kdyz se nevi, co to bylo za kodovani a proc se to zepsulo, melo by byt mozne se tam dopracovat k normalnim jmenum.

trubicoid2

Re:Diakritika v názvech souborů po unzipu
« Odpověď #6 kdy: 15. 12. 2015, 14:01:07 »
myslim unzip bez toho -O to nejak uplne dodela, ze uz to ani neni v zadnem kodovani

x14

  • ***
  • 182
    • Zobrazit profil
    • E-mail
Re:Diakritika v názvech souborů po unzipu
« Odpověď #7 kdy: 15. 12. 2015, 14:24:41 »
Jména souborů v ZIPu byla původně pouze v ASCI, ale už dlouho je možné u každého vloženého souboru ve flagu nastavit speciální bit (general purpose bit 11) a pak se jméno tohoto souboru chápe jako UTF8 bez BOM. Bohužel Windows 8 používají tento bit. Co tam ukládají Windows do té doby fakt netuším (ale tipl bych si, že to zkoušejí v lokální kódové stránce, u nás tedy Windows 1250).

x14

  • ***
  • 182
    • Zobrazit profil
    • E-mail
Re:Diakritika v názvech souborů po unzipu
« Odpověď #8 kdy: 15. 12. 2015, 15:38:14 »
Bohužel Windows 8 používají tento bit.
Omlouvám se, chtěl jsem napsat: Bohužel Windows 8 používají tento bit.