Zdar,Hledám příkaz do terminálu v ubuntu který vypíše formáty u txt souborů...To znamená vyhledá soubory txt ve složce a napíše jestli se jendá o ("CP1250" "UTF-8" "CP852" "CP859" "ISO 8859-2")
KIT: si poslal první slovo co si našel na google ne ?Doufám že odpoví někdo rozumnej...
Ja som to riešil asi pred pol rokom a vzdal som to. Skúšal som rôzne spôsoby. Mal som pár súborov v nejakých encodingoch a výsledok bol fakt zlý. Myslím, že cp1250 bol najväčší problém. Možno závisí od konkrétnych súborov, čo a koľko obsahujú...
$ enca --list languagesbelarussian: CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855 KOI8-U bulgarian: CP1251 ISO-8859-5 IBM855 maccyr ECMA-113 czech: ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK estonian: ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce baltic croatian: CP1250 ISO-8859-2 IBM852 macce CORK hungarian: ISO-8859-2 CP1250 IBM852 macce CORK lithuanian: CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic latvian: CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic polish: ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltic CORK russian: KOI8-R CP1251 ISO-8859-5 IBM866 maccyr slovak: CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK slovene: ISO-8859-2 CP1250 IBM852 macce CORK ukrainian: CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr chinese: GBK BIG5 HZ none:
pavel@probook ~ $ file text.txt text.txt: UTF-8 Unicode textpavel@probook ~ $ file text-latin2.txt text-latin2.txt: ISO-8859 textpavel@probook ~ $ file text-1250.txt text-1250.txt: Non-ISO extended-ASCII text
pavel@probook ~ $ enca text.txt Universal transformation format 8 bits; UTF-8pavel@probook ~ $ enca text-latin2.txt ISO 8859-2 standard; ISO Latin 2pavel@probook ~ $ enca text-1250.txt MS-Windows code page 1250 LF line terminators