Calibre a české PDF dokumenty

Calibre a české PDF dokumenty
« kdy: 05. 02. 2013, 10:15:47 »
Zvládá calibre bez problémů převod pdf dokumentů s českým textem do (libovolného) jím podporovaného formátu e-knihy?

Zkoušel jsem převést několik takových pdf souborů a ve výsledném textu byly některé české znaky zmršené (otazníky, přeškrtnuté T a podobné hrůzy).

Když jsem pak zkusil převést pdf, vyexportované z LibreOffice, tak to bylo zkonvertované dobře.
Co je špatně?

Nastavit Preference / Conversion / Look & Feel / Input character encoding jsem zkoušel: cp1250, windows-1250, iso-8859-2.
To nepomohlo. (nehledě k tomu, že u toho exportovaného pdf jsem to nastavovat nemusel)
[bubuntu 10.04 LTS / calibre 0.6.42]

Jde mi o to, že jsem nenašel žádnou pdf čtečku, která by se na mém vychytralém telefonu (ZTE Blade) dala používat ke čtení ...
A CoolReader se používá parádně.
« Poslední změna: 05. 02. 2013, 11:02:16 od Petr Krčmář »


Re:Calibre a české PDF dokumenty
« Odpověď #1 kdy: 05. 02. 2013, 11:04:23 »
Problém může být v samotném PDF. Ono totiž není PDF jako PDF. Třeba TeX má diakritiku vysázenou zvlášť a pak ji pozicuje. Ve skutečnosti je tedy text zapsán takhle: „Zˇlutˇoucˇky'“ a konvertory se z toho zvencnou. Pokud to s LibreOffice PDF funguje dobře, pak bych to viděl právě na problém konkrétních dokumentů, protože konverze v Calibre prokazatelně alespoň někdy funguje.

3ugeene

Re:Calibre a české PDF dokumenty
« Odpověď #2 kdy: 05. 02. 2013, 12:38:00 »
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...

Re:Calibre a české PDF dokumenty
« Odpověď #3 kdy: 06. 02. 2013, 14:21:31 »
Hm, tak to bude asi problém těch konkrétních pdf dokumentů.

Mohl by mi tedy někdo poradit nějakou šikovnou (lightweight) čtečku pdf souborů pro Androida? (ZTE Blade)

3ugeene

Re:Calibre a české PDF dokumenty
« Odpověď #4 kdy: 06. 02. 2013, 14:26:55 »
ne, že by to tim mělo bejt, ale zkus to převýst na calibre na widlích

nebo  zkus třeba:

http://ebook.online-convert.com/convert-to-epub


jestli to půjde převýst online

nalevo pak máš výběr jinejch výstupních formátů...


3ugeene

Re:Calibre a české PDF dokumenty
« Odpověď #5 kdy: 06. 02. 2013, 14:31:16 »
tak si říkám, že "převýst" je dobrý gramatický znásilnění  *facepalm*

VTy

Re:Calibre a české PDF dokumenty
« Odpověď #6 kdy: 06. 02. 2013, 15:43:14 »
Jak psal výše Petr Krčmář, problém bude asi v tom vstupním pdf souboru.
Zkusil bych ho projet např. utilitou pdftottext co z toho vypadne.
Co se týče čteček pdf na Android můžete zkusit např. Aldiko, ale IMHO
to na malém telefonu je nouzovka na prohlédnutí pár stránek,
ale není to na čtení knihy.

P.S.
Ten zmršený vstup není jen problém Texu, ale např. pdf faktury od
Vodafone jsou taktéž "nepřeveditelné" do textu
(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).

rozumbrada

Re:Calibre a české PDF dokumenty
« Odpověď #7 kdy: 06. 02. 2013, 15:48:47 »
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...
To se dá řešit heuristickým zpracováním. V detailech konverze je záložka heuristické zpracování a tam zatrhni umožnit heuristické zpracování. Pak to převádí odstavce podstatně lépe (skoro dokonale).

3ugeene

Re:Calibre a české PDF dokumenty
« Odpověď #8 kdy: 06. 02. 2013, 15:57:45 »
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...
To se dá řešit heuristickým zpracováním. V detailech konverze je záložka heuristické zpracování a tam zatrhni umožnit heuristické zpracování. Pak to převádí odstavce podstatně lépe (skoro dokonale).


na to se urcite podivam, diky. Ja si myslel, ze tam urcite nekde bude nejaky nastaveni, ale fakt jsem to neplanoval zkouset :D

3ugeene

Re:Calibre a české PDF dokumenty
« Odpověď #9 kdy: 06. 02. 2013, 16:03:45 »
mnojo, fakt to vypada o dost lip! :D  Sice to je obcas nekde rozhazeny, ale je to o dost lepsi... Diky

Re:Calibre a české PDF dokumenty
« Odpověď #10 kdy: 06. 02. 2013, 16:13:13 »
Jak psal výše Petr Krčmář, problém bude asi v tom vstupním pdf souboru.
Zkusil bych ho projet např. utilitou pdftottext co z toho vypadne.
Co se týče čteček pdf na Android můžete zkusit např. Aldiko, ale IMHO
to na malém telefonu je nouzovka na prohlédnutí pár stránek,
ale není to na čtení knihy.

P.S.
Ten zmršený vstup není jen problém Texu, ale např. pdf faktury od
Vodafone jsou taktéž "nepřeveditelné" do textu
Aldiko jsem kdysi zkoušel, ale z nějakého důvodu jsem to odinstaloval.
Asi tomu zkusím dát ještě šanci...


(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).
JJ, jsem si kvůli tomu doinstaloval Okular, v něm je to hledání dokonce i lépe nastavitelnější ...

VTy

Re:Calibre a české PDF dokumenty
« Odpověď #11 kdy: 06. 02. 2013, 16:49:24 »
....

(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).
JJ, jsem si kvůli tomu doinstaloval Okular, v něm je to hledání dokonce i lépe nastavitelnější ...

D9ky za tip, zkusil jsem, ale jelikož je to založeno také na poppler knihovně, tak smůla  :(

nasson

Re:Calibre a české PDF dokumenty
« Odpověď #12 kdy: 06. 02. 2013, 17:44:32 »
Kdyz tak mluvite o tom Okular. Da se tam nejak nastavit, aby pri hledani zvyraznil vsechna hledana slova? Evince to umi, ale u Okularu jsem to pred nedavnem nenasel a tak jsem ho prestal pouzivat.

Re:Calibre a české PDF dokumenty
« Odpověď #13 kdy: 07. 02. 2013, 08:57:00 »
Kdyz tak mluvite o tom Okular. Da se tam nejak nastavit, aby pri hledani zvyraznil vsechna hledana slova? Evince to umi, ale u Okularu jsem to pred nedavnem nenasel a tak jsem ho prestal pouzivat.

Pokud je tím míněno to, že se na stránce zvýrazní všechny výskyty hledané fráze, tak to tam bohužel není (alespoň já to tam nemám, ver: Qt: 4.6.2, KDE Development Platform: 4.4.5 (KDE 4.4.5), Okular: 0.10.5).
A uznávám, že to je užitečná fíčura, člověk dostane na první pohled hrubý přehled ...

Inu, oupensórs.
Milion šest aplikací na jednu věc a každá umí dobře něco jiného ...