Fórum Root.cz

Hlavní témata => Software => Téma založeno: hawran diskuse 05. 02. 2013, 10:15:47

Název: Calibre a české PDF dokumenty
Přispěvatel: hawran diskuse 05. 02. 2013, 10:15:47
Zvládá calibre bez problémů převod pdf dokumentů s českým textem do (libovolného) jím podporovaného formátu e-knihy?

Zkoušel jsem převést několik takových pdf souborů a ve výsledném textu byly některé české znaky zmršené (otazníky, přeškrtnuté T a podobné hrůzy).

Když jsem pak zkusil převést pdf, vyexportované z LibreOffice, tak to bylo zkonvertované dobře.
Co je špatně?

Nastavit Preference / Conversion / Look & Feel / Input character encoding jsem zkoušel: cp1250, windows-1250, iso-8859-2.
To nepomohlo. (nehledě k tomu, že u toho exportovaného pdf jsem to nastavovat nemusel)
[bubuntu 10.04 LTS / calibre 0.6.42]

Jde mi o to, že jsem nenašel žádnou pdf čtečku, která by se na mém vychytralém telefonu (ZTE Blade) dala používat ke čtení ...
A CoolReader se používá parádně.
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: Petr Krčmář 05. 02. 2013, 11:04:23
Problém může být v samotném PDF. Ono totiž není PDF jako PDF. Třeba TeX má diakritiku vysázenou zvlášť a pak ji pozicuje. Ve skutečnosti je tedy text zapsán takhle: „Zˇlutˇoucˇky'“ a konvertory se z toho zvencnou. Pokud to s LibreOffice PDF funguje dobře, pak bych to viděl právě na problém konkrétních dokumentů, protože konverze v Calibre prokazatelně alespoň někdy funguje.
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: 3ugeene 05. 02. 2013, 12:38:00
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: hawran diskuse 06. 02. 2013, 14:21:31
Hm, tak to bude asi problém těch konkrétních pdf dokumentů.

Mohl by mi tedy někdo poradit nějakou šikovnou (lightweight) čtečku pdf souborů pro Androida? (ZTE Blade)
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: 3ugeene 06. 02. 2013, 14:26:55
ne, že by to tim mělo bejt, ale zkus to převýst na calibre na widlích

nebo  zkus třeba:

http://ebook.online-convert.com/convert-to-epub


jestli to půjde převýst online

nalevo pak máš výběr jinejch výstupních formátů...
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: 3ugeene 06. 02. 2013, 14:31:16
tak si říkám, že "převýst" je dobrý gramatický znásilnění  *facepalm*
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: VTy 06. 02. 2013, 15:43:14
Jak psal výše Petr Krčmář, problém bude asi v tom vstupním pdf souboru.
Zkusil bych ho projet např. utilitou pdftottext co z toho vypadne.
Co se týče čteček pdf na Android můžete zkusit např. Aldiko, ale IMHO
to na malém telefonu je nouzovka na prohlédnutí pár stránek,
ale není to na čtení knihy.

P.S.
Ten zmršený vstup není jen problém Texu, ale např. pdf faktury od
Vodafone jsou taktéž "nepřeveditelné" do textu
(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: rozumbrada 06. 02. 2013, 15:48:47
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...
To se dá řešit heuristickým zpracováním. V detailech konverze je záložka heuristické zpracování a tam zatrhni umožnit heuristické zpracování. Pak to převádí odstavce podstatně lépe (skoro dokonale).
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: 3ugeene 06. 02. 2013, 15:57:45
po nastaveni kodovani na cp1250 mi prevedlo calibre vzdy vsechno bez problemu, ale u pdf-ek mi prevod vzdycky rozhnaca odstavce...
To se dá řešit heuristickým zpracováním. V detailech konverze je záložka heuristické zpracování a tam zatrhni umožnit heuristické zpracování. Pak to převádí odstavce podstatně lépe (skoro dokonale).


na to se urcite podivam, diky. Ja si myslel, ze tam urcite nekde bude nejaky nastaveni, ale fakt jsem to neplanoval zkouset :D
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: 3ugeene 06. 02. 2013, 16:03:45
mnojo, fakt to vypada o dost lip! :D  Sice to je obcas nekde rozhazeny, ale je to o dost lepsi... Diky
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: hawran diskuse 06. 02. 2013, 16:13:13
Jak psal výše Petr Krčmář, problém bude asi v tom vstupním pdf souboru.
Zkusil bych ho projet např. utilitou pdftottext co z toho vypadne.
Co se týče čteček pdf na Android můžete zkusit např. Aldiko, ale IMHO
to na malém telefonu je nouzovka na prohlédnutí pár stránek,
ale není to na čtení knihy.

P.S.
Ten zmršený vstup není jen problém Texu, ale např. pdf faktury od
Vodafone jsou taktéž "nepřeveditelné" do textu
Aldiko jsem kdysi zkoušel, ale z nějakého důvodu jsem to odinstaloval.
Asi tomu zkusím dát ještě šanci...


(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).
JJ, jsem si kvůli tomu doinstaloval Okular, v něm je to hledání dokonce i lépe nastavitelnější ...
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: VTy 06. 02. 2013, 16:49:24
....

(navíc v Evince v nich ani nelze vyhledat řetězec, zato v Adobe Readeru ano).
JJ, jsem si kvůli tomu doinstaloval Okular, v něm je to hledání dokonce i lépe nastavitelnější ...

D9ky za tip, zkusil jsem, ale jelikož je to založeno také na poppler knihovně, tak smůla  :(
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: nasson 06. 02. 2013, 17:44:32
Kdyz tak mluvite o tom Okular. Da se tam nejak nastavit, aby pri hledani zvyraznil vsechna hledana slova? Evince to umi, ale u Okularu jsem to pred nedavnem nenasel a tak jsem ho prestal pouzivat.
Název: Re:Calibre a české PDF dokumenty
Přispěvatel: hawran diskuse 07. 02. 2013, 08:57:00
Kdyz tak mluvite o tom Okular. Da se tam nejak nastavit, aby pri hledani zvyraznil vsechna hledana slova? Evince to umi, ale u Okularu jsem to pred nedavnem nenasel a tak jsem ho prestal pouzivat.

Pokud je tím míněno to, že se na stránce zvýrazní všechny výskyty hledané fráze, tak to tam bohužel není (alespoň já to tam nemám, ver: Qt: 4.6.2, KDE Development Platform: 4.4.5 (KDE 4.4.5), Okular: 0.10.5).
A uznávám, že to je užitečná fíčura, člověk dostane na první pohled hrubý přehled ...

Inu, oupensórs.
Milion šest aplikací na jednu věc a každá umí dobře něco jiného ...