Převod dokumentu z .docx do .pdf v řádce

Převod dokumentu z .docx do .pdf v řádce
« kdy: 25. 09. 2025, 11:02:30 »
dokument ve formatu docx se v MS O365 zobrazuje na 2 strankach A4,
konverze v O365 do PDF ma samozrejmne taky dve A4 stranky.

Na Debian 13 zkousim defaultni LibreOffice 25.2.3.2 520(Build:2)
libreoffice --headless --convert-to pdf --outdir pdf document.docx
a jsou to 3.

Kdyz ten samy dokument otevru v LO GUI tak ma taky 3 stranky.


Jeste jsem zkousel JODConverter
libreoffice --headless --accept="socket,port=8100;urp;"
jodconverter input-document output-document
a vysledek ma take 3 stranky A4 namisto 2 A4 v O365 :(

Da se nejak na Linuxu v CLI provest konverze docx do pdf bez toho aby to rozbilo
format ktery ten document ma a misto 2 stranek to byly 3?


Re:.docx do .pdf v Bash
« Odpověď #1 kdy: 25. 09. 2025, 11:46:46 »
Jsem zapomnel uvest detaily dokument.docx

"docProps\app.xml"

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<Properties xmlns="http://schemas.openxmlformats.org/officeDocument/2006/extended-properties" xmlns:vt="http://schemas.openxmlformats.org/officeDocument/2006/docPropsVTypes">
 <Template>Normal.dotm</Template>
 <TotalTime>14</TotalTime>
 <Pages>2</Pages>
 <Words>764</Words>
 <Characters>4361</Characters>
 <Application>Microsoft Office Word</Application>
 <DocSecurity>0</DocSecurity>
 <Lines>36</Lines>
 <Paragraphs>10</Paragraphs>
 <ScaleCrop>false</ScaleCrop>
  <HeadingPairs>
   <vt:vector size="2" baseType="variant">
    <vt:variant>
     <vt:lpstr>Title</vt:lpstr>
    </vt:variant>
    <vt:variant>
     <vt:i4>1</vt:i4>
    </vt:variant>
   </vt:vector>
  </HeadingPairs>
 <TitlesOfParts><vt:vector size="1" baseType="lpstr"><vt:lpstr></vt:lpstr></vt:vector></TitlesOfParts>
 <Company></Company>
 <LinksUpToDate>false</LinksUpToDate>
 <CharactersWithSpaces>5115</CharactersWithSpaces>
 <SharedDoc>false</SharedDoc>
 <HyperlinksChanged>false</HyperlinksChanged>
 <AppVersion>16.0000</AppVersion>
</Properties>


    16.0000 = Word 2016 ??


$ file document.docx
dokument.docx: Microsoft Word 2007+

Re:.docx do .pdf v Bash
« Odpověď #2 kdy: 25. 09. 2025, 12:14:01 »
Dokumenty od Microsoftu se tradičně rozbíjejí i mezi různými verzemi jejich editoru nebo i mezi různými počítači. A třeba CSV jim Excel importuje a exportuje v závislosti na lokalizaci (jednou čárky, jindy středníky, takže je to navzájem nekompatibilní a kdyby sis chtěl posílat CSV mezi Amerikou a ČR, tak jste v háji). Takže když ti to jen přeteklo o jednu stránku, tak to je ještě to nejmenší :-D

Kit

  • *****
  • 876
    • Zobrazit profil
    • E-mail
Re:Převod dokumentu z .docx do .pdf v řádce
« Odpověď #3 kdy: 25. 09. 2025, 12:49:04 »
Mohou být jinak nastaveny okraje, jiné náhradní (vyšší) písmo, jiný kerning, dokonce na to může mít vliv i jinak nastavená defaultní tiskárna. Jednoduché řešení není, u každého dokumentu to může být jinak. Dá se tomu předejít konzervativním nastavením v originálním dokumentu, ale obvykle je obtížné jeho autora k tomu donutit.

tecka

  • ***
  • 172
    • Zobrazit profil
    • E-mail
Re:Převod dokumentu z .docx do .pdf v řádce
« Odpověď #4 kdy: 25. 09. 2025, 19:33:05 »
Výstup z OnlyOffice bývá podle mých zkušeností mnohem bližší originálu a obsahuje řádkový konvertor x2t. Nevím, jestli to pomůže v tomto případě, ale můžeš ho zkusit.


Re:Převod dokumentu z .docx do .pdf v řádce
« Odpověď #5 kdy: 25. 09. 2025, 20:14:38 »
Nejspolehlivější (ale zdaleka ne 100%) způsob je použít nativní aplikaci pro daný formát (Microsoft Word pro docx, Libre Office pro odt). Když použijete tu samou verzi, jako autor dokumentu, je to ještě lepší (ale stále ne dokonalé). Když použijete přímo autorův počítač, je to skoro jisté :-)

Různé opensource knihovny mívají dost špatné výsledky, komerční nástroje jsou asi lepší.

Ale vždycky někdo dokáže vyrobit soubor (normálně v příslušném programu), který vám ty konvertory totálně rozbije. V korporátech snad mají na výrobu takových souborů celá oddělení.

Kit

  • *****
  • 876
    • Zobrazit profil
    • E-mail
Re:Převod dokumentu z .docx do .pdf v řádce
« Odpověď #6 kdy: 25. 09. 2025, 20:20:55 »
Ale vždycky někdo dokáže vyrobit soubor (normálně v příslušném programu), který vám ty konvertory totálně rozbije. V korporátech snad mají na výrobu takových souborů celá oddělení.

Korporát si pořídí písmo, které nikdo jiný nemá a všichni ho musí používat. Pokud je takový dokument odeslán, tak příjemce musí použít náhradní písmo, které může mít jiné proporce.

Re:Převod dokumentu z .docx do .pdf v řádce
« Odpověď #7 kdy: 25. 09. 2025, 22:30:07 »
Ale vždycky někdo dokáže vyrobit soubor (normálně v příslušném programu), který vám ty konvertory totálně rozbije. V korporátech snad mají na výrobu takových souborů celá oddělení.

Korporát si pořídí písmo, které nikdo jiný nemá a všichni ho musí používat. Pokud je takový dokument odeslán, tak příjemce musí použít náhradní písmo, které může mít jiné proporce.

Kdyby jen to. Třeba taková obří tabulka přes celý dokument, kdy se jedna buňka tabulky, ve které je samotný obsah, táhne přes několik stran. Nebo Excel, kde jsou celé odstavce textu v buňce široké 4 centimetry. Takže buňky se na výšku ani nevejdou na obrazovku. A ta tabulka má desítky řádků.

Nejhorší je, že by se to často dalo poměrně jednoduše prostředky Office řešit daleko lépe. Ale vytvoří to někdo, kdo s Wordem nebo Excelem svádí nerovný boj, a pak s tím desítky či stovky lidí zápolí několik let, protože se z toho stane pro danou věc standard.