O neco takoveho jsem se pokousel v mini verzi pro interni pouziti, tak par rad od amatera.
0) EDI neni jen EDIFACT (
https://www.edi-plus.com/resources/message-formats/edifact/ ), byt tyto messages se snad jako jedine pro EDI skutecne v realnem svete pouzivaji. Mame tu UBL a z nej odvozeny cesky ISDOC. Neznam nikoho kdo by to poradne pouzival (protoze to bylo jednoduche, prikladame ISDOC do nasich PDF primo jako attachment v tom PDFku, takze se da rozkliknout). Od dodavatelu jsem videl ISDOC snad jen u subreg.cz ...
1) z obecnych faktur spolehlive vytahnout nic nejde a ucetnictvi bych na tom nezakladal; takovou informaci lze myslim pouzit jen pro overeni zadanych udaju, nebo jejich predvyplneni.
2) PDF se prevede na text, aby to odpovidalo rozlozeni na strance, tzn. resi se radkovani (sesortuji se vsechny texty pres obe osy). Algoritmus ktery jsem zkousel je primitivni - v PDF lze identifikovat obvykle ceske IC, jakekoliv DIC/VAT#, ruzna data (vyst, duzp,... ) a ruzne castky. Z castek lze u jednoduchych faktur urcit ktera je total, kde je danovy zaklad a dan.
3) Existuje jeste QR faktura a QR platba, malokdo to pouziva, obcas se objevi - jenze v PDF je implementovana obcas jako skalovany obrazek, obcas jako sada postscript prikazu, to se myslim ani nevyplati resit.
4) data z bodu 2) jde ale efektivne pouzit k vyznaceni rucne zadanych hodnot, ktere program najde v PDF, to je primitivni vec a urychli to kontrolu zadanych udaju.
PS: Muj znamy dela
http://www.qinve.com/en/