1
Software / Re:Porovnání textu
« kdy: 04. 11. 2019, 13:19:57 »
Jenda:jo tohle vypada mnohem lip nez ta ptakovina odemne

Tato sekce Vám umožňuje zobrazit všechny příspěvky tohoto uživatele. Prosím uvědomte si, že můžete vidět příspěvky pouze z oblastí Vám přístupných.
"$(<apostrov.txt)"Ježišikriste. Uvozovky se normálně escapují pomocí \".
Ale vlastně jo, oceňuji kreativitu. Moje programování věcí kterým nerozumím asi občas působí podobně :-)
Vkládá text $(<apostrov.txt) pomocí echa do texťáku, nebo to tam chce vkládat i s uvozovkami ? Asi s nimi. Asi si to zkusím, jestli budu taky tak kreativní, tohle nemůže fungovat v žádným vesmíru. Jaký shell vlastně používá ?
ahoj jak dostanu text z clipboardu do dalsiho prikazu mezi uvozovky :/
nikde sem v agrep nenašel možnost číst ze souboru
Myslím, že agrep načte ze souboru přeměrováním:Kód: [Vybrat]agrep parametry... < soubor.txt
Mezi uvozovky načtete takto:Kód: [Vybrat]agrep "$(tesseract parametry...)" gtafull.txt
neboKód: [Vybrat]agrep `tesseract parametry...` gtafull.txt
ahoj jak dostanu text z clipboardu do dalsiho prikazu mezi uvozovky :/
nikde sem v agrep nenašel možnost číst ze souboru
Vygoogli si “ windows cmd quick edit mode”
Pak ti pujde v cmd terminalu oznacit mysi, dat enter pro kopirovani a vluzit pomoci praveho tlacitka mysi.
https://www.isunshare.com/windows-8/quick-edit-mode-in-command-prompt-how-to-open-it.html
ahoj verzi 4 sem zatim ani nezkoušel, zatím nemá GUI nástavby nebo trainery...jen pro zajimavost jak slozity by bylo vytahnout tento text?Tak jak jsi ho dodal tak se to skoro nechytlo, ale když z toho ten text jednoduše vyextrahuju (vyberu bílou s thresholdem 73, odečtu oblasti které se dotýkají okraje, zbylý výběr začerním, všechno ostatní smažu), tak dostanu obrázek viz příloha a z něj anglický Tesseract 4 z Debianu unstable dá „Valve allows the life inside the other gives birth... struck ablaze by godly plug igniter! Revolution about revolution rejoice! *,“ což je správný výsledek až na ten bordel na konci. Přičemž tahle extrakce byla nastřelená a triviální, určitě by šlo vymyslet něco lepšího, co bude brát v úvahu že písmenka jsou světlá s tmavým okrajem.
Myslím že celý proces je dobre popísaný v dokumentácii https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.03%E2%80%933.05