Fórum Root.cz
Hlavní témata => Software => Téma založeno: knihomol 08. 07. 2017, 19:02:24
-
Mam celou radku nafocenych knizek tou metodou, ze vezmu fotoaparat (cca 5-10Mpx) a za dobrych svetelnych podminek nafotim vsechny stranky knihy, tzn. typicky obrazek:
- obsahuje levou a pravou stranu
- kniha je pridrzovana vetsinou rukou, takze tam je par prstu, listy jsou deformovane (kniha neni rovna jako na scanneru)
- okolo knihy je vetsinou nejake pozadi, treba stul, apod.
- fotky nejsou zdaleka 100% stejne, delam to vse "v ruce", tzn. umisteni stranek ruzne lita
Krome vyse uvedeneho mam i cizi scanovane knizky, ktere maji vetsinou podmnozinu vad vyse uvedeneho.
Rad bych takto vznikle fotky nejak automatizovane upravil, zejmena lokalizoval predel stranek, chytre orezal, aby z toho slo udelat (automatizovane) PDFko pro cteni na tabletu. Kdyz uz mam stranku, tak ji rovnou "zarovnat" (odstranit deformaci vzniklou zatocenim papiru u vazby). Dale bych rad obrazky prevedl na black&white, aby byly rozumne velike a ostrejsi. Rucne tyto operace treba v gimpu nebo ImgMagickem umim udelat, ale znamena to si pohrat s "nastavenim".
U detekce umisteni stranek je problem v tom, ze mnoho knizek nema ciste okraje (ruzne napisy, cislovani stran, graficke prvky, atd.) a jak rucne fotim knizku, tak i okoli za knihou neni jednotne. Napadlo me zvolit dva body kde urcite stranka je a od nich zacit pocitat nejakou fci (napr. distribuce odstinu sede, apod.), cimz bych mohl nejak najit kde pravdepodobne stranka konci.
Srovnani deformovaneho papiru do kolmic by slo udelat definici dvou (ctyr) deformacnich krivek a nejakou fci na vyhodnoceni "kolmosti" objektu hledat maximum takove fce pres celou stranku.
Prevod na B&W nejde delat nalezenim thresholdu, ale nejak chytreji pro ruzne oblasti. U textovych stranek by slo vyhodnocovat sed' tak, aby nezanikla zadna pismenka, u obrazku to bude asi o dost slozitejsi. Poduloha je jak najit textove oblasti.
Pokud nekdo mate nejake tipy k jednotlivym bodum, budu rad za jakekoliv komentare tykajici se algoritmu. Dekuji!
-
https://ask.slashdot.org/story/09/09/27/199251/software-to-flatten-a-photographed-book (https://ask.slashdot.org/story/09/09/27/199251/software-to-flatten-a-photographed-book)
https://graphicdesign.stackexchange.com/questions/30948/best-way-to-flatten-a-curled-photographed-book-photograph (https://graphicdesign.stackexchange.com/questions/30948/best-way-to-flatten-a-curled-photographed-book-photograph)
https://www.google.cz/search?q=flatten+photographed+book (https://www.google.cz/search?q=flatten+photographed+book)
(tldr)
-
Co zkusit aplikaci k tomu urcenou: Scantailor
-
Solidně to umí ocropus, ale je s tím trochu laborování.
https://github.com/tmbdev/ocropy
-
Scantailor funguje docela solidne, diky za tip.
Rozpoznani deleni leva/prava je temer dokonale
Nalezeni uhlu stranky je fajn pokud je jedina deformace uhel, ale ona to je krivka (stranku pridrzuji rukou). I pres to to neco umi opravit. Nektere stranky bohuzel uplne znecitelni, takze pustit to jen tak nejde, clovek musi vse prolistovat a opravit.
Detekce obsahu funguje dobre na text, obrazky to vynechava... taktez cisla stranek orizne, obcas nejaky ten nadpis zmizi..
Prevod na B&W je docela fajn, casti textu obcas ale znecitelni, hlavne kdyz radky utikaji po nejake vlnce :-).
Skoda, ze to nema nejaky "auto mod", u ktereho bych si na konci mohl prohlednout vysledek a jen urcit kde ma byt algoritmus jak opatrny (napr. aby byl citlivejsi na detekci obsahu, neodstranoval tak agresivne deformace, atd.).
-
Co se týče převodu na BW, tak mi vyhovuje Zoner Photo Studio™ › Filters › Dynamic Tresholding