Mam celou radku nafocenych knizek tou metodou, ze vezmu fotoaparat (cca 5-10Mpx) a za dobrych svetelnych podminek nafotim vsechny stranky knihy, tzn. typicky obrazek:
- obsahuje levou a pravou stranu
- kniha je pridrzovana vetsinou rukou, takze tam je par prstu, listy jsou deformovane (kniha neni rovna jako na scanneru)
- okolo knihy je vetsinou nejake pozadi, treba stul, apod.
- fotky nejsou zdaleka 100% stejne, delam to vse "v ruce", tzn. umisteni stranek ruzne lita
Krome vyse uvedeneho mam i cizi scanovane knizky, ktere maji vetsinou podmnozinu vad vyse uvedeneho.
Rad bych takto vznikle fotky nejak automatizovane upravil, zejmena lokalizoval predel stranek, chytre orezal, aby z toho slo udelat (automatizovane) PDFko pro cteni na tabletu. Kdyz uz mam stranku, tak ji rovnou "zarovnat" (odstranit deformaci vzniklou zatocenim papiru u vazby). Dale bych rad obrazky prevedl na black&white, aby byly rozumne velike a ostrejsi. Rucne tyto operace treba v gimpu nebo ImgMagickem umim udelat, ale znamena to si pohrat s "nastavenim".
U detekce umisteni stranek je problem v tom, ze mnoho knizek nema ciste okraje (ruzne napisy, cislovani stran, graficke prvky, atd.) a jak rucne fotim knizku, tak i okoli za knihou neni jednotne. Napadlo me zvolit dva body kde urcite stranka je a od nich zacit pocitat nejakou fci (napr. distribuce odstinu sede, apod.), cimz bych mohl nejak najit kde pravdepodobne stranka konci.
Srovnani deformovaneho papiru do kolmic by slo udelat definici dvou (ctyr) deformacnich krivek a nejakou fci na vyhodnoceni "kolmosti" objektu hledat maximum takove fce pres celou stranku.
Prevod na B&W nejde delat nalezenim thresholdu, ale nejak chytreji pro ruzne oblasti. U textovych stranek by slo vyhodnocovat sed' tak, aby nezanikla zadna pismenka, u obrazku to bude asi o dost slozitejsi. Poduloha je jak najit textove oblasti.
Pokud nekdo mate nejake tipy k jednotlivym bodum, budu rad za jakekoliv komentare tykajici se algoritmu. Dekuji!