Fórum Root.cz
Hlavní témata => Software => Téma založeno: David 03. 05. 2021, 09:38:27
-
Ahoj, doporučili byste mi prosím nějakou knihovnu, která by uměla řešit captchu na EET portálu? https://adiseet.mfcr.cz/adistc/adis/idpr_pub/auth/LoginPage.faces Jde myslím o docela jednoduchou captchu, ale asi je potřeba mít natrénovaný nějaký model, a to se mi nedaří najít. Děkuji.
-
Cely smysl Captcha je zabranit tomu, aby to slo projit automaticky. Pokud ma nekdo vytvaret knihovnu na konkretni implementaci captcha, musi to stat za to. Tzn je dost pravdepodobne, ze konkretni knihovna na konkretni system, ktery navic zajima jen par (mozna) stovek tisic lidi z CR (pravdepodobne mene, ale netusim) nejspis neexistuje. Pokud potrebujete strojove pristupovat k temto systemum, ocekaval bych, ze bude jina (oficialni) cesta. Treba prihlaseni certifikatem.
Vytrenovat model znamena, ze nekdo si musi sednout, stahnout tisice a tisice prikladu te captcha a rict tomu modelu, tohle je XYZ, takze tam, kde je mala poptavka, je ta sance temer nulova. Navic, jakmile se neco takoveho objevi a zacne se o tom mluvit, ocekaval bych, ze provozovatel zmeni implementaci captcha tak, aby ten model prestal fungovat. Protoze proc ji tam jinak mit...
-
Souhlasím. Ulozto, na které captcha solver existuje, asi určitě zajímá víc lidí než přihlašování do portálu EET:) Bohužel jiná cesta, jak se k datům dostat, není. Je to nepochopitelné, proč ministerstvo neudělalo také API. Dělat něco ručně je strašné. Každopádně děkuji.
-
EET je pozastavená a jak to tak vypadá, tak už k obnově této Burešovské kktiny nedojde, takže bych ani neřešil cokoliv s ní spojené.
-
Kdysi se mi povedlo prolomit tuhle captcha
https://ifc.emlines.com/dpmhk/
jen pomocí modifikace tohodle
https://scikit-learn.org/stable/auto_examples/classification/plot_digits_classification.html
příkladu. Plus nějaký preprocessing obrázku.
Není to tam těžké jak se zdá. Alespoň v mém případě, kdy nebyl problém vygenerovat dataset.
Code je uint a vrací ten samý text, jen jinak "zprasený" ;D
https://ifc.emlines.com/dpmhk/Controls/HumanFilterImageGenerator.aspx?Code=1968550852
-
Něco bych měl, ale pod pár tisíc Euro se nedostaneš.
Kolik jsi do toho ochoten dát? A nabídni rovnou hodně!
Pro menší množství doporučuju Indy: https://www.root.cz/clanky/potrebujete-obejit-captcha-zaplatte-si-armadu-indu/
Ti Indové jsou naprosto v poho, ale od určitého objemu ... tě vyjde levněji to, co mám já.
-
Otevřel jsem to v GIMPu, vybral červenou s thresholdem 70.6 (náhodné kliknutí), a pustil jsem na to
tesseract --oem 1 -l ces --dpi 800 image.png /tmp/ocr
a vyřešilo se to. Tesseract je z Debianu Unstable, pozor že verze 3 byla podstatně horší než aktuální 4.
PanVP tu už poněkolikáté nabízí řešení triviálních problémů za nesmyslné částky. To tady nikdy nefungovalo, ale přeju mu, aby se mu to ve skutečném životě dařilo.
Edit: na další pokus jsem dostal víc zdeformovanou. Takže buď zkoušet až dostaneš míň deformovanou, nebo na to pustit to, co se používá na řešení MNISTu.