Nástroj pro řešení captcha na portálu EET

David

  • ***
  • 143
    • Zobrazit profil
Nástroj pro řešení captcha na portálu EET
« kdy: 03. 05. 2021, 09:38:27 »
Ahoj, doporučili byste mi prosím nějakou knihovnu, která by uměla řešit captchu na EET portálu? https://adiseet.mfcr.cz/adistc/adis/idpr_pub/auth/LoginPage.faces Jde myslím o docela jednoduchou captchu, ale asi je potřeba mít natrénovaný nějaký model, a to se mi nedaří najít. Děkuji.
« Poslední změna: 03. 05. 2021, 09:50:25 od Petr Krčmář »


none_

Re:EET captcha solver
« Odpověď #1 kdy: 03. 05. 2021, 09:56:01 »
Cely smysl Captcha je zabranit tomu, aby to slo projit automaticky. Pokud ma nekdo vytvaret knihovnu na konkretni implementaci captcha, musi to stat za to. Tzn je dost pravdepodobne, ze konkretni knihovna na konkretni system, ktery navic zajima jen par (mozna) stovek tisic lidi z CR (pravdepodobne mene, ale netusim) nejspis neexistuje. Pokud potrebujete strojove pristupovat k temto systemum, ocekaval bych, ze bude jina (oficialni) cesta. Treba prihlaseni certifikatem.

Vytrenovat model znamena, ze nekdo si musi sednout, stahnout tisice a tisice prikladu te captcha a rict tomu modelu, tohle je XYZ, takze tam, kde je mala poptavka, je ta sance temer nulova. Navic, jakmile se neco takoveho objevi a zacne se o tom mluvit, ocekaval bych, ze provozovatel zmeni implementaci captcha tak, aby ten model prestal fungovat. Protoze proc ji tam jinak mit...

David

  • ***
  • 143
    • Zobrazit profil
Re:Nástroj pro řešení captcha na portálu EET
« Odpověď #2 kdy: 03. 05. 2021, 10:17:58 »
Souhlasím. Ulozto, na které captcha solver existuje, asi určitě zajímá víc lidí než přihlašování do portálu EET:) Bohužel jiná cesta, jak se k datům dostat, není. Je to nepochopitelné, proč ministerstvo neudělalo také API. Dělat něco ručně je strašné. Každopádně děkuji.

Re:Nástroj pro řešení captcha na portálu EET
« Odpověď #3 kdy: 03. 05. 2021, 11:08:10 »
EET je pozastavená a jak to tak vypadá, tak už k obnově této Burešovské kktiny nedojde, takže bych ani neřešil cokoliv s ní spojené.

Re:Nástroj pro řešení captcha na portálu EET
« Odpověď #4 kdy: 03. 05. 2021, 11:20:39 »
Kdysi se mi povedlo prolomit tuhle captcha
https://ifc.emlines.com/dpmhk/
jen pomocí modifikace tohodle
https://scikit-learn.org/stable/auto_examples/classification/plot_digits_classification.html
příkladu. Plus nějaký preprocessing obrázku.
Není to tam těžké jak se zdá. Alespoň v mém případě, kdy nebyl problém vygenerovat dataset.
Code je uint a vrací ten samý text, jen jinak "zprasený" ;D
https://ifc.emlines.com/dpmhk/Controls/HumanFilterImageGenerator.aspx?Code=1968550852


PanVP

Re:Nástroj pro řešení captcha na portálu EET
« Odpověď #5 kdy: 03. 05. 2021, 18:38:19 »
Něco bych měl, ale pod pár tisíc Euro se nedostaneš.
Kolik jsi do toho ochoten dát? A nabídni rovnou hodně!

Pro menší množství doporučuju Indy: https://www.root.cz/clanky/potrebujete-obejit-captcha-zaplatte-si-armadu-indu/

Ti Indové jsou naprosto v poho, ale od určitého objemu ... tě vyjde levněji to, co mám já.

_Jenda

  • *****
  • 1 550
    • Zobrazit profil
    • https://jenda.hrach.eu/
    • E-mail
Re:Nástroj pro řešení captcha na portálu EET
« Odpověď #6 kdy: 03. 05. 2021, 21:13:45 »
Otevřel jsem to v GIMPu, vybral červenou s thresholdem 70.6 (náhodné kliknutí), a pustil jsem na to
Kód: [Vybrat]
tesseract --oem 1 -l ces --dpi 800 image.png /tmp/ocra vyřešilo se to. Tesseract je z Debianu Unstable, pozor že verze 3 byla podstatně horší než aktuální 4.

PanVP tu už poněkolikáté nabízí řešení triviálních problémů za nesmyslné částky. To tady nikdy nefungovalo, ale přeju mu, aby se mu to ve skutečném životě dařilo.

Edit: na další pokus jsem dostal víc zdeformovanou. Takže buď zkoušet až dostaneš míň deformovanou, nebo na to pustit to, co se používá na řešení MNISTu.
« Poslední změna: 03. 05. 2021, 21:20:20 od _Jenda »