Fórum Root.cz
Hlavní témata => Software => Téma založeno: y, 11. 01. 2018, 01:42:28
-
Pro jeden svuj soukromy projekt (neco ve stylu relativne sofistikovaneho webscraperu) bych potreboval poradit nejaky headless browser volatelny z pythonu, ktery integruje javascript (neni nutno, aby byl javascript volatelny z pythonu, jen musi vykonat skripty na strance) a umi potom poskytnout DOM stranky. Nasel jsem selenium a splinter, ale rad si necham poradit -- idealni by bylo, kdyby se to hlasilo jako nejaky bezny browser, ale na druhou stranu to musi bezet v detached terminalu na serveru bez X knihoven a nebo aspon bez existujiciho X spojeni k serveru na jinem pocitaci.
-
https://hub.docker.com/u/selenium/
-
Na tohle používám již zmiňované selenium a nebo pak ještě PhantomJS
-
Na tohle používám již zmiňované selenium a nebo pak ještě PhantomJS
Sorry musím se opravit, ze selenia volám PhantomJS
-
Na vyse uvedem odkazu je jak samotne Selenium tak i prohlizece - FF, Chrome i ten PhantomJS. Vyhoda FF/chrome je, ze testovany server nedokaze rozlisit od cloveka(nebo aspon ja neznam zadnou takovou techniku). Vyhoda PhantomJS je vykon.
-
Selenium není headless browser, je to sjednocující platforma.
Na této stránce (https://github.com/dhamaniasad/HeadlessBrowsers) je poměrně detailní přehled. Já osobně Selenium nepoužívám a skriptuji přes různé knihovny. Zatím jsem převážně používal PhantomJS, ale teď se chystám na Chrome/Chromium.
-
https://en.wikipedia.org/wiki/Xvfb
-
Díky všem
-
https://developers.google.com/web/updates/2017/04/headless-chrome