Automatizovaná extrakce hodnoty prvku z webové stránky

Alesh

Dobrý den,
předem se omlouvám pokud je můj dotaz již někde položený, nicméně nejsem kovaný ve webových aplikacích, tak se tedy ptám (tím, že to neznám, tak je i google krátký).
Jen na úvod nejedná se o žádný úkol do práce či školy, prostě to dělám ze zájmu a byl bych rád pokud by mi zde někdo prozradil techniku, jak výsledku dosáhnout, výsledké řešení si už nastuduju sám.

Předmětem mého zájmu jsou zkrátka prvky, které nejspíš Javascript.
Potřeboval bych nějakým způsobem jednotlivé prvky webové stránky extrahovat (ideálně scriptem) do textového souboru.
Například kurzy na tipsportu (rád bych si udělal takovou statiku a hrál si s modelováním a analýzou).

Příklad:
Mám kurz na zápas (výhra domácích - neprohra domácích - remíza - neprohra hostů - výhra hostů), potřeboval bych vytáhnout tyhle jednotlivé hodnoty, uložit je do seznamu a to ideálně pro celý hrací týden.

Rovnou se omlouvám, dělám do elektroniky a webové aplikace mi jsou cizí, takže chápu, že někomu můžu přijít neskutečně stupidní, nicméně bych byl velice vděčný za nějakou věcnou radu.
Děkuji.


kug§úo


Alesh

Re:Automatizovaná extrakce hodnoty prvku z webové stránky
« Odpověď #2 kdy: 19. 05. 2017, 18:18:08 »
Děkuji

Re:Automatizovaná extrakce hodnoty prvku z webové stránky
« Odpověď #3 kdy: 20. 05. 2017, 00:08:02 »
hochu normálně řekni že chceš sledovat kurz btc tady seti nikdo smát nebude. půlka si tady ty peníze co nikdy nikdo neviděl i sama tiskne  8)  8)
8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8)
8) 8) 8)  hoši víc jak 50% těch smajlů jsou v rámci gender equality příslušníci LGBDSM minority  8) 8) 8)
8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8) 8)

Kentus

Re:Automatizovaná extrakce hodnoty prvku z webové stránky
« Odpověď #4 kdy: 20. 05. 2017, 03:15:23 »
Základ je prohlídnout si ve vývojářském prostředí prohlížeče (pro Chrome Ctrl+Shift+J nebo F12) tu danou stránku a zjistit, jak se data na stránku dostávají. Pokud přijdou hned jako součást stránky, je to asi nejjednodušší. Někdy se stáhnou dodatečně pomocí AJAXu (mrknout na zázložku Network) třeba v JSON formátu a Javascript je nasází do stránky. Nebo se můžou přenášet přes websocket. Jak se zjistí zdroj dat, stačí skriptem nebo pomocí wget replaynout požadavek (někdy je potřeba posílat speciální hlavičky nebo cookies) a nejjednodušeji pomocí regulárních výrazů dostat data z odpovědi serveru. Případně pokud je to JSON, tak se to celé zparsuje do datových typů použítého jazyka a lze s tím jednoduše manipulovat.