Stažení HTML generovaného JavaScriptem

pokus

Stažení HTML generovaného JavaScriptem
« kdy: 02. 04. 2014, 11:41:37 »
Dobrý den,

dá se nějakým způsobem stáhnou html kod který je řekněme generován javascriptem? Když v prohlížeši vypnu javascript tak se mi zobrazí jen layout stránky a nic k tomu např profil na lide.cz.... když zapnu javascript tak se mi zobrazí i obrázky na stránce ale když kouknu do zdrojového kodu stránky odkazy na obrázky tam nejsou.... pokud to budu zkoumat firegugem tak odkazy na obrázky najdu..... předpokládám že toto má na svědomé javascript který se v prohlížeči stustí a přegeneruje stránku.... Prosím máte s tím nějaké zkušenosti? Děkuji
« Poslední změna: 02. 04. 2014, 13:34:34 od Petr Krčmář »


fish

Re:Stahování html kodu - podpora javascriptu
« Odpověď #1 kdy: 02. 04. 2014, 13:07:31 »
by me zajimalo co s tim html kodem minis provadet dale? dle popisu netusis jak html a js spolu funguje na zjevne cizich strankach, tudiz pokud je to ofiko tak muzes kontaktovat dane tvurce stranek, pokud je to neofiko tak to vypada na kradeni neceho co vytvari nekdo jiny s kdovi jakym zamerem, a zrejme z toho potece neco cemu se rika penize, vyved me prosim z meho omylu ;)

fish

Re:Stahování html kodu - podpora javascriptu
« Odpověď #2 kdy: 02. 04. 2014, 13:15:38 »
me podezdreni se opira o spousty podvodnych stranek, ktere se tvari jaky to nemaj obsah a jedine ceho se jim podari docilit je obrat me o kus casu, pri hledani nejake informace/ovladace k zarizeni/elektronicke soucastky apod. takze naznacenim stranek lide.cz bych predpokladal, ze mi zacne do mailu chodit hromady pozvanek at se prihlasim do nejake super-cool socialni site, ze vsichni ktere znam uz tam jsou! nemam tyto podvody vubec v lasce, a proto byla moje reakce nezvykle ostre ladena. budu velice rad, kdyz tvuj zamer bude cisty a transparentni a ja se ti budu moct omluvit za toto narceni :)

pokus

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #3 kdy: 02. 04. 2014, 15:33:52 »
Jde mi pouze o obrázky o nic víc.... rozhodně nechci rozesílat spam.

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #4 kdy: 02. 04. 2014, 15:43:16 »
Ahoj,
jednoduše to nejde, tím mám namysli jednoduše např. přes PHP atp.

Problém je v tom, že v momentě, kdy se prohlížeč spojí se serverem a dostane nějaký obsah.
Poté, jakmile je html načtený v prohlížeči, začne prohlížeč zpracovávat html kod jako takový, tzn. postupně projede <head>, <body> atd.
Když narazí na javascript, provede jej. Pokud je v JS něco, co mění obsah html, pracuje už s DOM - na stejném principu jako třeba firebug zobrazuje zdrojový kod (z DOM).

Aby jsi mohl fungovat skriptem jako prohlížeč, musí se jím te skript v podstatě stát a to by se nevyplatilo psát další "prohlížeč".
Jediný co mě napadá, je využít např. Selenium nebo napsat nějaký skript třeba v perlu, který by na serveru (s desktop rozhraním) spustil prohlížeč s danou url a potom stáhl javascriptem vygenerovaný kod.
42


pokus

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #5 kdy: 02. 04. 2014, 16:01:27 »
To je dobrý nápad, já jsem uvažoval použít nějaký javascript engine třeba v javě a uděalt si něco co by v kodu zobrazilo javascript.... tzn "jednoduchý" prohlížeč.... aje jak jsem to tak googlil tak je to peklo

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #6 kdy: 02. 04. 2014, 16:08:28 »
tak v Javě znám trochu (od slyšení) tohle http://htmlunit.sourceforge.net - možná ti to pomůže ;)
42

bydga

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #7 kdy: 02. 04. 2014, 23:18:56 »
PhantomJS - kompletní headless webkit

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #8 kdy: 03. 04. 2014, 08:34:31 »
PhantomJS - kompletní headless webkit

Nice! :)
Už vidím využití na projektu, co dělám v práci :-)
42

kelovy privarok

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #9 kdy: 03. 04. 2014, 10:04:45 »
Vacsinou to byva tak, ze JS si cez Ajax stiahne nejaky HTML alebo ine data (ktore potrebujes) - cize treba ist po tom subore, ktory je ajaxom nacitavany.

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #10 kdy: 03. 04. 2014, 10:16:55 »
Vacsinou to byva tak, ze JS si cez Ajax stiahne nejaky HTML alebo ine data (ktore potrebujes) - cize treba ist po tom subore, ktory je ajaxom nacitavany.

Trochu jsem se zasmál. Říká vám něco XSS? Víte, ono to není tak snadné načíst Ajaxem jen za pomocí JS jakoukoliv URL ;) Někdy je druhá strana tak zabezpečená, že jí nenačtete ani tak.
http://jsfiddle.net/YzP8r/ ;-)
42

fish

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #11 kdy: 03. 04. 2014, 11:40:08 »
nebo to udelat prasacky jak jsem kdysi delaval, phpkem nacist obsah one stranky, pred konec body dat jqery ready vybrat vsechny potrebne obrazky a posilat si to kam chci, popr. jeste po provedeni reload na dalsi stranku etc. etc. stacil xampp a bylo to :)

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #12 kdy: 03. 04. 2014, 12:00:17 »
Jako takhle, pokud by šlo jen o nárazové spuštění, ne nic automatizovanýho. Tak uplně v klidu postačí firebug pro spuštění nějakého javaskriptu co by to vytáhl. Z prohlížeče pohoda, ale ze serveru je to voser.
42

Petr

Re:Stažení HTML generovaného JavaScriptem
« Odpověď #13 kdy: 03. 04. 2014, 12:11:40 »
Dělá se to takto:

1) Otevři stránku ve Chrome.
2) Zmáčkni F12 - tím se dostaneš do development režimu.
3) V menu Elements najeď nahoru na HTML.
4) Klikni pravým tlačítkem a zvol Copy as HTML.

A teď máš stránku ve schránce - stačí vložit do libovolného editoru.

42

  • **
  • 63
  • 42
    • Zobrazit profil
    • 42
Re:Stažení HTML generovaného JavaScriptem
« Odpověď #14 kdy: 03. 04. 2014, 12:46:12 »
Dělá se to takto:

1) Otevři stránku ve Chrome.
2) Zmáčkni F12 - tím se dostaneš do development režimu.
3) V menu Elements najeď nahoru na HTML.
4) Klikni pravým tlačítkem a zvol Copy as HTML.

A teď máš stránku ve schránce - stačí vložit do libovolného editoru.

Popř. ke zpracování skriptem...
42