Jak najít na web serveru soubory určitého typu?

flashrobot

Jak najít na web serveru soubory určitého typu?
« kdy: 02. 05. 2010, 22:34:11 »
Zdravim,
potrebujem spravit skript, ktory na FTP a HTTP serveroch bude vyhladavat urcite typy suborov (napr. video a hudbu). Cize spustim skript s adresou ftp/http servera a ten mi vypise zelane subory.
Ako vidite v prilohe, FTP vyhladavanie som vyriesil tak, ze som si to mountol cez curlftps a tam som jednoducho findom prebehol adresar a pomocou file som zistil mime typ suboru.
Avsak ked som chcel tymto istym sposobom riesit aj HTTP, nastalo niekolko problemov: mountnut to viem iba ked na serveri bezi webdav, taktiez je treba dodatocne zadavat cestu k adresaru kde je webdav (napr /public/webdav) a najhorsie je to, ze pri spusteni FINDu to zamrzne pri vacsich .avi suboroch.
Potrebujem teda poradit, ako by som nejak rekurzivne ziskal vsetky priame linky k suborom, ktore su na webserveri, tym padom by som to nemusel ani mountovat a pouzivat webdav. Wget vie rekurzivne zistit linky, no zacne ich hned vsetky stahovat a to nemozem... Viac info komentare v skripte:)

http://pastebin.org/198379

Uvitam akekolvek napady vratane navrhov na vylepsenie uz fungujuceho FTP vyhladavaca, napr. aby nebolo potrebne pouzivat nadstardantne baliky ako curlftps.
Vsetkym vopred dakujem.
« Poslední změna: 02. 05. 2010, 23:38:59 od Petr Krčmář »


Jenda

Re: Jak najít na web serveru soubory určitého typu?
« Odpověď #1 kdy: 03. 05. 2010, 01:43:45 »
wget -r --spider URL ?

Jenda

Re: Jak najít na web serveru soubory určitého typu?
« Odpověď #2 kdy: 03. 05. 2010, 01:45:44 »
wget -r --spider URL ?
(moc pozdě v noci :-P) Za předpokladu, že ti stačí identifikace pomocí MIME typu zasílaného serverem. Jinak si budeš muset z každého stáhnout začátek a podle něj se ho pokusit identifikovat.

flashrobot

Re: Jak najít na web serveru soubory určitého typu?
« Odpověď #3 kdy: 09. 05. 2010, 23:54:18 »
Diky moc, hlavny problem bol v tom, ze som mal stary wget a ten mal v rezime spider ovela skromnejsi vystup :)