Jak zabránit harvestování WWW?

butan

Jak zabránit harvestování WWW?
« kdy: 29. 02. 2016, 09:01:24 »
Zdravím, před časem se tady v jiném vlákně řešilo jak zobrazit data na www a přitom blokovat jejich kopírování.

Mám asi podobný problém, rozsáhlejší web (Apache/PHP/Mysql), tisíce produktů (kategorie, uspořádání, parametry, popisky, obrázky), problém je, že nás vykrádá konkurence, existují techniky jak detekovat takového robota  a následně blokovat?
(aktuálně si hraju s robots.txt, tak že pomocí disallow direktivy udělám past kam se nemají roboti dívat a hlídám ji co tam leze a loguji si přístupy, aby něco viděl, ale je to takové diskutabilní)
Nějaká nápady, díky But.
« Poslední změna: 29. 02. 2016, 10:51:38 od Petr Krčmář »


hu

Re:Harvestování WWW
« Odpověď #1 kdy: 29. 02. 2016, 09:19:01 »
Zdravím, před časem se tady v jiném vlákně řešilo jak zobrazit data na www a přitom blokovat jejich kopírování.

Mám asi podobný problém, rozsáhlejší web (Apache/PHP/Mysql), tisíce produktů (kategorie, uspořádání, parametry, popisky, obrázky), problém je, že nás vykrádá konkurence, existují techniky jak detekovat takového robota  a následně blokovat?
(aktuálně si hraju s robots.txt, tak že pomocí disallow direktivy udělám past kam se nemají roboti dívat a hlídám ji co tam leze a loguji si přístupy, aby něco viděl, ale je to takové diskutabilní)
Nějaká nápady, díky But.

Musi ti byt jasny, ze to reseni nema. Vzdycky me fascinuje, kdyz se nekdo divi, ze mu zverejnenou informaci nekdo zkopiroval.

Muzete si leda hazet vzajemne klacky pod nohy a cekat, koho to prestane bavit driv.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:Harvestování WWW
« Odpověď #2 kdy: 29. 02. 2016, 09:36:38 »
Tak obrazky by sly opatrit vodotiskem a pokud je najdu u konkurence, tak je tu autorske pravo.

Jinak leda prejit do podzemi a informace sirit kanalem, tetuazi na potkanech.

Re:Harvestování WWW
« Odpověď #3 kdy: 29. 02. 2016, 09:49:57 »
Musi ti byt jasny, ze to reseni nema.
Řešení to samozřejmě má. Není nutné kopírování technicky zabránit, stačí to natolik zkomplikovat, aby se to nevyplatilo. Zároveň hrozí, že při té obraně odříznete nebo naštvete legální uživatele.

hu

Re:Harvestování WWW
« Odpověď #4 kdy: 29. 02. 2016, 10:17:18 »
je tu autorske pravo

Autorske pravo a ochrana "IP" obecne je zlo.


robotron

Re:Jak zabránit harvestování WWW?
« Odpověď #5 kdy: 29. 02. 2016, 11:17:10 »
(Apache/PHP/Mysql), tisíce produktů (kategorie, uspořádání, parametry, popisky, obrázky), problém je, že nás vykrádá konkurence

Me by dost zajimalo, co tak desne originalniho k vykradani tam mate. Pevne doufam, ze to neni vas pripad, ale podobnou definici splnuji zmrdsky "e-shopy" takovejch tech hejsku, co celou zivnost zalozili jen na SEO a tom, ze si nasekaj od jednoho ICO padesat webkramu, sami nemaj ani sklad, podporu nulovou, pridanou hodnotu zapornou (pleveleni webu balastem). Takovejm bych pral ne vykradani, ale nejakou obdobu machani v ledovy Vltave.

Kit

Re:Harvestování WWW
« Odpověď #6 kdy: 29. 02. 2016, 12:11:22 »
Autorske pravo a ochrana "IP" obecne je zlo.

Nesouhlasím. Zlo z něj udělali až obchodníci, kteří jsou ostatně schopni udělat zlo z čehokoli.

butan

Re:Jak zabránit harvestování WWW?
« Odpověď #7 kdy: 29. 02. 2016, 12:37:03 »
(Apache/PHP/Mysql), tisíce produktů (kategorie, uspořádání, parametry, popisky, obrázky), problém je, že nás vykrádá konkurence

Me by dost zajimalo, co tak desne originalniho k vykradani tam mate. Pevne doufam, ze to neni vas pripad, ale podobnou definici splnuji zmrdsky "e-shopy" takovejch tech hejsku, co celou zivnost zalozili jen na SEO a tom, ze si nasekaj od jednoho ICO padesat webkramu, sami nemaj ani sklad, podporu nulovou, pridanou hodnotu zapornou (pleveleni webu balastem). Takovejm bych pral ne vykradani, ale nejakou obdobu machani v ledovy Vltave.

Predstavte si, ze jste roky pracovat na firme, budoval ji, zlepsoval vztahy s dodavateli, vypiplal jste ten svuj katalog produktu z niceho, roztridil, nechal nafotit produktove fotky, napsal popisky, zaradil do katalogu, vse rucne, stalo to mrte hodin prace a pak prijde nejaky s prominutim zmrd a zacne to cucat.

Chapu, ze je to boj a nelze to asi vyhrat, ale chtel jsem se aspon zeptat, opravdu nejde o nejaky pseudoweb, jsme nejvetsi distributor v CR a SK. But.

hu

Re:Jak zabránit harvestování WWW?
« Odpověď #8 kdy: 29. 02. 2016, 12:38:43 »
(Apache/PHP/Mysql), tisíce produktů (kategorie, uspořádání, parametry, popisky, obrázky), problém je, že nás vykrádá konkurence

Me by dost zajimalo, co tak desne originalniho k vykradani tam mate. Pevne doufam, ze to neni vas pripad, ale podobnou definici splnuji zmrdsky "e-shopy" takovejch tech hejsku, co celou zivnost zalozili jen na SEO a tom, ze si nasekaj od jednoho ICO padesat webkramu, sami nemaj ani sklad, podporu nulovou, pridanou hodnotu zapornou (pleveleni webu balastem). Takovejm bych pral ne vykradani, ale nejakou obdobu machani v ledovy Vltave.

Predstavte si, ze jste roky pracovat na firme, budoval ji, zlepsoval vztahy s dodavateli, vypiplal jste ten svuj katalog produktu z niceho, roztridil, nechal nafotit produktove fotky, napsal popisky, zaradil do katalogu, vse rucne, stalo to mrte hodin prace a pak prijde nejaky s prominutim zmrd a zacne to cucat.

Chapu, ze je to boj a nelze to asi vyhrat, ale chtel jsem se aspon zeptat, opravdu nejde o nejaky pseudoweb, jsme nejvetsi distributor v CR a SK. But.

Nj, tak jste ten katalog meli davat proti podepsany NDA. Jedina funkcni ochrana IP je o nem nikomu nerikat :-)

hu

Re:Harvestování WWW
« Odpověď #9 kdy: 29. 02. 2016, 12:39:08 »
Autorske pravo a ochrana "IP" obecne je zlo.

Nesouhlasím. Zlo z něj udělali až obchodníci, kteří jsou ostatně schopni udělat zlo z čehokoli.

Muzes rozvest obe ta tvrzeni?

Kit

Re:Harvestování WWW
« Odpověď #10 kdy: 29. 02. 2016, 12:51:33 »
Autorske pravo a ochrana "IP" obecne je zlo.

Nesouhlasím. Zlo z něj udělali až obchodníci, kteří jsou ostatně schopni udělat zlo z čehokoli.

Muzes rozvest obe ta tvrzeni?

Tady ne, netýká se to dotazu.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:Jak zabránit harvestování WWW?
« Odpověď #11 kdy: 29. 02. 2016, 12:54:36 »
Predstavte si, ze jste roky pracovat na firme, budoval ji, zlepsoval vztahy s dodavateli, vypiplal jste ten svuj katalog produktu z niceho, roztridil, nechal nafotit produktove fotky, napsal popisky, zaradil do katalogu, vse rucne, stalo to mrte hodin prace a pak prijde nejaky s prominutim zmrd a zacne to cucat.

Chapu, ze je to boj a nelze to asi vyhrat, ale chtel jsem se aspon zeptat, opravdu nejde o nejaky pseudoweb, jsme nejvetsi distributor v CR a SK. But.

Jak rikam, watermarkujte obrazky a sudte se. To je asi jedine, protoze stahovani zabranit nelze.

robotron

Re:Jak zabránit harvestování WWW?
« Odpověď #12 kdy: 29. 02. 2016, 12:56:39 »
Predstavte si, ze jste roky pracovat na firme, budoval ji, zlepsoval vztahy s dodavateli, vypiplal jste ten svuj katalog produktu z niceho, roztridil, nechal nafotit produktove fotky, napsal popisky, zaradil do katalogu, vse rucne, stalo to mrte hodin prace a pak prijde nejaky s prominutim zmrd a zacne to cucat.

Chapu, ze je to boj a nelze to asi vyhrat, ale chtel jsem se aspon zeptat, opravdu nejde o nejaky pseudoweb, jsme nejvetsi distributor v CR a SK. But.

To si predstavit umim. Vas problem je potom spis pravniho nez technickyho charakteru. Uz minimalne "nafotit produktove fotky" splnuje znaky autorskeho dila. Zarazeni do katalogu nejspis ne (jo, autorskej se pohybuje na pomezi nekolika hodne vagnich pojmu). Sverte to odbnornikum.

Originalitu fotek asi dolozite technicky docela snadno, snad mate aspon od nekolika ks zdrojovy soubory (raw nebo fotakovej JPEG pred upravou).

r233

Re:Jak zabránit harvestování WWW?
« Odpověď #13 kdy: 29. 02. 2016, 13:03:22 »
watermark na obrázky a nějakou zmínku s názvem firmy-eshopu do textu popisu. Pak se to vykrádá blbě. Nebo ještě lépe, blok textu generovaný jako obrázek.

robotron

Re:Jak zabránit harvestování WWW?
« Odpověď #14 kdy: 29. 02. 2016, 13:16:04 »
Nebo ještě lépe, blok textu generovaný jako obrázek.

Tak to je na superarbitraz: 1. OCR 2. fulltext 3. datovej objem.