Zabránění kopírování obsahu WWW

noef

  • *****
  • 897
    • Zobrazit profil
    • E-mail
Re:Zabraneni kopirovani obsahu WWW
« Odpověď #15 kdy: 19. 09. 2015, 13:55:35 »
Jak vidím, důvodů proč to nedělat se tady už objevilo mraky, i když na to jste se neptal. Klasika. Já se pro změnu pokusím odpovědět na otázku, která byla položena.

Pokud je otazka hloupa, tak se slusi na to poukazat. Proc se snazit resit nesmyslne zadani, ktere stejne nebude fungovat tak, jak si zadatel predstavuje.


Když to půjde vidět v browseru, půjde to stáhnout. Zabránit tomu není možné.

+1
Duvod pro to, abych to vubec neresil, pripadne tomu venoval jen minimum casu.

Asi nejefektivnější, co mě napadá je obsah vypisovat javascriptem a kontrolovat, zda je to lokální kopie nebo verze na serveru a podle toho s obsahem zacházet. Takže vypnout javascript nebude možné, protože bez toho se to vůbec nezobrazí.

Pak by tam mohly být další vychytávky, jako např. pomocné soubory umístěné ve struktuře webu, bez jejichž existence se obsah nezobrazí: ve zdroji nalinkované nebudou, takže stahovač je nestáhne, kontrolovat je bude skript a jejich názvy můžou být zašifrované - opět javascript. Pokud se javascript bude generovat a název těch souborů bude pro každý dokument jiný, tak by to znamenalo upravit každý ten stažený dokument upravit zvlášť, což vzhledem k množství, o kterém píšete, bude pěkný opruz.

Prostě ať na to jdu zprava nebo zleva, jako nejefektivnější mi připadá ochrana javascriptem (chování uživatele samozřejmě super technika, ale napsat a analyzovat to bude pekelně složité a podle mě i velmi nespolehlivé). Nicméně obejít to půjde vždy.

Na obfuskování se vybodněte, to nic neřeší, pokud se použije automatizovaný nástroj. Spíše bych se zaměřil na to, aby se ty ochrany nedaly odstranit hromadně a automaticky generováním unikátního javascriptu pro každý dokument zvlášť.

Par minut googleni mi naslo pjscrape - umi ripovat stranky rendrovane JavaScriptem. Takze popsane reseni by akorat stalo zadavatele penize a nemelo by zadny ucinek, kdyz existuje hotovy open source nastroj.


TKL

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #16 kdy: 19. 09. 2015, 13:58:15 »
Par minut googleni mi naslo pjscrape - umi ripovat stranky rendrovane JavaScriptem. Takze popsane reseni by akorat stalo zadavatele penize a nemelo by zadny ucinek, kdyz existuje hotovy open source nastroj.

Proto jsem taky napsal, že těch úrovní "ochrany" by muselo být více. Tečka.

Kit

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #17 kdy: 19. 09. 2015, 14:18:57 »
Root opravdu nezklamal :-). Chtel jsem technicke reseni a dostal jsem same ideologicke komentare.

Ideologický komentář by vypadal asi takto: Nesnaž se ta data nijak skrývat, informace by měly být přístupné pro všechny.

Technický komentář vypadá jinak: Nesnaž se ta data nijak skrývat, stejně ty informace budou přístupné pro všechny.

Podle mých zkušeností veškeré obfuskace vedou jen k vyšší zátěži serveru a nižšímu zisku, protože odradí mnoho legálních uživatelů. Viz případy některých DVD, které si někdo koupil, ale protože měl problémy při přehrávání, stejně si z uloz.to stáhl pirátskou kopii, která mu fungovala bez problémů.

DoNotStealThisWebsite:)

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #18 kdy: 19. 09. 2015, 14:20:20 »
Par minut googleni mi naslo pjscrape - umi ripovat stranky rendrovane JavaScriptem. Takze popsane reseni by akorat stalo zadavatele penize a nemelo by zadny ucinek, kdyz existuje hotovy open source nastroj.

Proto jsem taky napsal, že těch úrovní "ochrany" by muselo být více. Tečka.

O to mi prave slo, ty vrstvy "ochran". Ze to nebude 100% je myslim jasne kazdemu, jde o to prekonat tu hranici kdy nekomu za to stoji uverejnit torrent s danou site.

Ad pjscrape, ten podle meho nazoru po letmem projiti projektove stranky slouzi k necemu uplne jinemu.

DoNotStealThisWebsite:)

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #19 kdy: 19. 09. 2015, 14:25:26 »
Root opravdu nezklamal :-). Chtel jsem technicke reseni a dostal jsem same ideologicke komentare.
Ideologický komentář by vypadal asi takto: Nesnaž se ta data nijak skrývat, informace by měly být přístupné pro všechny.

Technický komentář vypadá jinak: Nesnaž se ta data nijak skrývat, stejně ty informace budou přístupné pro všechny.

Podle mých zkušeností veškeré obfuskace vedou jen k vyšší zátěži serveru a nižšímu zisku, protože odradí mnoho legálních uživatelů. Viz případy některých DVD, které si někdo koupil, ale protože měl problémy při přehrávání, stejně si z uloz.to stáhl pirátskou kopii, která mu fungovala bez problémů.

:-))) Hnojim si vlastni thread offtopicem, ale budiz: asi mame kazdy jinou predstavu o tom co je technicke a co je ideologicke. Prectete si to po sobe jeste jednou, posledni odstavec je cista ideologie, predposledni (ve vyznamu) je zase jen a pouze (ideologicky) nazor. Ja nerozporuju, ze 100% ochranu udelat nelze a nikdo to ani nechce. Jde o to zneprijemnit kopirovacum zivot natolik, aby sli delat neco jineho.



Darm

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #20 kdy: 19. 09. 2015, 14:28:22 »
Mimochodem, bude se obsah aktualizovat dostatečně často, nebo bude statický? Protože v případě častých aktualizací bych se vrátil k té steganografii. Ta tak komplikovaná není a člověk si dvakrát rozmyslí jestli mu ztráta placeného přístupu stojí za rozšíření obsahu na torrentech.

noef

  • *****
  • 897
    • Zobrazit profil
    • E-mail
Re:Zabraneni kopirovani obsahu WWW
« Odpověď #21 kdy: 19. 09. 2015, 14:29:03 »
Nevim, dynamicky obsah mi neprijde jako ochrana. To uz lepsi bude ten pristup s ukrytim (mnoha ruznych) id uzivatele do stranek (ruzne kombinace ci poradi pouzitych atributu class/id [vyznamovych, ne ze nejsou nikde pouzity], ukryti v inline stylu barvy, pripadne primo v nejakem obrazku atp.). A take se s tim nalezite pochlubit, ze pouzivate Über-User-Signature (nebo nejaky podobne "cool" nazev) a nalezite to vysvetlit, aby to odradilo lidi.

+1

Ad pjscrape, ten podle meho nazoru po letmem projiti projektove stranky slouzi k necemu uplne jinemu.
No, pomoci neho lze velmi lehce napsat scraper pro danou stranku (tj. automaticke stazeni obsahu). Pokud neni cilem ochrany znemoznit tento proces, pak jsem asi nepochopil zadani ???. Samozrejme muzete (asi, nikdy jsem s tim nedelal) pouzit primo ten PhantomJS - headless simulace webkit prohlizece - proste si pockate na vyrendrovani a ulozite stranku. Pouziva se to bezne pro testovani s AngularJS knihovnou, ktera tezce vyuziva prave dynamickeho staveni stranek.

Darm

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #22 kdy: 19. 09. 2015, 14:34:24 »
Přesně. Pak se to dá ještě vrazit do případných obrázků, pokud jsou součástí textu, a v případě že jsou k dispozici údaje o klientovi může ve smluvních podmínkách pohrozit i žalobou v případě nelegálního šíření.

DoNotStealThisWebsite:)

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #23 kdy: 19. 09. 2015, 14:40:28 »
Mimochodem, bude se obsah aktualizovat dostatečně často, nebo bude statický? Protože v případě častých aktualizací bych se vrátil k té steganografii. Ta tak komplikovaná není a člověk si dvakrát rozmyslí jestli mu ztráta placeného přístupu stojí za rozšíření obsahu na torrentech.

Obsah (bude-li projekt zivotaschopny) se aktualizovat bude, ale ne prilis casto. Bohuzel placeny pristup nebude nijak extremne drahy. Problem tady je ze v praxi se nam uz u jine sluzby i pres laci lide "slozili" a vic jich pouzivalo jeden ucet, potom jeden z nich muze i zase nasdilet ucet dalsimu uz treba zadarmo ... a ten to z nerozvaznosti treba stahne. V minulosti se nam tyto veci dely, ale diky jinemu typu sluzby se to podarilo snadno detekovat a zastavit (a sluzba je ziskova :-) ).

Jinak obsah je formou spis dynamicky (ta zajimava cast), ne kvuli protekci, ale "by design" (jinak to udelat ani nejde, resp. zmizi zajimave fce).

Kit

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #24 kdy: 19. 09. 2015, 14:44:22 »
Prectete si to po sobe jeste jednou, posledni odstavec je cista ideologie, predposledni (ve vyznamu) je zase jen a pouze (ideologicky) nazor.

Ten poslední odstavec není ukázkou čisté ideologie, ale ukázkou zpackaného technického řešení.

Součástí toho webu by mělo být licenční ujednání, které by právně zajistilo nemožnost dalšího šíření informací. A jako důkazní materiál umístit do informací zmíněné watermarky.

noef

  • *****
  • 897
    • Zobrazit profil
    • E-mail
Re:Zabraneni kopirovani obsahu WWW
« Odpověď #25 kdy: 19. 09. 2015, 14:45:04 »
... Jinak obsah je formou spis dynamicky (ta zajimava cast), ne kvuli protekci, ale "by design" (jinak to udelat ani nejde, resp. zmizi zajimave fce).
Pak me prijde zbytecne travit moc casu nad "ochranou". Akorat tam narychlo placnout par skrytych (ruzne transformovanych) id uzivatele a rozhodne neresit nic velkeho. Navic to, co popisujete, pusobi jako sosaci amateri - IMO vetsinu teto skupiny odrazi prave to vychloubani se skrytym id uzivatele v kazdem dokumentu.

DoNotStealThisWebsite:)

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #26 kdy: 19. 09. 2015, 15:16:54 »
Součástí toho webu by mělo být licenční ujednání, které by právně zajistilo nemožnost dalšího šíření informací. A jako důkazní materiál umístit do informací zmíněné watermarky.

lic. smlouva (ujednani) na tom webu samozrejme bude, stejne tak hromada skrytych i viditelnych watermarku (+u PDF texty "Licensed to XXX under ...". Jenze kdyz uz se objevi cela site stazena, nic s tim neudelate, technicky ani pravne (zejm. kvuli neochote OCTR takto "slozite" veci resit).

Mam zkusenost z fyzickeho produktu, kdy vznikl plagiat ... a spousta lidi radsi pouziva moralne zastaralou vec, nez aby si koupili neco novejsiho. Tento segment trhu si ale kupodivu jiny obdobny produkt od ktereho plagiat zatim neni klidne koupi.

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #27 kdy: 19. 09. 2015, 15:17:03 »
... Jinak obsah je formou spis dynamicky (ta zajimava cast), ne kvuli protekci, ale "by design" (jinak to udelat ani nejde, resp. zmizi zajimave fce).
Pak me prijde zbytecne travit moc casu nad "ochranou". Akorat tam narychlo placnout par skrytych (ruzne transformovanych) id uzivatele a rozhodne neresit nic velkeho. Navic to, co popisujete, pusobi jako sosaci amateri - IMO vetsinu teto skupiny odrazi prave to vychloubani se skrytym id uzivatele v kazdem dokumentu.
+1
Vychloubat se je důvod to prolomit. Už jen z kratochvíle sundat to nabubřelé ego. Spousta projektů se dočkala hacku, potom co se začala vychloubat, z poslední doby například Bubosklad.

Steganografie nebude fungovat, protože se tu teď probírá, takže útočník si udělá dva účty, aby mohl porovnávat data. Obrázky a styly jsou k ničemu, protože se dá kód minimalizovat (u js například Google closure compiler, u html asi také bude něco existovat), diff dvou obrázků se dá nahradit jinými náhodnými daty, popřípadě je lze úplmě odstranit, nebo nad nimi pustit kompresi a transformaci, která bude schopná tyto prvky znehodnotit. Článek jako takový se dá pustit ven jako plain text, nebo v markdownu.

Pořád jde ale o techniky, na které není potřeba ultra haxor, pouze člověk s průměrnými znalostmi IT.


noef

  • *****
  • 897
    • Zobrazit profil
    • E-mail
Re:Zabraneni kopirovani obsahu WWW
« Odpověď #28 kdy: 19. 09. 2015, 15:42:19 »
Vychloubat se je důvod to prolomit. Už jen z kratochvíle sundat to nabubřelé ego.
Pritomnost ochrany je duvod to prolomit. A nemusite nutne tvrdit, ze je to neprolomitelne. Staci mit vyrazne vystavene na kazde strance upozorneni, ze je tam nekde ukryto id uzivatele (nejlevnejsi varianta je skoncit jen u toho upozorneni ;D).

Steganografie nebude fungovat, protože se tu teď probírá, takže útočník si udělá dva účty, aby mohl porovnávat data.
Ale ono nemusi platit, ze KAZDY ucet ma stejnou formu steganografie. Pokud jsou ruzne (a ukladaji se k uctu), tak jen dva ucty nestaci.

Obrázky a styly jsou k ničemu, protože se dá kód minimalizovat (u js například Google closure compiler, u html asi také bude něco existovat)
Pokud je ten styl pouzity ve strance, jak jsem psal, tak je jedno kolikrat to minimalizujete, cervene pozadi bude porad cervene pozadi. U JS to stejne - pokud to neco dela, tak to tezko minimalizator odoptimalizuje pryc. HTML to stejne - pokud mam ve vstupu tabulky sirky 120, tak na vystupu budou taky, jinak nemluvime o minimalizaci.

, diff dvou obrázků se dá nahradit jinými náhodnými daty, popřípadě je lze úplmě odstranit, nebo nad nimi pustit kompresi a transformaci, která bude schopná tyto prvky znehodnotit.
Ano, ale musite mit jistotu, ze se ztrati i vsechna metadata (tj. dobre znat konverzni nastroj) a ze "watermark" je opravdu porusen kompresi (nemusi nutne platit). Pokud nevite CO je znacka, tak mate problem, protoze krome "reseni" zahozeni obrazku nemate jistotu nikdy.

Článek jako takový se dá pustit ven jako plain text, nebo v markdownu.
Napadaji me neviditelne (nebo velmi spatne viditelne) unicode znaky. Zalezi na obsahu, ale vetsinou budou ty obrazky chybet.

Pořád jde ale o techniky, na které není potřeba ultra haxor, pouze člověk s průměrnými znalostmi IT.
Pokud si musim psat vlastni tool, tak uz mi prijde, ze to nebude delat clovek s prumernymi IT znalostmi. Prumerne IT znalosti IMO konci u pouzivani e-mailoveho klienta.



A samozrejme to neni opravdova ochrana, je to jen takove drbatko proti prumernemu uzivateli. Proti profikum nemate stejne sanci, ani se svym SW, mozna tak se svym HW, ale i tam to pujde, pokud se bude chtit (napr. kamera, pripadne i ocr).

Ivan Nový

Re:Zabraneni kopirovani obsahu WWW
« Odpověď #29 kdy: 19. 09. 2015, 16:13:15 »
Řešení je jednoduché a praxí osvědčené. Reklama, reklama, reklama, ...