Fórum Root.cz

Hlavní témata => Vývoj => Téma založeno: Snape 30. 12. 2015, 22:18:11

Název: Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 30. 12. 2015, 22:18:11
Dokázal by někdo vyrobit script, který odfiltruje nesmírně vlezlou reklamu na iDnes a Lidovkách za každým článkem?  Ten kód v Babišovkách, který chci odfiltorvat, vypadá např. takto:

Kód: [Vybrat]
<div id="e9439D8C3386C8C0E"></div><div><div class="text">
<div style="float: right; text-align: right; line-height:10px;"><a target="_top" href="http://www.etarget.cz/?ref=13655" class="" style="font-size: 9px; color: rgb(155,155,155); text-decoration: none;">Reklama</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Rozpalte vášeň.</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Silná potence již za 17 minut. Získejte znovu připravenost k akci.</div>
<div style="clear:both;"></div>
</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Hodinky - pánské a dámské</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">365 dní na vrácení, 2. hodinky zdarma. Kvalitní hodinky, oblíbených značek.</div>
<div style="clear:both;"></div>
</a></div>
<div class="" style="padding-bottom: 15px;"><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Proteiny na růst svalů</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Nakupujte a získejte nabušenou postavu Slevové kupóny, dárek a doprava zdarma</div>
<div style="clear:both;"></div>
</a></div>
</div></div>
Zatím to řeším pravidlem pro AdBlock
Kód: [Vybrat]
idnes.cz,lidovky.cz##a[style="display: block; font-weight: bold; font-size: 23px; letter-spacing: 0; padding-bottom: 50px; text-decoration:none;"]
ale mám podezření, že tento styl je nastaven i u nereklamních textů a že to filtruje více než má.
Název: Re:Jak odfiltrovat nesmírně vlezlou reklamu na iDnes a Lidovkách?
Přispěvatel: Milan 31. 12. 2015, 00:40:45
Na idnes žádnou reklamu nevidím.  Používám ghostery, adblock i ublock a noscript ve firefoxu.
Název: Re:Jak odfiltrovat nesmírně vlezlou reklamu na iDnes a Lidovkách?
Přispěvatel: Trubicoid2 31. 12. 2015, 04:46:44
To myslíš textovou reklamu pod článkem? To mi moc neva
Název: Re:Jak odfiltrovat nesmírně vlezlou reklamu na iDnes a Lidovkách?
Přispěvatel: Snape 31. 12. 2015, 15:33:59
Na idnes žádnou reklamu nevidím.  Používám ghostery, adblock i ublock a noscript ve firefoxu.
Já také používám vše výše uvedené. Ale reklama, o které je řeč, tam je.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: noef 31. 12. 2015, 17:35:11
Neco jsem spichl :) - https://greasyfork.org/en/scripts/15769-odstran%C4%9Bn%C3%AD-reklam-pod-%C4%8Dl%C3%A1nky-idnes-cz-a-lidovky-cz. Neni to teda moc testovane (pouze jeden clanek na kezdem servru). Targetuje to element podle textu (Reklama) a domeny odkazu, takze by to snad nemelo zabijet nic jineho, nez tu reklamni cast. Pokud by s tim byly nejake problemy, tak mi pisnete PM tu nebo na greasyfork.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: MartinXXX 31. 12. 2015, 17:43:08
Adblock + PrivacyBadger a ziadnu reklamu tam nevidim.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 31. 12. 2015, 23:50:52
Neco jsem spichl :)

Nainstaloval jsem to, ale bohužel to nefunguje. Reklama se zobrazuje dále, například na konci tohoto článku  (http://zpravy.idnes.cz/v-dubaji-hori-300-metru-vysoky-hotel-dti-/zahranicni.aspx?c=A151231_191815_zahranicni_jav).

Domnívám se, že nelze filtrovat podle textu Reklama a linku etarget.cz, ty jsou uzavřené v DIV před tou reklamou. V nejlepším případě by se nezobrazil text "Reklama", ale samotná reklama se zobrazuje pořád.  :(  Podívejte se, jak vypadá html:
Kód: [Vybrat]
<div id="eBDE757F62FFC03FD"></div><div><div class="text">
<div style="float: right; text-align: right; line-height:10px;"><a target="_top" href="http://www.etarget.cz/?ref=13655" class="" style="font-size: 9px; color: rgb(155,155,155); text-decoration: none;">Reklama</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Rozpalte vášeň.</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Silná potence již za 17 minut. Získejte znovu připravenost k akci.</div>
<div style="clear:both;"></div>
</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Anglicky bez námahy!</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">40-letý člověk se během 14 dnů naučil plynule mluvit anglicky.</div>
<div style="clear:both;"></div>
</a></div>
<div class="" style="padding-bottom: 15px;"><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Posilte svou imunitu</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Jste často a opakovaně nemocní? Wobenzym, pomoc na posílení imunity</div>
<div style="clear:both;"></div>
</a></div>
</div></div>

Tohle je fakt zatraceně těžký oříšek. Vůbec nevím, čeho se chytit.

V každém případě cením si vaší snahy a děkuji.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: noef 01. 01. 2016, 07:10:59
Podle toho se jen "targetuje", ale skryva se element rodic rodice. On je asi problem s tim, ze se reklama nekdy (mozna podle rychlosti pripojeni nebo odezvy) nacita az po dokonceni nacteni stranky (kdy se pousti user scripty). Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni (zkuste prosim aktualizovat ten user script). Coz neni kdovijak elegantni, ale rozbit se mi novejsi verzi nepodarilo. Pokud mate opravdu pomale spojeni, tak muzete zkusit drbnout do druheho parametru setTimeout (je to v milisekundach). Pokud by se tento pristup neosvedcil, tak to mohu zkusit prepsat a kontrolovat vsechny zmeny stranky (trochu narocnejsi na implementaci a vykon prohlizece).
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Milan 01. 01. 2016, 20:44:38
Neco jsem spichl :)

Nainstaloval jsem to, ale bohužel to nefunguje. Reklama se zobrazuje dále, například na konci tohoto článku  (http://zpravy.idnes.cz/v-dubaji-hori-300-metru-vysoky-hotel-dti-/zahranicni.aspx?c=A151231_191815_zahranicni_jav).


Přísahám, žádnou reklamu tam nevidím.

Žádné vlastní filtry jsem nepřidával, v adblocku mám zakázané "nerušivé" reklamy, v ghostery zablokované všechno (na odkazované stránce blokuje nějaké tři google věci), co zablokovat jde, javascript tam mám zablokovaný.
Ještě jsem nezmínil self destructing cookies, to ale asi nebude mít na funkci vliv.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 01. 01. 2016, 21:02:45
Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni

Jupíí. To pomohlo. Ale musel jsem zvýšit timeout na 1500. Zdá se, že to funguje. Musím to pečlivěji odzkoušet, ale první výsledky jsou povzbudivé. Je mi tedy záhadou, JAK, ale funguje, protože ty elementy, které skrýváte, nemají ani id, ani class.

Díky moc. Tahle reklama mě skutečně otravovala a strávil jsem hodně hodin hledáním, jak se jí zbavit.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 01. 01. 2016, 21:08:42
Přísahám, žádnou reklamu tam nevidím.

Zkuste silnější brýle. Ta reklama tam je. Nebo si myslíte, že bych tady otravoval jen z dlouhé chvíle? Skutečně nechápu smysl vašeho vkladu. Pokud tu reklamu nevidíte, buďte rád. Já ji tam viděl dokud jsem si nenainstaloval ten script od noefa.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: noef 01. 01. 2016, 21:12:34
Přísahám, žádnou reklamu tam nevidím.
... javascript tam mám zablokovaný. ...

Jak jsem psal vyse - reklama se pridava asi dynamicky (jinak by ji ten muj skriptik vzdy skryl, kdyz se spoustel pouze po nacteni, ted to v predchozi verzi obcas selhalo). Pokud tedy blokujete vsechen JS, tak asi nepotrebujete ani zadne jine blokovace a tuto konkretni reklamu na idnesu neuvidite :).

PS: Zkusil jsem to a jde o nejaky skript z domeny gidnes.cz (jeji blokaci ale mozna prijdete o nejakou dalsi funkcionalitu).

Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni

Jupíí. To pomohlo. Ale musel jsem zvýšit timeout na 1500. Zdá se, že to funguje. Musím to pečlivěji odzkoušet, ale první výsledky jsou povzbudivé. Je mi tedy záhadou, JAK, ale funguje, protože ty elementy, které skrýváte, nemají ani id, ani class.

Díky moc. Tahle reklama mě skutečně otravovala a strávil jsem hodně hodin hledáním, jak se jí zbavit.

To jsem rad ;).

Vysvetleni je pomerne proste - skript najde element odkazu s textem "Reklama", overi, ze se odkazuje na domenu s reklamou (etarget.cz, nebo tak nejak) a nasledne prejde na rodice od rodice elementu toho nalzeneho odkazu (prejde o 2 "patra" vyse v html) a toho skryje. Posledni uprava spociva pouze v opozdenem spusteni vyhledavani.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 01. 01. 2016, 22:00:55
No, klobouk dolu. Nevěděl jsem, že jdou dělat až taková kouzla, jako přechod o dvě patra výše v DOM. Právě ta absence jakékoliv šikovné identifikace příslušných tagů mě paralyzovala. Ještě jednou díky a šťastný nový rok.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Kit 01. 01. 2016, 23:11:47
Znám jeden velmi účinný trik: Na takové stránky nechodit.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Milan 02. 01. 2016, 02:21:28
Přísahám, žádnou reklamu tam nevidím.
... javascript tam mám zablokovaný. ...

Jak jsem psal vyse - reklama se pridava asi dynamicky (jinak by ji ten muj skriptik vzdy skryl, kdyz se spoustel pouze po nacteni, ted to v predchozi verzi obcas selhalo). Pokud tedy blokujete vsechen JS, tak asi nepotrebujete ani zadne jine blokovace a tuto konkretni reklamu na idnesu neuvidite :).

PS: Zkusil jsem to a jde o nejaky skript z domeny gidnes.cz (jeji blokaci ale mozna prijdete o nejakou dalsi funkcionalitu).
to jsem rád že nepotřebuji silnější brýle  :)
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: AnthonyX 02. 01. 2016, 16:30:38
Mně stačí blacklist serverů dodávající inzertní shit. A není k tomu potřeba žádný soft co ukrajuje z výpočetního výkonu. Stačí do souboru hosts (ale klidně i do routeru) tento seznam:
# **********************************************
# *                 BLACKLIST                  *
# **********************************************
# *        (C)1994-2015 ACE Ltd. INC           *
# **********************************************
#
# **************** MAFRA GROUP *****************
127.0.0.1      go.idnes.bbelements.com
127.0.0.1      go.cz.bbelements.com
127.0.0.1      mf.advantage.as
127.0.0.1      assets.adobedtm.com
127.0.0.1      www.floowie.com
127.0.0.1      download.macromedia.com
127.0.0.1      a.centrum.cz
127.0.0.1      track.adform.net
127.0.0.1      cz.adocean.pl
127.0.0.1      googleads.g.doubleclick.net
127.0.0.1      img.youtube.com
127.0.0.1      openads.aira.cz
# *************** COOKIE VOPRUZ ****************
127.0.0.1      s3.amazonaws.com
127.0.0.1      connect.facebook.net
127.0.0.1      www.googleapis.com
127.0.0.1      www.google-analytics.com
127.0.0.1      microformats.org
127.0.0.1      schema.org
127.0.0.1      plus.google.com
127.0.0.1      www.googletagservices.com
127.0.0.1      track.adform.net
127.0.0.1      www.setos.cz
127.0.0.1      pagead2.googlesyndication.com
127.0.0.1      www.heureka.cz
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Kit 02. 01. 2016, 17:26:37
Mně stačí blacklist serverů dodávající inzertní shit. A není k tomu potřeba žádný soft co ukrajuje z výpočetního výkonu. Stačí do souboru hosts (ale klidně i do routeru) tento seznam:

Myšlenka to není špatná, ale řešení začne selhávat od několika tisíc položek, protože seznam není indexován a sekvenční průchod se stane časově náročným.

Další nevýhodou je, že není možné definovat divoké znaky, například zabanovat doménu i se subdoménami. Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Snape 03. 01. 2016, 19:18:42
Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.

Tohle mě docela zajímá. Je totiž pravda, že oni pořád zdokonalují způsoby, jak reklamu protlačit. Zatím ten script, co vymyslel noef, funguje krásně, ale Používám dnsmasq. Jak by se to dalo konkrétně udělat? Mohl byste uveřejnit obsah příslušných konfiguračních souborů?
Název: Re:Filtrování reklamy na iDnes a Lidovkách
Přispěvatel: Kit 03. 01. 2016, 19:36:37
Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.

Tohle mě docela zajímá. Je totiž pravda, že oni pořád zdokonalují způsoby, jak reklamu protlačit. Zatím ten script, co vymyslel noef, funguje krásně, ale Používám dnsmasq. Jak by se to dalo konkrétně udělat? Mohl byste uveřejnit obsah příslušných konfiguračních souborů?

Konfiguraci lokální DNS jsem měl na starém stroji, který už dosloužil. Momentálně používám Privoxy.