Fórum Root.cz
Hlavní témata => Vývoj => Téma založeno: Snape 30. 12. 2015, 22:18:11
-
Dokázal by někdo vyrobit script, který odfiltruje nesmírně vlezlou reklamu na iDnes a Lidovkách za každým článkem? Ten kód v Babišovkách, který chci odfiltorvat, vypadá např. takto:
<div id="e9439D8C3386C8C0E"></div><div><div class="text">
<div style="float: right; text-align: right; line-height:10px;"><a target="_top" href="http://www.etarget.cz/?ref=13655" class="" style="font-size: 9px; color: rgb(155,155,155); text-decoration: none;">Reklama</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Rozpalte vášeň.</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Silná potence již za 17 minut. Získejte znovu připravenost k akci.</div>
<div style="clear:both;"></div>
</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Hodinky - pánské a dámské</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">365 dní na vrácení, 2. hodinky zdarma. Kvalitní hodinky, oblíbených značek.</div>
<div style="clear:both;"></div>
</a></div>
<div class="" style="padding-bottom: 15px;"><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Proteiny na růst svalů</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Nakupujte a získejte nabušenou postavu Slevové kupóny, dárek a doprava zdarma</div>
<div style="clear:both;"></div>
</a></div>
</div></div>
Zatím to řeším pravidlem pro AdBlock
idnes.cz,lidovky.cz##a[style="display: block; font-weight: bold; font-size: 23px; letter-spacing: 0; padding-bottom: 50px; text-decoration:none;"]
ale mám podezření, že tento styl je nastaven i u nereklamních textů a že to filtruje více než má.
-
Na idnes žádnou reklamu nevidím. Používám ghostery, adblock i ublock a noscript ve firefoxu.
-
To myslíš textovou reklamu pod článkem? To mi moc neva
-
Na idnes žádnou reklamu nevidím. Používám ghostery, adblock i ublock a noscript ve firefoxu.
Já také používám vše výše uvedené. Ale reklama, o které je řeč, tam je.
-
Neco jsem spichl :) - https://greasyfork.org/en/scripts/15769-odstran%C4%9Bn%C3%AD-reklam-pod-%C4%8Dl%C3%A1nky-idnes-cz-a-lidovky-cz. Neni to teda moc testovane (pouze jeden clanek na kezdem servru). Targetuje to element podle textu (Reklama) a domeny odkazu, takze by to snad nemelo zabijet nic jineho, nez tu reklamni cast. Pokud by s tim byly nejake problemy, tak mi pisnete PM tu nebo na greasyfork.
-
Adblock + PrivacyBadger a ziadnu reklamu tam nevidim.
-
Neco jsem spichl :)
Nainstaloval jsem to, ale bohužel to nefunguje. Reklama se zobrazuje dále, například na konci tohoto článku (http://zpravy.idnes.cz/v-dubaji-hori-300-metru-vysoky-hotel-dti-/zahranicni.aspx?c=A151231_191815_zahranicni_jav).
Domnívám se, že nelze filtrovat podle textu Reklama a linku etarget.cz, ty jsou uzavřené v DIV před tou reklamou. V nejlepším případě by se nezobrazil text "Reklama", ale samotná reklama se zobrazuje pořád. :( Podívejte se, jak vypadá html:
<div id="eBDE757F62FFC03FD"></div><div><div class="text">
<div style="float: right; text-align: right; line-height:10px;"><a target="_top" href="http://www.etarget.cz/?ref=13655" class="" style="font-size: 9px; color: rgb(155,155,155); text-decoration: none;">Reklama</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Rozpalte vášeň.</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Silná potence již za 17 minut. Získejte znovu připravenost k akci.</div>
<div style="clear:both;"></div>
</a></div>
<div class=""><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Anglicky bez námahy!</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">40-letý člověk se během 14 dnů naučil plynule mluvit anglicky.</div>
<div style="clear:both;"></div>
</a></div>
<div class="" style="padding-bottom: 15px;"><a target="_top" href="#" class="" style="text-decoration: none; display: block; font-weight: bold; font-size: 19px; letter-spacing: 0; padding-bottom: 10px;">
<div class="">Posilte svou imunitu</div>
<div class="" style="padding-bottom: 5px; font-weight: normal; font-size: 16px;">Jste často a opakovaně nemocní? Wobenzym, pomoc na posílení imunity</div>
<div style="clear:both;"></div>
</a></div>
</div></div>
Tohle je fakt zatraceně těžký oříšek. Vůbec nevím, čeho se chytit.
V každém případě cením si vaší snahy a děkuji.
-
Podle toho se jen "targetuje", ale skryva se element rodic rodice. On je asi problem s tim, ze se reklama nekdy (mozna podle rychlosti pripojeni nebo odezvy) nacita az po dokonceni nacteni stranky (kdy se pousti user scripty). Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni (zkuste prosim aktualizovat ten user script). Coz neni kdovijak elegantni, ale rozbit se mi novejsi verzi nepodarilo. Pokud mate opravdu pomale spojeni, tak muzete zkusit drbnout do druheho parametru setTimeout (je to v milisekundach). Pokud by se tento pristup neosvedcil, tak to mohu zkusit prepsat a kontrolovat vsechny zmeny stranky (trochu narocnejsi na implementaci a vykon prohlizece).
-
Neco jsem spichl :)
Nainstaloval jsem to, ale bohužel to nefunguje. Reklama se zobrazuje dále, například na konci tohoto článku (http://zpravy.idnes.cz/v-dubaji-hori-300-metru-vysoky-hotel-dti-/zahranicni.aspx?c=A151231_191815_zahranicni_jav).
Přísahám, žádnou reklamu tam nevidím.
Žádné vlastní filtry jsem nepřidával, v adblocku mám zakázané "nerušivé" reklamy, v ghostery zablokované všechno (na odkazované stránce blokuje nějaké tři google věci), co zablokovat jde, javascript tam mám zablokovaný.
Ještě jsem nezmínil self destructing cookies, to ale asi nebude mít na funkci vliv.
-
Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni
Jupíí. To pomohlo. Ale musel jsem zvýšit timeout na 1500. Zdá se, že to funguje. Musím to pečlivěji odzkoušet, ale první výsledky jsou povzbudivé. Je mi tedy záhadou, JAK, ale funguje, protože ty elementy, které skrýváte, nemají ani id, ani class.
Díky moc. Tahle reklama mě skutečně otravovala a strávil jsem hodně hodin hledáním, jak se jí zbavit.
-
Přísahám, žádnou reklamu tam nevidím.
Zkuste silnější brýle. Ta reklama tam je. Nebo si myslíte, že bych tady otravoval jen z dlouhé chvíle? Skutečně nechápu smysl vašeho vkladu. Pokud tu reklamu nevidíte, buďte rád. Já ji tam viděl dokud jsem si nenainstaloval ten script od noefa.
-
Přísahám, žádnou reklamu tam nevidím.
... javascript tam mám zablokovaný. ...
Jak jsem psal vyse - reklama se pridava asi dynamicky (jinak by ji ten muj skriptik vzdy skryl, kdyz se spoustel pouze po nacteni, ted to v predchozi verzi obcas selhalo). Pokud tedy blokujete vsechen JS, tak asi nepotrebujete ani zadne jine blokovace a tuto konkretni reklamu na idnesu neuvidite :).
PS: Zkusil jsem to a jde o nejaky skript z domeny gidnes.cz (jeji blokaci ale mozna prijdete o nejakou dalsi funkcionalitu).
Hodil jsem tam teda jeste jedno provedeni 0.5s po nacteni
Jupíí. To pomohlo. Ale musel jsem zvýšit timeout na 1500. Zdá se, že to funguje. Musím to pečlivěji odzkoušet, ale první výsledky jsou povzbudivé. Je mi tedy záhadou, JAK, ale funguje, protože ty elementy, které skrýváte, nemají ani id, ani class.
Díky moc. Tahle reklama mě skutečně otravovala a strávil jsem hodně hodin hledáním, jak se jí zbavit.
To jsem rad ;).
Vysvetleni je pomerne proste - skript najde element odkazu s textem "Reklama", overi, ze se odkazuje na domenu s reklamou (etarget.cz, nebo tak nejak) a nasledne prejde na rodice od rodice elementu toho nalzeneho odkazu (prejde o 2 "patra" vyse v html) a toho skryje. Posledni uprava spociva pouze v opozdenem spusteni vyhledavani.
-
No, klobouk dolu. Nevěděl jsem, že jdou dělat až taková kouzla, jako přechod o dvě patra výše v DOM. Právě ta absence jakékoliv šikovné identifikace příslušných tagů mě paralyzovala. Ještě jednou díky a šťastný nový rok.
-
Znám jeden velmi účinný trik: Na takové stránky nechodit.
-
Přísahám, žádnou reklamu tam nevidím.
... javascript tam mám zablokovaný. ...
Jak jsem psal vyse - reklama se pridava asi dynamicky (jinak by ji ten muj skriptik vzdy skryl, kdyz se spoustel pouze po nacteni, ted to v predchozi verzi obcas selhalo). Pokud tedy blokujete vsechen JS, tak asi nepotrebujete ani zadne jine blokovace a tuto konkretni reklamu na idnesu neuvidite :).
PS: Zkusil jsem to a jde o nejaky skript z domeny gidnes.cz (jeji blokaci ale mozna prijdete o nejakou dalsi funkcionalitu).
to jsem rád že nepotřebuji silnější brýle :)
-
Mně stačí blacklist serverů dodávající inzertní shit. A není k tomu potřeba žádný soft co ukrajuje z výpočetního výkonu. Stačí do souboru hosts (ale klidně i do routeru) tento seznam:
# **********************************************
# * BLACKLIST *
# **********************************************
# * (C)1994-2015 ACE Ltd. INC *
# **********************************************
#
# **************** MAFRA GROUP *****************
127.0.0.1 go.idnes.bbelements.com
127.0.0.1 go.cz.bbelements.com
127.0.0.1 mf.advantage.as
127.0.0.1 assets.adobedtm.com
127.0.0.1 www.floowie.com
127.0.0.1 download.macromedia.com
127.0.0.1 a.centrum.cz
127.0.0.1 track.adform.net
127.0.0.1 cz.adocean.pl
127.0.0.1 googleads.g.doubleclick.net
127.0.0.1 img.youtube.com
127.0.0.1 openads.aira.cz
# *************** COOKIE VOPRUZ ****************
127.0.0.1 s3.amazonaws.com
127.0.0.1 connect.facebook.net
127.0.0.1 www.googleapis.com
127.0.0.1 www.google-analytics.com
127.0.0.1 microformats.org
127.0.0.1 schema.org
127.0.0.1 plus.google.com
127.0.0.1 www.googletagservices.com
127.0.0.1 track.adform.net
127.0.0.1 www.setos.cz
127.0.0.1 pagead2.googlesyndication.com
127.0.0.1 www.heureka.cz
-
Mně stačí blacklist serverů dodávající inzertní shit. A není k tomu potřeba žádný soft co ukrajuje z výpočetního výkonu. Stačí do souboru hosts (ale klidně i do routeru) tento seznam:
Myšlenka to není špatná, ale řešení začne selhávat od několika tisíc položek, protože seznam není indexován a sekvenční průchod se stane časově náročným.
Další nevýhodou je, že není možné definovat divoké znaky, například zabanovat doménu i se subdoménami. Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.
-
Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.
Tohle mě docela zajímá. Je totiž pravda, že oni pořád zdokonalují způsoby, jak reklamu protlačit. Zatím ten script, co vymyslel noef, funguje krásně, ale Používám dnsmasq. Jak by se to dalo konkrétně udělat? Mohl byste uveřejnit obsah příslušných konfiguračních souborů?
-
Lokální DNS by bylo jistě praktičtější nebo ještě lépe nakonfigurovat tyto domény do lokální proxy.
Tohle mě docela zajímá. Je totiž pravda, že oni pořád zdokonalují způsoby, jak reklamu protlačit. Zatím ten script, co vymyslel noef, funguje krásně, ale Používám dnsmasq. Jak by se to dalo konkrétně udělat? Mohl byste uveřejnit obsah příslušných konfiguračních souborů?
Konfiguraci lokální DNS jsem měl na starém stroji, který už dosloužil. Momentálně používám Privoxy.