To nebude fungovat. Těžko budeš kontrolovat příspěvky pod články z roku 2002. Je tu skoro 30K jednotlivých obsahů, pod kterými je diskuse. To je nepředstavitelné množství, které se prostě takhle nedá uhlídat. Občas strojově zkouším prohledávat celou databázi diskusí a hledat v nich podezřelá slova a najdu obvykle poměrně dost spamu, kterého si nikdo dřív nevšiml, přestože tam tlačítko „nahlásit spam“ je.
Navíc to tlačítko je často zneužíváno k označování nepopulárních názorů. Někdo napíše třeba: „Mě nikdy OpenOffice.org nesedly, přijde mi, že je lepší dát 1500 Kč za MS Office na tři počítače a je po starostech. Za pár korun mám pořádný balík.“ a deset lidí to označí jako spam. Takže tvůj nápad s automatickým odstraněním by byla katastrofa, lidi by likvidovali i běžné názory lidí, které nemají rádi.
Co se týče spamu na Rootu: dlouho fungovalo prosté javascriptové neviditelné vyplňovátko. Od jisté doby (zřejmě od té, co na tom začali pracovat Indové) tohle selhalo. Zkoušeli jsme různá neviditelná tlačítka, formulářky a další fintičky a spamu přibývalo. V kritickou chvíli ho byly stovky kusů denně. Po celém webu, jehož rozsah jsme si už popsali. Pak přišel Martin Malý se svou zkušenosti s blokováním slov (původně to testoval na Bloguje.cz) a to jediné skutečně zabralo. Spamu projde na web velmi málo (fórum se nepočítá, tady ten filtr není, je to jiný systém).
Zkoušeli jsme to pak třeba ještě s placeným Akismetem, ale tam bylo obrovské množství falešných pozitivit, běželo to jen pár dní a byla to tragédie. Ozývaly se desítky lidí s tím, že je to odmítá pustit. Navíc tam není možnost žádného ladění, dostanete jen odpověď „spam“ nebo „ham“ a starejte se. Kluci to pak vypli a nechali to jen logovat a výsledek byl velmi špatný. Označovalo to za spam i krátké české příspěvky. Takže jsme to zrušili.
Nebojte, zkoušeli jsme kde co, tohle je zatím jediné skutečně funkční řešení. Samozřejmě má ten problém, že když někdo zkopíruje do příspěvku půlku anglického článku, tak ho to vyhodí. U českých příspěvků to funguje. Mě se například nikdy nestalo, že by mi ten filtr vynadal. Občas mě vyhodí kontrola času (teď jste odeslal jeden příspěvek, musíte počkat), ale nikdy ne slovníkový filtr. A to si opravdu ta slova nepamatuji a záměrně se jim nevyhýbám.