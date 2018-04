Nevyžádaný reklamní e-mail neboli spam sužuje uživatele již od dřevních dob internetu. Letos začal objem spamu být nesnesitelný, některé zdroje hovoří o více než 50% všech zpráv. Spam uživatele nejen otravuje, ale může jim přinášet i ekonomicky vyčíslitelné ztráty. Pokud zákazník platí za dobu připojení k internetu nebo objem přenesených dat, můžeme náklady spočítat s přesností na haléře. Při hromadném promazávání spamu můžeme omylem vymazat legitimní zprávu a přijít tak o lukrativní zakázku, náklady na spam ve firmě můžeme vyjádřit i jako náklady na pracovní sílu promarněné tříděním pošty.

U přenosných zařízení, jako jsou mobilní telefony, pagery či PDA a počítače s bezdrátovým připojením do internetu, platíme zpravidla za dobu připojení či objem přenesených dat při stahování pošty. Pokud si necháváme zprávy přeposílat jako SMS nebo na pager, jsme zpravidla značně omezeni kapacitou přístroje nebo karty SIM. Nedávno jsme přinesli přehled metod boje proti spamu, po zveřejnění článku jsme měli možnost dlouhodobě testovat řešení na bázi programu SpamAssassin.

Do testovací schránky na Post.cz jsme přesměrovali poštu z e-mailových adres, které jsme záměrně podsunuli spammerům do jejich databází (spamtrap, past na spam). SpamAssassin u Post.cz dosahuje úspěšnosti přes 90%. Do testovací schránky u Post.cz jsme posílali i legitimní poštu, nezaznamenali jsme však falešně pozitivní výsledky, tedy legitimní zprávy označen jako spam. Detekovaný spam je ukládán do vlastní složky, ze které je mazán až po týdnu, ztráta špatně klasifikované legitimní zprávy by tedy neměla hrozit.

Společnost Czech On Line nabízí u své služby Post.cz antispamovou ochranu za 20 Kč měsíčně, tato částka se může vyplatit již díky ušetřeným nákladům na připojení. Post.cz má za sebou pohnutou historii hacků, výpadků, ztracených zpráv a nesmyslného filtrování pošty (jeden čas mimo jiné zahazoval poštu z elektronických konferencí), nyní se však provozovatel začal snažit, aby se Post.cz vrátil mezi důvěryhodné freemaily. Kromě antispamového filtru je možno přikoupit i antivirovou ochranu nebo větší kapacitu schránky, podle našich informací si však nechalo placené služby na Post.cz aktivovat jen několik tisíc uživatelů a vybrané částky tak nemohou zdaleka vyvážit náklady Czech On Line na spuštění služeb. Nelze však opomenout otázku prestiže a synergické efekty, Czech On Line patří k nejvýznamějším poskytovatelům připojení k internetu a kvalitní ochranou proti spamu se může snažit bojovat o loajalitu zákazníků.

Umělá inteligence proti otravné reklamě

cz.comp.linux

Post.cz využívá filtrovací program SpamAssassin, který pracuje na bázi expertního systému. Podle analýzy obsahu přiřazuje zprávě bodové ohodnocení, pokud počet trestných bodů přesáhne určitou mez, je zpráva ozačena za spam. Základní výčet pravidel pro SpamAssassin najdete zde . Kladné hodnoty ve sloupci vpravo znamenají, že dle daného pravidla je zpráva spamem, záporné opak, číselné hodnoty jsou přidělovány tvůrci SpamAssassinu na základě analýzy jimi shromážděného korpusu zpráv. V případě Post.cz jsou pravidla ještě průběžně upravována s ohledem na česká specifika, neicméně tyto úpravy společnost Czech On Line nepublikovala. Na veřejně dostupných pravidlech pro filtrování českého spamu pracuje i pan Tempír, v diskusním příspěvku nadokonce žádá české uživatele e-mailu o zaslání vzorků česky psaného spamu na adresu

SpamAssassin trpí i určitými nedstatky. Je naprogramován v Perlu, k běhu proto vyžaduje poměrně mnoho systémových zdrojů. Podařilo se jej nicméně přenést i na jiné platformy, například do poštovního programu Kerio Mail Server. Ručně psaná pravidla jsou logicky vždy o krok zpět za spammery, odesilatelé si navíc mohou vyzkoušet poslat spam sami sobě na filtrovaný účet a modifikovat zprávu tak dlouho, dokud filtry neprojde.

Síla spočívá ve spolupráci

Síla SpamAssassinu naopak spočívá v jeho otevřenosti a schopnosti spolupráce s externími databázemi na internetu. U Post.cz využívá SpamAssassin databázi systému Vipul's Razor ve verzi 2, který porovnává digitální otisk přijaté zprávy s digitálními otisky spamů, které hlásí uživatelé z celého světa v reálném čase, bližší popis najdete na této stránce . V testovacím provozu je u Post.cz využívání syszému Distributed Checksum Clearinghouse . Naději do budoucna slibují i bayesovské filtry, které se objevily mimo jiné v programu bogofilter . Ten vyžaduje méně systémových zdrojů mimo jiné proto, že je napsán v jazyce C a přeložen do strojového kódu. S výhodou může být zařazen před SpamAssassin, pokud bogofilter detekuje spam, není již nutné jej posuzovat SpamAssassinem. Pokud naopak SpamAssassin detekuje spam, který bogofilteru proklouzl, může jej bogofilteru předat k učení , aby se spam s novými klíčovými slovy naučil rozeznávat. Není nám známo, zda bude Post.cz využívat v budoucnu i bogofilter.

Kudy cesta nevede

Někteří správci poštovních serverů se domnívají, že se jim podaří eliminovat spam nemilosrdným filtrováním pošty, u níž je jako odesílatel uvedena adresa v doméně některého freemailu. Účinnost této metody je chabá, spammeři ale mohou podvrhnout jakukoli adresu odesílatele. Některé poštovní servery spolupracují s černými listinami serverů, které spammeři zneužívají. I tento postup může napáchat více škody než užitku, například servery freemailu Atlasu jsou v současné době neoprávněně zařazeny na černé listině SPEWS.org. SpamAssassin naštěstí hodnotí zprávu podle mnoha kritérií záoveň, pokud bychom chěli poštu filtrovat podle černých listin serverů, můžeme dát přednost černým listinám SpamCop , DSBL, ORDB či DNSRBL.