Spamfilter
v.{0,1}[!iÃì1\|l].{0,1}[aáà ãå@].{0,1}g.{0,1}r.{0,1}[aáà ãå@]
Eines der bekanntesten Programme unter [[Linux]] und anderen [[Unix]]-Derivaten ist [[SpamAssassin]], das jede Mail nach verschiedenen Kriterien (offensichtlich ungültige Absender, bekannte Spam-Textpassagen, HTML-Inhalt, in die Zukunft datierte Absendedaten etc.) bepunktet und ab einer bestimmten Punktzahl als Spam klassifiziert. Ebenfalls mit einer Blacklist arbeitet [http://www.spavi.de SPAVI], das außer der jeweiligen E-Mail selbst auch noch die in der E-Mail verlinkten Seiten auf verdächtige Begriffe untersucht.
„Razor“ und „Pyzor“ wiederum erzeugen zu jeder Mail einen [[Hash]]-Wert und überprüfen in zentralen Datenbanken, ob andere Personen, die diese Mail ebenfalls erhalten haben, sie als Spam klassifiziert haben oder nicht.
==[[Bayes-Filter]]-Methode==
Alternativ kann der Spam auch auf Grund der [[Bayesscher Wahrscheinlichkeitsbegriff|Bayesschen Wahrscheinlichkeit]] gefiltert werden. Das sind sogenannte selbstlernende Filter. Der Benutzer muss etwa die ersten 1000 E-Mails manuell einsortieren in Spam und Nicht-Spam. Danach erkennt das System fast selbstständig mit einer Trefferquote von meist über 95% die Spam-E-Mail. Vom System fehlerhaft einsortierte E-Mails muss der Anwender manuell nachsortieren. Dadurch wird die Trefferquote stetig erhöht. Diese Methode ist der Blacklist-Methode meist deutlich überlegen.
Diesen Mechanismus machen sich Bogofilter und [[Mozilla Thunderbird]] sowie der vor allem im deutschen Sprachraum beliebte Spamihilator in den aktuellen Versionen zu Nutze. Dabei muss das Programm jeweils vom Benutzer trainiert werden, bevor es zuverlässig Spam erkennt.
Eine dem [[Bayes-Filter]] artverwandte Methode ist der [[Markov-Filter]]. Er nutzt dazu eine [[Markow-Kette]] und ist effektiver als ein [[Bayes-Filter]], wie [[Bill Yerazunis]] mit seinem Spamfilter [[CRM114]] zeigen konnte.
==Datenbank-basierte Lösungen==
Im Usenet wurde schon in den 90er Jahren diskutiert, Spam aufgrund der in der Mail beworbenen URLs (und ggf. Telefonnummern) zu erkennen. Zwar können die Spammer die Nachrichten beliebig modifizieren und personalisieren, aber da es letztlich (bei [[UCE]]) immer darum geht, den Benutzer zu einer Kontaktaufnahme zu verleiten, und der mögliche Adressraum nicht unbegrenzt variabel ist, ermöglicht dieser Ansatz eine theoretisch sehr gute Erkennung. Besonders interessant ist dabei, dass keine Heuristiken verwendet werden, welche immer das Risiko von Fehl-Erkennungen mit sich bringen.
Aufgrund der technischen Anforderungen, Reaktionsgeschwindigkeiten etc. hielt man dies jedoch für nicht praktikabel.
Der Spamfilter „SpamStopsHere“ basiert (als zentral gehostete Lösung) im Kern jedoch auf genau dieser Idee und zeigt, dass dies durchaus auch in der Praxis funktionieren kann.
==Siehe auch==
* [[SpamAssassin]]
==Weblinks==
* [http://sina.eetezadi.de/?id=16 Artikel zur Vermeidung von Spam ohne zusätzliche Software oder Filter]
* [http://www.anti-spam-tool.de Freeware-Archiv zum Thema Internetsicherheit]
* [http://www.secumail.de SecuMail externer Filterservice für Unternehmen Spamfilter]
* [http://www.thebatworld.de/modules/download/index.php?op=viewlink&cid=10 Download von Spam Mails im Unix (mbox) Format zum Training von Spamfiltern]
[[Kategorie:E-Mail]]
[[en:Mail filter]]
[[eo:Spamfiltrilo]]
[[nl:Spamfilter]]
[[sv:Skräppostfilter]]Diese Version des Artikels stammt vom 12.07.2006.
Der Inhalt dieser Seite basiert auf dem Artikel „Spamfilter“ aus der freien Enzyklop�die Wikipedia und ist unter der GNU-Lizenz f�r freie Dokumentation ver�ffentlicht. Auf der Wikipedia-Seite ist eine Liste der Autoren einzusehen.