Spamfilter
Ein Spamfilter ist ein Computerprogramm, das versucht, unerwünschte Werbe-E-Mails (Spam) auszufiltern. Dabei gibt es mehrere unterschiedliche Methoden:
- aussortieren an Hand regulärer Ausdrücke, so genannter Blacklists
- ausfiltern mittels eines Bayes-Filter
- ausfiltern mittels einer datenbank-basierten Lösung DB-Filter
| Inhaltsverzeichnis |
Blacklist-Methode
Diese Methode überprüft den Inhalt der E-Mail nach bestimmten Ausdrücken bzw. Stichworten. Ist der Ausdruck bzw. das Stichwort in der E-Mail enthalten, wird die E-mail aussortiert. Die Ausdrücke sind in sog. Blacklists aufgelistet. Diese Blacklists müssen im Allgemeinen manuell erstellt werden und sind entsprechend aufwendig zu verwalten. Ausserdem ist die Trefferquote nicht sehr hoch, da hin und wieder Spam als gute E-Mail und gute E-Mail als Spam einsortiert wird. Auch lassen sich solche Filter leicht umgehen: steht z.B. 'Viagra' in der Blacklist, wird der Filter 'Vla*gr-a' nicht erkennen. Lässt der Filter die Eingabe von Regulären Ausdrücken zu, kann man jedoch entsprechend ausgefeilte Filtermuster verwenden, die alle denkbaren Schreibweisen berücksichtigen, z.B. 'v.{0,1}[!iíì1\|l].{0,1}[aáàãå@].{0,1}g.{0,1}r.{0,1}[aáàãå@]'
Eines der bekanntesten Programme unter Linux und anderen Unix-Derivaten ist SpamAssassin, das jede Mail nach verschiedenen Kriterien (offensichtlich ungültige Absender, bekannte Spam-Textpassagen, HTML-Inhalt, in die Zukunft datierte Absendedaten etc.) bepunktet und ab einer bestimmten Punktzahl als Spam klassifiziert. Ebenfalls mit Blacklistst arbeitet SPAVI, das außer der jeweiligen E-Mail selbst auch noch die in der E-Mail verlinkten Seiten auf verdächtige Begriffe untersucht.
Razor und Pyzor sind zwei Programme, die zu jeder Mail einen Hash-Wert erzeugen und in zentralen Datenbanken überprüfen, ob andere Personen, die diese Mail ebenfalls erhalten haben, sie als Spam klassifiziert haben oder nicht.
Bayes-Filter-Methode
Alternativ kann der Spam auch auf Grund der Bayesschen Wahrscheinlichkeit gefiltert werden. Das sind sog. selbstlernende Filter. Der Benutzer muss etwa die ersten 1000 E-Mails manuell einsortieren in Spam und Nicht-Spam. Danach erkennt das System fast selbstständig mit einer Trefferquote von meist über 95% die Spam-E-Mail. Vom System fehlerhaft einsortierte E-Mails muss der Anwender manuell nachsortieren. Dadurch wird die Trefferquote stetig erhöht. Diese Methode ist heute der Blacklist-Methode meist deutlich überlegen.
Diesen Mechanismus machen sich Bogofilter und Mozilla Mail, sowie der vor allem im deutschen Sprachraum beliebte Spamihilator in den aktuellen Versionen zu Nutze. Dabei muss das Programm jeweils vom Benutzer trainiert werden, bevor es zuverlässig Spam erkennt.
Weitere populäre, kostenlose Vertreter dieser Methode sind: k9 von keir.net und popfile.
Eine große Wahrscheinlichkeit, Spam zu erkennen, haben Programme wie Spamihilator. Diese Programme arbeiten hauptsächlich mit baysischen Filtern, aber auch mit - vom Benutzer / von der Benutzerin ausgewählten Plugins. Diese können einige Spam-E-Mails anhand von bestimmenten charakeristischen Merkmalen erkennen.
Siehe auch: Bayes-Filter, Idiotenfalle
Datenbank-basierte Lösungen
Im Usenet wurde schon in den 90er Jahren diskutiert, Spam aufgrund der in der Mail beworbenen URLs (und ggf. Telefonnummern) zu erkennen. Zwar können die Spammer die Nachrichten beliebig modifizieren und personalisieren, aber da es letztlich (bei UCE) immer darum geht, den Benutzer zu einer Kontaktaufnahme zu verleiten, und der mögliche Adressraum nicht unbegrenzt variabel ist, ermöglicht dieser Ansatz eine theoretisch sehr gute Erkennung. Besonders interessant ist dabei ja, dass keine Heuristiken verwendet werden, welche immer das Risiko von Fehl-Erkennungen mit sich bringen. Aufgrund der technischen Anforderungen, Reaktionsgeschwindigkeiten etc. hielt man dies jedoch für nicht praktikabel. Der Spamfilter SpamStopsHere basiert (als zentral gehostete Lösung) im Kern jedoch auf genau dieser Idee und zeigt, dass dies durchaus auch in der Praxis funktionieren kann.
Weblinks
- http://sina.eetezadi.de/?id=16 Artikel zur Vermeidung von Spam ohne zusätzliche Software oder Filter.
- http://www.spamassassin.org - Spamassassin
- http://razor.sourceforge.net - Razor
- http://pyzor.sourceforge.net - Pyzor
- http://bogofilter.sourceforge.net - Bogofilter
- http://www.spamihilator.com - Spamihilator
- http://www.spavi.de - Webmailer mit integriertem Spam- und Virenfilter
- http://www.Virenschutz.info - Virendatenbank sowie Techniklexikon und Virenschutztutorials
- http://www.keir.net/k9.html - K9
- http://popfile.sourceforge.net - popfile
- http://www.despam.tk/ - DeSPAM Tunnel: Intelligenter Bayes-Filter der German Computer Freaks für POP3 Accounts
- http://spamstopshere.de - SpamStopsHere, datenbank-basierte Lösung
