Wie funktioniert die Spam-Erkennung im Internet?

Jeder Betreiber einer Website kennt das Problem: Spam in den Kommentaren. Bots versenden täglich haufenweise Müll, getarnt als Kommentar. Anti-Spam-Plugins sollen uns das Leben erleichtern und Spam automatisiert rausschmeißen. Wie das bloß wieder funktioniert?

Das einzige Ziel von Spammern ist es, alles mit Werbung zu bombardieren, was nicht bei drei auf dem virtuellen Baum sitzt. Nachdem wir uns letztens erst die Erkennung von E-Mail-Spam angesehen haben, sind nun Internetseiten an der Reihe. Welche Methoden machen hier Spammern das Leben schwer?

 

Honeypot

Die Honeypot-Methode ist beim Herausfiltern von Spammern wegen ihrer Effektivität sehr beliebt. Bei dieser Methode wird dem Spammer eine Falle gestellt, der er kaum widerstehen kann: ein Eingabefeld zum Ausfüllen.

Spambots sind immer daran interessiert alle Felder auszufüllen. Dabei wird davon ausgegangen, es seien Kommentar-Felder. Der Clou: Diese Eingabefelder besitzen das Attribut „invisible“, sind also im Browser für Nutzer unsichtbar. Obendrein tragen diese Felder noch verlockende Namen wie „telephone“ oder „message“.

Füllt der Spambot also dieses Feld aus und klickt im Anschluss auf den Button zum absenden des Kommentars, so hat sich dieser als Spammer identifiziert.

Diese Methode ist sehr effektiv, da es in der Natur von Spam-Bots liegt, alles auszufüllen, was ihnen so in die Fittiche kommt.

 

Blacklists & interne Listen

Wie E-Mail-Programme auch, arbeiten viele Anti-Spam-Plugins nach sogenannten Blacklists. Diese beinhalten E-Mail- und IP-Adressen bekannter Spammer. Die IP/E-Mail-Adresse des Kommentators wird beim Absenden des Kommentars mit denen in den Blacklists abgeglichen.

Wird zudem eine interne Liste geführt, so wird jeder versuchte Spam-Angriff eingetragen und anschließend bei erneutem Kommentieren abgeglichen.

Sollte eine Übereinstimmung gefunden werden, so handelt es sich vermutlich um einen Spammer.

Das Problem mit Blacklists ist, dass Spammer ihre IP-/ und E-Mail-Adresse nicht nur immer wieder ändern, sondern auch fälschen können. So ist der Abgleich mit Blacklists mehr Indiz statt Beweis für einen Spammer.

Ferner dürfen deutsche Seiten Blacklists nur eingeschränkt bis gar nicht verwenden, da die IP-Adressen zum Abgleich weitergegeben werden. Dies ist mit dem deutschem Recht nicht ohne weiteres vereinbar.

 

Antwort-Zeit

Eine weitere Technik zur Erkennung von Spammern ist die Messung der Zeit, welche zwischen Seitenaufruf und Abschicken des Kommentars liegt.

Spambots haben keinerlei Interesse daran, sich deinen Inhalt durchzulesen. Ihr einziges Ziel ist es, Werbung in den Kommentaren zu platzieren. Dies ist auch der Grund, weswegen die Kommentarzeit zumeist weit unter zehn Sekunden liegt.

Dieses Mittel ist sehr effektiv und wird gerne eingesetzt. Man macht sich hier das typische Verhalten und den eigentlichen Vorteil von Spambots zu Nutze: Ihre Schnelligkeit.

 

Captchas

Captchas sind kleine Eingabe-Felder, die vom Nutzer die Eingabe einiger Ziffern und/oder Zahlen aus einem Bild verlangen. Diese, zugegebenermaßen etwas unelegante Möglichkeit, bietet eine verhältnismäßig hohe Sicherheit.

Spambots können Captchas zwar immer besser lösen, jedoch sind diese noch weit von jeglicher Zuverlässigkeit entfernt. Deswegen erfreuen sich Captcha-Abfragen auch immer wieder großer Beliebtheit bei Logins, Registrierungen, Kommentaren oder auch Foren.

 

Inhalte

Wie E-Mail-Programme auch, filtern viele Anti-Spam-Plugins Kommentar-Spam durch die Analyse des Textes aus. Enthält dieser viele Links, verdächtige Schlüsselwörter oder ist in einer anderen Sprache verfasst als die Seite, auf der dieser erscheint, so ist ein Spam-Versuch wahrscheinlich.

Die Spracherkennung hat jedoch oft ihre Probleme, da viele englische Begriffe mittlerweile auch im Deutschen verwendet werden. Hier besteht die Gefahr einer falschen Erkennung der Sprache.

Einige PlugIns können zudem Kommentare für bestimmter Länder sperren. Dies ist die wohl drastischte Methode, die angewendet werden kann.

 

Bayes-Filter Methode

Auch die Bayes-Filter-Methode wird bei Spam im Internet angewendet. Hier wird das Anti-Spam-PlugIn vom Nutzer durch das (de-)Markieren von Spamkommentaren trainiert um zu einem späteren Zeitpunkt besser entscheiden zu können.

Auch wenn alle Methoden zusammengenommen recht sicher wirken, so bedürfen Anti-Spam-PlugIns dennoch häufig die händische Feinjustierung.

2 Kommentare

  1. Alex L 9. Januar 2015
    • Henrik Stamm 9. Januar 2015

Was denkst du darüber?