pte20110311003 Technologie/Digitalisierung, Politik/Recht

Software identifiziert Autoren anonymer E-Mails

Methode nutzt Stilmuster als Hilfe für Gerichtssachverständige


E-Mail: Markante Mustur verraten annoyme Autoren (Foto: flickr.com, Bev Sykes)
E-Mail: Markante Mustur verraten annoyme Autoren (Foto: flickr.com, Bev Sykes)

Montreal (pte003/11.03.2011/06:10) Kanadische Forscher haben ein Tool entwickelt, das anhand von sprachlichen Stilmustern die Autoren anonymer E-Mails identifizieren kann. Das ist als Unterstützung für linguistische Forensiker gedacht und den Informatikern zufolge auch vor Gericht verwertbar.
"Unsere Software hilft den Sachverständigen, die Muster effizienter zu identifizieren", erklärt Benjamin Fung, Professor für Information Systems Engineering an der Concordia University http://concordia.ca , gegenüber pressetext. Der Ansatz soll also helfen, Cyberverbrecher schneller hinter Schloss und Riegel zu bringen.

Anonyme Verbrecher

"Wir haben in den letzten Jahren einen alarmierenden Anstieg an Cyberverbrechen erlebt, die anonyme E-Mails nutzen", sagt Fung. Das umfasst Drohungen ebenso wie die Verteilung von Kinderpornos, den Virenversand oder einfach kriminelle Kommunikation. Selbst, wenn die Behörden trotz Verschleierungsmaßnahmen wie gefälschten Headern den Ursprung einer E-Mail zurückverfolgen können, führt das aber oft zu einem großen Kreis an Verdächtigen, beispielsweise im Fall öffentlicher Computer. Dann gilt es, den tatsächlichen Verfasser zu ermitteln. Genau dabei verspricht das neue Tool Erleichterungen.

Das Concordia-Teams setzt auf Techniken aus den Bereichen Spracherkennung und Data Mining. Die Methode sucht in E-Mails nach auffallenden Mustern wie beispielsweise wiederkehrenden Rechtschreibfehlern oder einer durchgehenden Kleinschreibung. Muster, die in Vergleichsproben aller Verdächtigen vorkommen, werden verworfen. So ergibt sich ein "Schreib-Abdruck", der ähnlich charakteristisch ist wie ein Fingerabdruck. Damit wird es möglich, den Verfasser zu bestimmen oder Ermittlern zumindest ein Täterprofil zu bieten. Denn die Methode kann laut Fung Geschlecht, Nationalität und Bildungsgrad einschätzen.

Skandal-Test

Um die Software zu testen, haben die Forscher das "Enron E-Mail Dataset" genutzt. Dieses umfasst über 200.000 echte E-Mails von 158 Autoren, die im Rahmen der Ermittlungen im Skandal um den Energiekonzern Enron gesammelt wurden. Je nach Feineinstellungen des Tools war es dabei möglich, anhand von je zehn Vergleichs-E-Mails von zehn möglichen Autoren den Verfasser einer Nachricht mit bis zu 90-prozentiger Sicherheit zu ermitteln. Das kann den Informatikern zufolge die Arbeit linguistischer Forensiker deutlich leichter machen.

Das Anwendungspotenzial des Tools ist Lung zufolge groß. "Die aktuelle Umsetzung funktioniert nur auf Englisch, aber die Methode ist auf alle Sprachen mit lateinischer Schrift anwendbar", meint er gegenüber pressetext. Zudem sind die genutzten Algorithmen theoretisch auch geeignet, um die Verfasser anderer Texte wie beispielsweise anonymer SMS zu ermitteln. "Die Frage ist, wie effektiv das wäre. Daran arbeiten wir noch."

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Thomas Pichler
Tel.: +43-1-81140-303
E-Mail: pichler@pressetext.com
Website: www.pressetext.com
|