DATA-MINING
500.000 E-Mails erzählen Geschichte der Enron-Pleite
Informatiker haben den spektakulären Zusammenbruch des US-Energiehändlers Enron im Jahr 2001 untersucht. Aus 500.000 E-Mails, die vom Management verschickt wurden, filterten sie dank intelligenter Software Schlüsselpersonen und verdächtige Nachrichten heraus.
Die Pleite von Amerikas größtem Energiehändler hatte die USA erschüttert. Jahrelang hatte der Konzern seine Bilanzen frisiert: Der Gewinn wurde nach oben manipuliert, die Schulden nach unten. Im Dezember 2001 war Enron am Ende. Zu den Hinterlassenschaften des Unternehmens, das einst 100 Millarden Dollar pro Jahr umsetzte, gehörten Tausende von heute auf morgen entlassene Angestellte, die auch gleich noch um ihre Ersparnisse gebracht wurden, wenn sie diese in Enron-Aktien gesteckt hatten.
Zum Erbe der Megapleite gehören auch 517.431 E-Mails von 150 Ex-Mitarbeitern hauptsächlich aus dem Management - darunter von Chairman und CEO Kenneth Lay sowie CEO Jeffrey Skilling. Die Federal Energy Regulatory Commission (FERC), die den Fall untersuchte, veröffentlichte die Nachrichten im Mai 2002 im Web. Für Informatiker ein gefundenes Fressen.
Die E-Mails stammen aus den letzten vier Jahren vor dem Zusammenbruch, sämtliche Anhänge fehlen. Einzelne Nachrichten wurden vor der Veröffentlichung gelöscht. Mehrere Forschergruppen haben mittlerweile versucht, den Datenschatz auf die eine oder andere Weise zu heben - mit durchaus beachtlichen Erfolgen.
Bösewichte schreiben anders
Der Informatiker Parambir Singh Keila von der kanadischen Queens University in Kingston bediente sich der üblichen Textanalyse, um E-Mails mit verdächtigem Inhalt schnell aus dem riesigen Nachrichtenberg herauszufiltern. Dabei nutzte er die These, dass Angestellte, die betrügen oder illegal handeln, in ihren E-Mails zu einer anderen Wortwahl greifen als ehrliche Mitarbeiter.
Die Wortwahl spiegle unter anderem das Selbstbewusstsein und das schlechte Gewissen wider, erklärte Keila. Frühere Untersuchungen anderer Forscher, auf die sich Keila stützt, hatten ergeben, dass Menschen mit bösen Absichten in ihren Äußerungen die Ich-Form und einschränkende Begriffe wie aber, außer, ohne vermeiden. Zudem gebrauchten sie häufiger Wörter, die mit negativen Emotionen einhergehen (hassen, fürchten) und aktive Verben, schreibt Keila in seinem online veröffentlichten Paper.
Hinter der Vermeidung der Ich-Form stecke möglicherweise eine Distanzierung der Person von ihren eigenen Aussagen. Die verstärkte Nutzung aktiver Verben könne eine direkte Folge des verringerten Gebrauchs einschränkender Begriffe sein, vermutet der Informatiker.
Das alles mag zunächst sehr plump erscheinen, als Keila die E-Mails aber automatisch nach diesen Kriterien sortierte, zeigte sich Erstaunliches. Nachrichten mit vielen einschränkenden oder ausschließenden Begriffen erwiesen sich bei näherer Betrachtung als emotional gefärbte Botschaften an Kollegen, Freunde oder die eigene Familie. Viele aktive Verben fanden sich tatsächlich vor allem in verdächtigen E-Mails, in denen es um Verträge und vertrauliche Informationen ging. Selten auftretende Ich-Formen erwiesen sich hingegen als vergleichsweise schlechtes Auswahlkriterium, weil in der geschäftlichen Kommunikation das Ich generell nur selten genutzt wird.
Suche nach den Nachrichten-Hubs
Keila hält das Verfahren für gut genug, um auffällige Kommunikation zu erkennen, etwa im Kampf gegen Terroristen. Diese Nachrichten müssten freilich dann noch genauer untersucht werden, um zu entscheiden, ob die Betroffenen tatsächlich Böses im Schilde führten. Der große Vorteil der Analyse sei, dass gigantische Datenmengen automatisch klassifiziert würden und niemand die Berge von E-Mails lesen müsse. Daneben habe das Verfahren auch gut private, emotional geprägte E-Mails herausgefiltert, selbst wenn diese an Empfänger innerhalb des Unternehmens gerichtet waren.
Einen etwas anderen Ansatz zum Aufspüren der Verantwortlichen der Enron-Pleite wählte Jeffrey Heer von der University of California in Berkeley. Der Experte für Sprachverarbeitung bildete den E-Mail-Verkehr als gewaltiges Netz ab und suchte gezielt nach so genannten Hubs - auch Superspreader genannt -, die als zentrale Empfangs- und Verteilpunkte fungieren. Wer nur mit wenigen und vor allem eher zweitrangigen Leuten kommuniziert, kann nicht so tief im Enron-Sumpf drinstecken - so die These.
Jede Person bildet einen Knotenpunkt im Enron-Netz, in das Benutzer der von Heer entwickelten Software hinein- und herauszoomen können. Weil das Nachrichtennetz allein noch relativ grob ist, ordnete Heer die Mails verschiedenen Kategorien zu, etwa laufendes Geschäft, Strategie, Regulierungsangelegenheiten, interne Projekte und Firmen-Image. Jede Kategorie bekam eine eigene Farbe, so dass an der Verbindung zwischen zwei Personen erkennbar ist, über welche Themen sie sich austauschten.
Das anfangs undurchdringliche Nachrichtendickicht lässt sich mit der Software lichten, in dem alle Knoten (also Personen) mit wenig Mailverkehr ausgeblendet werden. Untergruppen, die miteinander besonders intensiv kommunizieren, sind leicht erkennbar. So verrät der E-Mail-Verkehr auch viel über die sozialen Netzwerke innerhalb des Enron-Managements.
Posteingang voll, nichts gesendet
Auf der Suche nach den Big Playern im Konzern stieß Heer unter anderem auf John Shelk, der eng mit Politikern zusammenarbeitete, vor allem in Fragen der Energiekrise in Kalifornien. Fast immer sandte Shelk Berichte dieser Treffen an einen anderen Kollegen namens Tim Belden. Die Kommunikation war sehr einseitig: Belden bekam viel Post aus dem ganzen Unternehmen, er selbst verschickte keine einzige Nachricht - zumindest war keine in der mehr als 500.000 Einträge großen Datenbank zu finden.
Wurden seine Mails gelöscht, fragte sich Heer. Und falls ja, warum? Ein Strafermittler sollte sich die Person Belden wohl etwas genauer anschauen, schreibt Heer in seiner online publizierten Studie.
Tatsächlich erwies sich Belden als eine der Schlüsselfiguren im Enron-Skandal. Timothy Belden war der frühere Chefhändler von Enron. In Prozessen gestand er, Engpässe auf dem kalifornischen Strommarkt künstlich erzeugt zu haben. Er verdiente dabei dank der überhöhte Strompreise viel Geld.
Der Informatiker Heer will den Namen Beldens zuvor noch nie gehört haben. Erst bei einer Suche im Internet habe er festgestellt, dass er den Mastermind im Energieskandal gefunden hatte.
Quelle: Spiegel.de
...be invested
Der Einsame Samariter
500.000 E-Mails erzählen Geschichte der Enron-Pleite
Informatiker haben den spektakulären Zusammenbruch des US-Energiehändlers Enron im Jahr 2001 untersucht. Aus 500.000 E-Mails, die vom Management verschickt wurden, filterten sie dank intelligenter Software Schlüsselpersonen und verdächtige Nachrichten heraus.
Die Pleite von Amerikas größtem Energiehändler hatte die USA erschüttert. Jahrelang hatte der Konzern seine Bilanzen frisiert: Der Gewinn wurde nach oben manipuliert, die Schulden nach unten. Im Dezember 2001 war Enron am Ende. Zu den Hinterlassenschaften des Unternehmens, das einst 100 Millarden Dollar pro Jahr umsetzte, gehörten Tausende von heute auf morgen entlassene Angestellte, die auch gleich noch um ihre Ersparnisse gebracht wurden, wenn sie diese in Enron-Aktien gesteckt hatten.
Zum Erbe der Megapleite gehören auch 517.431 E-Mails von 150 Ex-Mitarbeitern hauptsächlich aus dem Management - darunter von Chairman und CEO Kenneth Lay sowie CEO Jeffrey Skilling. Die Federal Energy Regulatory Commission (FERC), die den Fall untersuchte, veröffentlichte die Nachrichten im Mai 2002 im Web. Für Informatiker ein gefundenes Fressen.
Die E-Mails stammen aus den letzten vier Jahren vor dem Zusammenbruch, sämtliche Anhänge fehlen. Einzelne Nachrichten wurden vor der Veröffentlichung gelöscht. Mehrere Forschergruppen haben mittlerweile versucht, den Datenschatz auf die eine oder andere Weise zu heben - mit durchaus beachtlichen Erfolgen.
Bösewichte schreiben anders
Der Informatiker Parambir Singh Keila von der kanadischen Queens University in Kingston bediente sich der üblichen Textanalyse, um E-Mails mit verdächtigem Inhalt schnell aus dem riesigen Nachrichtenberg herauszufiltern. Dabei nutzte er die These, dass Angestellte, die betrügen oder illegal handeln, in ihren E-Mails zu einer anderen Wortwahl greifen als ehrliche Mitarbeiter.
Die Wortwahl spiegle unter anderem das Selbstbewusstsein und das schlechte Gewissen wider, erklärte Keila. Frühere Untersuchungen anderer Forscher, auf die sich Keila stützt, hatten ergeben, dass Menschen mit bösen Absichten in ihren Äußerungen die Ich-Form und einschränkende Begriffe wie aber, außer, ohne vermeiden. Zudem gebrauchten sie häufiger Wörter, die mit negativen Emotionen einhergehen (hassen, fürchten) und aktive Verben, schreibt Keila in seinem online veröffentlichten Paper.
Hinter der Vermeidung der Ich-Form stecke möglicherweise eine Distanzierung der Person von ihren eigenen Aussagen. Die verstärkte Nutzung aktiver Verben könne eine direkte Folge des verringerten Gebrauchs einschränkender Begriffe sein, vermutet der Informatiker.
Das alles mag zunächst sehr plump erscheinen, als Keila die E-Mails aber automatisch nach diesen Kriterien sortierte, zeigte sich Erstaunliches. Nachrichten mit vielen einschränkenden oder ausschließenden Begriffen erwiesen sich bei näherer Betrachtung als emotional gefärbte Botschaften an Kollegen, Freunde oder die eigene Familie. Viele aktive Verben fanden sich tatsächlich vor allem in verdächtigen E-Mails, in denen es um Verträge und vertrauliche Informationen ging. Selten auftretende Ich-Formen erwiesen sich hingegen als vergleichsweise schlechtes Auswahlkriterium, weil in der geschäftlichen Kommunikation das Ich generell nur selten genutzt wird.
Suche nach den Nachrichten-Hubs
Keila hält das Verfahren für gut genug, um auffällige Kommunikation zu erkennen, etwa im Kampf gegen Terroristen. Diese Nachrichten müssten freilich dann noch genauer untersucht werden, um zu entscheiden, ob die Betroffenen tatsächlich Böses im Schilde führten. Der große Vorteil der Analyse sei, dass gigantische Datenmengen automatisch klassifiziert würden und niemand die Berge von E-Mails lesen müsse. Daneben habe das Verfahren auch gut private, emotional geprägte E-Mails herausgefiltert, selbst wenn diese an Empfänger innerhalb des Unternehmens gerichtet waren.
Einen etwas anderen Ansatz zum Aufspüren der Verantwortlichen der Enron-Pleite wählte Jeffrey Heer von der University of California in Berkeley. Der Experte für Sprachverarbeitung bildete den E-Mail-Verkehr als gewaltiges Netz ab und suchte gezielt nach so genannten Hubs - auch Superspreader genannt -, die als zentrale Empfangs- und Verteilpunkte fungieren. Wer nur mit wenigen und vor allem eher zweitrangigen Leuten kommuniziert, kann nicht so tief im Enron-Sumpf drinstecken - so die These.
Jede Person bildet einen Knotenpunkt im Enron-Netz, in das Benutzer der von Heer entwickelten Software hinein- und herauszoomen können. Weil das Nachrichtennetz allein noch relativ grob ist, ordnete Heer die Mails verschiedenen Kategorien zu, etwa laufendes Geschäft, Strategie, Regulierungsangelegenheiten, interne Projekte und Firmen-Image. Jede Kategorie bekam eine eigene Farbe, so dass an der Verbindung zwischen zwei Personen erkennbar ist, über welche Themen sie sich austauschten.
Das anfangs undurchdringliche Nachrichtendickicht lässt sich mit der Software lichten, in dem alle Knoten (also Personen) mit wenig Mailverkehr ausgeblendet werden. Untergruppen, die miteinander besonders intensiv kommunizieren, sind leicht erkennbar. So verrät der E-Mail-Verkehr auch viel über die sozialen Netzwerke innerhalb des Enron-Managements.
Posteingang voll, nichts gesendet
Auf der Suche nach den Big Playern im Konzern stieß Heer unter anderem auf John Shelk, der eng mit Politikern zusammenarbeitete, vor allem in Fragen der Energiekrise in Kalifornien. Fast immer sandte Shelk Berichte dieser Treffen an einen anderen Kollegen namens Tim Belden. Die Kommunikation war sehr einseitig: Belden bekam viel Post aus dem ganzen Unternehmen, er selbst verschickte keine einzige Nachricht - zumindest war keine in der mehr als 500.000 Einträge großen Datenbank zu finden.
Wurden seine Mails gelöscht, fragte sich Heer. Und falls ja, warum? Ein Strafermittler sollte sich die Person Belden wohl etwas genauer anschauen, schreibt Heer in seiner online publizierten Studie.
Tatsächlich erwies sich Belden als eine der Schlüsselfiguren im Enron-Skandal. Timothy Belden war der frühere Chefhändler von Enron. In Prozessen gestand er, Engpässe auf dem kalifornischen Strommarkt künstlich erzeugt zu haben. Er verdiente dabei dank der überhöhte Strompreise viel Geld.
Der Informatiker Heer will den Namen Beldens zuvor noch nie gehört haben. Erst bei einer Suche im Internet habe er festgestellt, dass er den Mastermind im Energieskandal gefunden hatte.
Quelle: Spiegel.de
...be invested
Der Einsame Samariter