Gespräch mit der Physikerin Manuela Campanelli über das neue Hochleistungs-Computernetz "Grid"
Wenn die Datenübertragung im Rechnernetz genauso schnell erfolgt wie zwischen den verschiedenen Komponenten der einzelnen Computer (Prozessor, Festplatte, Soundkarte, usw.), lösen sich die einzelnen Rechner auf und verschmelzen mit dem Netz zum Metacomputer oder, wie es jetzt auch genannt wird, zu einem Grid - vorausgesetzt, sie verstehen einander.
Neben den schnellen Datennetzen, die zum Teil bereits realisiert sind und in wenigen Jahren Übertragungsraten bis zu 40 Gigabit pro Sekunde erreichen sollen, ist das Realisierung dieser Vision daher in erster Linie ein Softwareproblem. Mehrere hundert Wissenschaftler in aller Welt arbeiten derzeit an der Entwicklung dieser Middleware, die in Zukunft die Zusammenschaltung beliebiger Rechnerressourcen nach Bedarf ermöglichen soll.
Es ist auch höchste Zeit: Immer mehr Wissenschaftsdisziplinen produzieren Datenmengen, die mit traditionellen Methoden nicht mehr verarbeitet werden können. Astronomische Observatorien ( Gaia lernt sehen), die regelmäßig den gesamten Himmel in mehreren Frequenzbereichen abtasten, sind auf das Word Wide Grid ebenso angewiesen wie die Physiker, die ab 2006 am Europäischen Kernforschungszentrum CERN mit dem neuen Teilchenbeschleuniger Large Hadron Colliderexperimentieren wollen ( Vom World Wide Web zum World Wide Grid). Bei der Suche nach dem Higgs-Teilchen, das Aufschluss über den Ursprung der Masse bringen soll, werden Daten in der Größenordnung von mehreren Petabyte (Millionen Gigabyte) pro Jahr anfallen. Auf CD gepresst würde das einen mehrere Kilometer hohen Turm ergeben - das ist selbst für die größten Supercomputer zu viel.
Hans-Arthur Marsiske sprach mit Manuela Campanelli, Physikerin am Albert-Einstein-Institut in Golm und Mitarbeiterin im Grid Physics Network (GriPhyN>, über das neue Hochleistungs-Computernetz "Grid".
Frau Campanelli, da Sie sich als Physikerin mit Gravitationswellen beschäftigen und Kollisionen von Schwarzen Löchern simulieren, wüsste ich zunächst gerne, warum diese Simulationen so kompliziert sind. Können Sie uns den mathematischen Aufwand veranschaulichen?
Manuela Campanelli: Schwarze Löcher und Gravitationswellen sind grundlegende Voraussagen aus Einsteins allgemeiner Relativitätstheorie. Ihr experimenteller Nachweis wird sicher mit einem Nobelpreis ausgezeichnet werden. Um herauszufinden, wie Schwarze Löcher kollidieren, müssen die Forscher Einsteins Gleichungen im Bereich des hochdynamischen, extrem starken Schwerefelds lösen, was nur mit Hilfe von Computersimulationen möglich ist. Solche Simulationen erfordern gewaltige Computer und ausgefeilte Software, weil Einsteins Gleichungen ein sehr kompliziertes System aus zehn miteinander gekoppelten, nicht-linearen, partiellen Differentialgleichungen zweiter Ordnung bilden. Die können nur numerisch mit entsprechend komplexer Software auf leistungsfähigen Supercomputern gelöst werden. Vor Kurzem ist es einem Team junger Forscher an unserem Institut, dem "Lazarus-Team", gelungen, die bei der Vereinigung zweier Schwarzer Löcher entstehende Strahlung detaillierter und zuverlässiger vorherzusagen als je zuvor. Sie können das in Physical Review Letters, Vol 87, 121103 (2001), nachlesen.
Sie und auch Wissenschaftler in anderen Disziplinen wollen sich zukünftig stärker auf das sogenannte "Grid Computing" stützen. Was ist das Besondere an Grids und inwiefern unterscheiden sie sich von traditionellen Computern? Könnte man stattdessen nicht einen einzigen, großen Supercomputer bauen?
Manuela Campanelli: Der Bedarf, sehr komplexe Probleme zu lösen, hat in allen wissenschaftlichen Disziplinen, wie Physik, Biologie, Astronomie und Ingenieurwissenschaften, so dramatisch zugenommen, dass heute selbst große Supercomputer nicht mehr ausreichen. Die Verbindung von Computern in der ganzen Welt über ein neues, schnelles "Super-Internet", wie das Grid, wird eine neue Generation ungemein leistungsfähiger Maschinen hervorbringen. Hinzu kommt, dass der exklusive Einsatz von Supercomputern häufig sehr teuer ist und sie auch nicht immer zur Verfügung stehen.
Grid Computing wird es den Wissenschaftlern in aller Welt ermöglichen, große Netzwerke billigerer und weniger leistungsfähigerer, aber dafür verfügbarer Prozessoren zu nutzen. Grid Computing wird es den über die ganze Welt verstreuten Wissenschaftlern ermöglichen, die gewaltigen Mengen an Daten zu betrachten und zu analysieren, die bei Experimenten zur Hochenergie- und Nuklearphysik, Forschungen zu Gravitationswellen, in der Astronomie, Biologie und in anderen Bereichen anfallen. Große Netzwerke billiger und weniger leistungsfähiger Prozessoren sind schon seit langem als natürliche Alternative zu Supercomputern empfohlen worden, aber bislang fehlte es an der Technologie, die in der Lage ist, solche verteilten Computerressourcen zu nutzen. Es ist das Ziel des Grid Computing, diese Technologien zur Verfügung zu stellen.
Worin bestehen die Hauptschwierigkeiten beim Bau eines Grids?
Manuela Campanelli: Das Ziel des Grid Computing ist es, so viele Computer wie möglich zur Lösung komplexer wissenschaftlicher Probleme zu nutzen. Diese Computer werden im allgemeinen verschiedener Bauart sein und können über den ganzen Globus verteilt sein. Um miteinander kommunizieren zu können, müssen sie daher in der Lage sein, die gleiche Sprache zu sprechen.
Gibt es für die Inbetriebnahme des World Wide Grid einen Zeitplan?
Manuela Campanelli: Gegenwärtig arbeiten viele akademisch orientierte Grid-Projekte auf der ganzen Welt an der Inbetriebnahme erster Prototypen. Das US-Projekt GriPhyN ( Grid Physics Network> zum Beispiel befindet sich im zweiten Jahr eines fünfjährigen Entwicklungsplans, an dessen Ende es der akademischen Forschung eine Rechenkapazität zur Verfügung stellen will, die mindestens um das Tausendfache über der jedes anderen, gegenwärtig existierenden Netzwerks liegt.
Was das World Wide Grid betrifft, so entwickelt sich die Informationstechnologie gegenwärtig sehr schnell. Die Regierungen Europas und der USA geben für die kürzlich begonnen Projekte wie das European DataGrid und das International Virtual Data Grid Laboratory ( iVDGL mehrere Millionen Dollar aus.
Inwieweit können Sie auf Technologien von Parallelrechnern aufbauen?
Manuela Campanelli: Das Grid-Konzept ist weit komplexer als das des Parallelcomputers. Die Idee des Grid Computing ist es, eine große Vielfalt von Prozessoren zu nutzen, die über die ganze Welt verteilt und durch unterschiedliche Netzwerke miteinander verbunden sind. Beim Parallelrechnen nutzen wir dagegen typischerweise große, an einem Ort befindliche Supercomputer mit einer einheitlichen Rechnerumgebung, also baugleichen Prozessoren und Netzwerkverbindungen.
Inwieweit stützen Sie sich auf Internet-Technologien?
Manuela Campanelli: Das Grid wird eine Erweiterung des Internet sein. Das Internet ist ein Werkzeug, das uns den Austausch von Dateien über gewöhnliche Telefonverbindungen erlaubt. Jeder kann heutzutage das Internet nutzen. Das Grid wird sehr viel mehr Möglichkeiten bieten. Und es wird Ultra-Hochgeschwindigkeitsnetze nutzen, die die großen Laboratorien in den USA, Europa und Asien miteinander verbinden, um gewaltige Mengen hochkomplexer Daten auszutauschen. Letztlich wird das Grid den Nutzern in ähnlich transparenter Weise zugänglich sein wie heute das Elektrizitätsnetz.
Wie organisieren Sie den Austausch von Speicherkapazität und Rechenzeit zwischen verschiedenen Computern? Wird es besondere Abrechnungsschemata geben oder eine Art "Datenwährung"?
Manuela Campanelli: Jeder Rechenjob und jede Dateneinheit werden ihren eigenen Namen oder Identifikationsnummer haben.
Das Grid ist zwar in erster Linie ein wissenschaftliches Projekt, wie beim Internet wird es aber mit großer Sicherheit unerwartete Entwicklungen geben. Gibt es Bestrebungen, die kulturellen, sozialen und politischen Auswirkungen des Grid abzuschätzen?
Manuela Campanelli: Das ist eine sehr schwierige Frage. Es ist unmöglich, genau vorherzusehen, was passieren wird, wenn das Grid allgemein zugänglich wird. Vor 15 Jahren nutzte ich als junge Physikstudentin bereits das Internet, um mit anderen Wissenschaftlern in aller Welt zu kommunizieren. Damals diente das Internet vorrangig wissenschaftlichen Zwecken. Niemand hätte vorhersagen können, was heute passiert. Jetzt, 15 Jahre später, habe ich das Gefühl, erneut den Beginn eines neuen Zeitalters mitzuerleben.
Sie kennen vermutlich James Lovelocks Gaia-Hypothese, die den Planeten Erde als ein Lebewesen betrachtet. Man könnte nun sagen, dass Gaia mit dem Grid sein eigenes, globales Gehirn entwickelt. Was halten Sie von dieser Idee?
Manuela Campanelli: Nun, das Grid hat nur insofern Ähnlichkeit mit Gaia, als es Rechnerleistung über die ganze Welt miteinander verbindet. Aber lassen Sie uns nicht vergessen, dass das Grid von Menschen betrieben wird und wir vorläufig noch keine Künstliche Intelligenz haben. Fürs Erste ziehe ich den Vergleich mit dem Internet vor.
Wenn die Datenübertragung im Rechnernetz genauso schnell erfolgt wie zwischen den verschiedenen Komponenten der einzelnen Computer (Prozessor, Festplatte, Soundkarte, usw.), lösen sich die einzelnen Rechner auf und verschmelzen mit dem Netz zum Metacomputer oder, wie es jetzt auch genannt wird, zu einem Grid - vorausgesetzt, sie verstehen einander.
Neben den schnellen Datennetzen, die zum Teil bereits realisiert sind und in wenigen Jahren Übertragungsraten bis zu 40 Gigabit pro Sekunde erreichen sollen, ist das Realisierung dieser Vision daher in erster Linie ein Softwareproblem. Mehrere hundert Wissenschaftler in aller Welt arbeiten derzeit an der Entwicklung dieser Middleware, die in Zukunft die Zusammenschaltung beliebiger Rechnerressourcen nach Bedarf ermöglichen soll.
Es ist auch höchste Zeit: Immer mehr Wissenschaftsdisziplinen produzieren Datenmengen, die mit traditionellen Methoden nicht mehr verarbeitet werden können. Astronomische Observatorien ( Gaia lernt sehen), die regelmäßig den gesamten Himmel in mehreren Frequenzbereichen abtasten, sind auf das Word Wide Grid ebenso angewiesen wie die Physiker, die ab 2006 am Europäischen Kernforschungszentrum CERN mit dem neuen Teilchenbeschleuniger Large Hadron Colliderexperimentieren wollen ( Vom World Wide Web zum World Wide Grid). Bei der Suche nach dem Higgs-Teilchen, das Aufschluss über den Ursprung der Masse bringen soll, werden Daten in der Größenordnung von mehreren Petabyte (Millionen Gigabyte) pro Jahr anfallen. Auf CD gepresst würde das einen mehrere Kilometer hohen Turm ergeben - das ist selbst für die größten Supercomputer zu viel.
Hans-Arthur Marsiske sprach mit Manuela Campanelli, Physikerin am Albert-Einstein-Institut in Golm und Mitarbeiterin im Grid Physics Network (GriPhyN>, über das neue Hochleistungs-Computernetz "Grid".
Frau Campanelli, da Sie sich als Physikerin mit Gravitationswellen beschäftigen und Kollisionen von Schwarzen Löchern simulieren, wüsste ich zunächst gerne, warum diese Simulationen so kompliziert sind. Können Sie uns den mathematischen Aufwand veranschaulichen?
Manuela Campanelli: Schwarze Löcher und Gravitationswellen sind grundlegende Voraussagen aus Einsteins allgemeiner Relativitätstheorie. Ihr experimenteller Nachweis wird sicher mit einem Nobelpreis ausgezeichnet werden. Um herauszufinden, wie Schwarze Löcher kollidieren, müssen die Forscher Einsteins Gleichungen im Bereich des hochdynamischen, extrem starken Schwerefelds lösen, was nur mit Hilfe von Computersimulationen möglich ist. Solche Simulationen erfordern gewaltige Computer und ausgefeilte Software, weil Einsteins Gleichungen ein sehr kompliziertes System aus zehn miteinander gekoppelten, nicht-linearen, partiellen Differentialgleichungen zweiter Ordnung bilden. Die können nur numerisch mit entsprechend komplexer Software auf leistungsfähigen Supercomputern gelöst werden. Vor Kurzem ist es einem Team junger Forscher an unserem Institut, dem "Lazarus-Team", gelungen, die bei der Vereinigung zweier Schwarzer Löcher entstehende Strahlung detaillierter und zuverlässiger vorherzusagen als je zuvor. Sie können das in Physical Review Letters, Vol 87, 121103 (2001), nachlesen.
Sie und auch Wissenschaftler in anderen Disziplinen wollen sich zukünftig stärker auf das sogenannte "Grid Computing" stützen. Was ist das Besondere an Grids und inwiefern unterscheiden sie sich von traditionellen Computern? Könnte man stattdessen nicht einen einzigen, großen Supercomputer bauen?
Manuela Campanelli: Der Bedarf, sehr komplexe Probleme zu lösen, hat in allen wissenschaftlichen Disziplinen, wie Physik, Biologie, Astronomie und Ingenieurwissenschaften, so dramatisch zugenommen, dass heute selbst große Supercomputer nicht mehr ausreichen. Die Verbindung von Computern in der ganzen Welt über ein neues, schnelles "Super-Internet", wie das Grid, wird eine neue Generation ungemein leistungsfähiger Maschinen hervorbringen. Hinzu kommt, dass der exklusive Einsatz von Supercomputern häufig sehr teuer ist und sie auch nicht immer zur Verfügung stehen.
Grid Computing wird es den Wissenschaftlern in aller Welt ermöglichen, große Netzwerke billigerer und weniger leistungsfähigerer, aber dafür verfügbarer Prozessoren zu nutzen. Grid Computing wird es den über die ganze Welt verstreuten Wissenschaftlern ermöglichen, die gewaltigen Mengen an Daten zu betrachten und zu analysieren, die bei Experimenten zur Hochenergie- und Nuklearphysik, Forschungen zu Gravitationswellen, in der Astronomie, Biologie und in anderen Bereichen anfallen. Große Netzwerke billiger und weniger leistungsfähiger Prozessoren sind schon seit langem als natürliche Alternative zu Supercomputern empfohlen worden, aber bislang fehlte es an der Technologie, die in der Lage ist, solche verteilten Computerressourcen zu nutzen. Es ist das Ziel des Grid Computing, diese Technologien zur Verfügung zu stellen.
Worin bestehen die Hauptschwierigkeiten beim Bau eines Grids?
Manuela Campanelli: Das Ziel des Grid Computing ist es, so viele Computer wie möglich zur Lösung komplexer wissenschaftlicher Probleme zu nutzen. Diese Computer werden im allgemeinen verschiedener Bauart sein und können über den ganzen Globus verteilt sein. Um miteinander kommunizieren zu können, müssen sie daher in der Lage sein, die gleiche Sprache zu sprechen.
Gibt es für die Inbetriebnahme des World Wide Grid einen Zeitplan?
Manuela Campanelli: Gegenwärtig arbeiten viele akademisch orientierte Grid-Projekte auf der ganzen Welt an der Inbetriebnahme erster Prototypen. Das US-Projekt GriPhyN ( Grid Physics Network> zum Beispiel befindet sich im zweiten Jahr eines fünfjährigen Entwicklungsplans, an dessen Ende es der akademischen Forschung eine Rechenkapazität zur Verfügung stellen will, die mindestens um das Tausendfache über der jedes anderen, gegenwärtig existierenden Netzwerks liegt.
Was das World Wide Grid betrifft, so entwickelt sich die Informationstechnologie gegenwärtig sehr schnell. Die Regierungen Europas und der USA geben für die kürzlich begonnen Projekte wie das European DataGrid und das International Virtual Data Grid Laboratory ( iVDGL mehrere Millionen Dollar aus.
Inwieweit können Sie auf Technologien von Parallelrechnern aufbauen?
Manuela Campanelli: Das Grid-Konzept ist weit komplexer als das des Parallelcomputers. Die Idee des Grid Computing ist es, eine große Vielfalt von Prozessoren zu nutzen, die über die ganze Welt verteilt und durch unterschiedliche Netzwerke miteinander verbunden sind. Beim Parallelrechnen nutzen wir dagegen typischerweise große, an einem Ort befindliche Supercomputer mit einer einheitlichen Rechnerumgebung, also baugleichen Prozessoren und Netzwerkverbindungen.
Inwieweit stützen Sie sich auf Internet-Technologien?
Manuela Campanelli: Das Grid wird eine Erweiterung des Internet sein. Das Internet ist ein Werkzeug, das uns den Austausch von Dateien über gewöhnliche Telefonverbindungen erlaubt. Jeder kann heutzutage das Internet nutzen. Das Grid wird sehr viel mehr Möglichkeiten bieten. Und es wird Ultra-Hochgeschwindigkeitsnetze nutzen, die die großen Laboratorien in den USA, Europa und Asien miteinander verbinden, um gewaltige Mengen hochkomplexer Daten auszutauschen. Letztlich wird das Grid den Nutzern in ähnlich transparenter Weise zugänglich sein wie heute das Elektrizitätsnetz.
Wie organisieren Sie den Austausch von Speicherkapazität und Rechenzeit zwischen verschiedenen Computern? Wird es besondere Abrechnungsschemata geben oder eine Art "Datenwährung"?
Manuela Campanelli: Jeder Rechenjob und jede Dateneinheit werden ihren eigenen Namen oder Identifikationsnummer haben.
Das Grid ist zwar in erster Linie ein wissenschaftliches Projekt, wie beim Internet wird es aber mit großer Sicherheit unerwartete Entwicklungen geben. Gibt es Bestrebungen, die kulturellen, sozialen und politischen Auswirkungen des Grid abzuschätzen?
Manuela Campanelli: Das ist eine sehr schwierige Frage. Es ist unmöglich, genau vorherzusehen, was passieren wird, wenn das Grid allgemein zugänglich wird. Vor 15 Jahren nutzte ich als junge Physikstudentin bereits das Internet, um mit anderen Wissenschaftlern in aller Welt zu kommunizieren. Damals diente das Internet vorrangig wissenschaftlichen Zwecken. Niemand hätte vorhersagen können, was heute passiert. Jetzt, 15 Jahre später, habe ich das Gefühl, erneut den Beginn eines neuen Zeitalters mitzuerleben.
Sie kennen vermutlich James Lovelocks Gaia-Hypothese, die den Planeten Erde als ein Lebewesen betrachtet. Man könnte nun sagen, dass Gaia mit dem Grid sein eigenes, globales Gehirn entwickelt. Was halten Sie von dieser Idee?
Manuela Campanelli: Nun, das Grid hat nur insofern Ähnlichkeit mit Gaia, als es Rechnerleistung über die ganze Welt miteinander verbindet. Aber lassen Sie uns nicht vergessen, dass das Grid von Menschen betrieben wird und wir vorläufig noch keine Künstliche Intelligenz haben. Fürs Erste ziehe ich den Vergleich mit dem Internet vor.