Linux Cluster beschleunigt KlimaforschungDurch den Einsatz des parallelen Lustre File Systems verkürzt sich die Laufzeit der Simulationsberechnungen in hohem Maße. Dies führt zu entsprechend höherer Effizienz in der Nutzung und ist zukunftssicher durch hohe Skalierbarkeit. Anforderung
LösungEntwicklung und Implementierung eines aus 256 Sun Fire X2200M2 Servern bestehenden Linux Clustersystems mit Sun Fire X4600M2 Servern als Frontend und Sun Fire X4500 Servern für die Speicheranbindung. Ergebnisse
Ausführliche ReferenzErfolgreiche Klimaforschung setzt höchste Rechenleistung voraus. Mit einem aus über tausend Prozessorkernen bestehenden System wurde am Deutschen Klimarechenzentrum ein Linux Cluster mit einem Hochgeschwindigkeitsnetzwerk implementiert. Auf dem System sind umfangreiche Klimaszenarien in einer völlig neuen Qualität berechenbar. Das Verständnis für globale Klimaveränderungen ist von wesentlicher Bedeutung für langfristige Entscheidungen auf unserem Planeten. Zwei führende Forschungseinrichtungen in Europa sind das Deutsche Klimarechenzentrum (DKRZ) und das Max–Planck–Institut für Meteorologie (MPI-M) in Hamburg. Dort erforschen Wissenschaftler das Erdsystem und die Wechselwirkungen von Atmosphäre, Ozean, Land und Vegetation mit Hilfe numerischer Modelle, die in Simulationen auf Hochleistungscomputern berechnet werden. In der Vergangenheit wurde die Berechnungen der Klimasimulationen im DKRZ vorwiegend auf Vektorsystemen mit einer verhältnismäßig geringen Zahl parallel genutzter Prozessoren vorgenommen. Um die Skalierung und Effizienz der eingesetzten Klimamodelle auf zukunftsweisenden hoch parallelen Rechnersystemen zu testen und zu verbessern, suchten die IT-Verantworlichen Dr. Joachim Biercamp, Leiter wissenschaftliches Rechnen am DKRZ und Rainer Weigle, Leiter Central IT–Services am MPI-M, nach einer neuen Systemlösung, die es ermöglicht, die rechenintensiven Aufgaben auf viele parallele Prozesse zu verteilen. Das neue System sollte zudem auch die hohen Speicher- und Input-Output-Anforderungen effizient erfüllen. Unter Abwägung aller Anforderungen kristallisierte sich für diesen Zweck ein Clustersystem unter Linux als die am besten geeignete Lösung heraus. Höchstgeschwindigkeit mit intelligentem Konzept Das Projekt wurde öffentlich ausgeschrieben. „ Aufgrund des schlüssigen Konzepts und des guten Preis–Leistungsverhältnisses haben wir Sun Microsystems den Auftrag erteilt, einen Linux Cluster zu implementieren, der den hohen technischen Anforderungen auch in den nächsten Jahren sicher gerecht wird“, erläutert Rainer Weigle die Entscheidung, und ergänzt „ dabei war für uns die ausgewiesene Erfahrung des Herstellers im High Performance Computing sehr wichtig“.
“
Der Hochleistungs–Cluster ist die
optimale Plattform, um unsere
Produktionsmodelle auf hoch
parallele Systeme zu portieren.
”
— Dr. Joachim Biercamp, Leiter Wissenschaftliches Rechnen Deutsches Klimazentrum
Den Kern des Systems bilden 256 Rechnerknoten des Typs Sun Fire X2200M2 Server mit jeweils zwei AMD Opteron Doppelkern–Prozessoren, die in der Summe 1024 Prozessorkerne ausmachen. Jeder Rechnerknoten enthält einen 16 Gigabyte großen Hauptspeicher. Als Frontend–Rechnerknoten fungieren fünf schnelle Sun Fire X4600M2 Server mit jeweils 8 AMD Opteron Doppelkern–Prozessoren. Zur Nutzung des schnellstmöglichen Datentransfers sind die Rechner untereinander per Double Data Rate Infiniband von Voltaire verbunden. Die Bandbreite dieser Technologie beträgt je Infiniband–Link beachtliche 20 Gigabit pro Sekunde. Paralleles Dateisystem beherrscht größte
Datenmengen Um die Interoperabilität zu dem im MPI–M eingesetzten Dateisystem Sun StorageTek QFS (Quick File System) sicherzustellen, wurden zwei Sun Fire X4200M2 Server als Gateway–Knoten installiert, die sowohl mit Lustre als auch mit QFS arbeiten. Auf diese Weise können beide Storage–Welten Ressourcen untereinander austauschen. In Verbindung mit der intelligenten Architektur erreicht die Performance des Systems den beachtlichen Wert von 5,6 Teraflops (Billionen Gleitkommaoperationen pro Sekunde). Diese hohe technische Leistungsfähigkeit ist für Anwender die Voraussetzung, die eingesetzten Simulationsmodelle in kürzerer Zeit zu verbessern und auch schneller an neue Systeme anzupassen. Einfache Bedienung - hohe Systemstabilität Über den Projektverlauf äußert sich Dr. Joachim Biercamp begeistert: „Die schnelle Inbetriebnahme des Clusters und die hohe Systemstabilität in der Produktionsphase haben uns in der Richtigkeit der Entscheidung voll bestätigt.“ |
Leistung und Effizienz
CoolThreads und Solaris 10 – verbesserte Auslastung ohne Einbußen bei der Stabilität.
Download the FREE White Paper
Read about the extra features and the benefits that GlassFish offers versus Apache Tomcat.
| ||