07.03.2012

DESY und IBM entwickeln Speicherlösungen der nächsten Generation

Strategische Kooperation für innovative Technologien im Big-Data-Umfeld

Bei der Forschung an den Teilchenbeschleunigern von DESY in Hamburg fallen unvorstellbar große Datenmengen an - Informationen im Petabyte-Bereich, die erfasst, gespeichert, verwaltet und ausgewertet werden müssen. Dies erfordert absolute Höchstleistungen von Speichermedien. Das größte deutsche Beschleunigerzentrum und der Computerkonzern IBM haben jetzt eine strategische Kooperation vereinbart, um gemeinsam innovative Datenspeicherlösungen der nächsten Generation zu entwickeln. Ziel ist das Höchstleistungs-Datenmanagement im Petabyte-Bereich, um für die zukünftigen Anforderungen im Big-Data-Umfeld optimal gewappnet zu sein. Eine entsprechende Kooperationsvereinbarung wurde heute auf der Computermesse CeBIT in Hannover unterzeichnet.

Das neue SONAS-System im DESY-Rechenzentrum

Bei DESY (Deutsches Elektronen-Synchrotron), einem der weltweit führenden Beschleunigerzentren und Mitglied der Helmholtz-Gemeinschaft, werden große Teilchenbeschleuniger entwickelt, gebaut und betrieben, um damit die Struktur der Materie zu erforschen - von der biologischen Zelle bis zu den Bausteinen der Atomkerne. Dabei hat es DESY seit jeher mit gewaltigen Datenmengen zu tun, nicht nur von den eigenen Großforschungsanlagen wie dem Röntgenlaser FLASH und der weltweit brillantesten Röntgenquelle PETRA III, sondern aktuell auch etwa vom Large Hadron Collider (LHC) am europäischen Teilchenforschungszentrum CERN bei Genf.

Mit dem Scale Out Network Attached Storage (SONAS) von IBM hat DESY kürzlich eine Speicherlösung der neuesten Generation in Betrieb genommen, die sich durch hohe Skalierbarkeit, schnelle Speicherung und eine effiziente Verwaltung auch mehrerer Petabyte auszeichnet. SONAS muss bei DESY Datenmengen jenseits der 20 Petabyte bewältigen. Zum Vergleich: Ein Petabyte sind eine Billiarde Byte, das entspricht rund 200 000 herkömmlichen DVDs. Doch nicht nur das Datenvolumen, auch die Zugriffszeit und die Übertragungsgeschwindigkeit sind entscheidende Faktoren. Für die Auswertung der wissenschaftlichen Messdaten sind Transferraten von bis zu 10 Gigabyte pro Sekunde nötig - das entspricht zwei DVDs pro Sekunde.

Gemeinsam entwickeln und erproben DESY und IBM nun neue Verfahren zum weltweiten Datenaustausch zwischen Forschungszentren. Forscher aus aller Welt sollen etwa über Web-Protokolle wie HTTPS und REST sicher auf große Mengen unstrukturierter Daten zugreifen können, die in SONAS gespeichert sind. Ziel ist es auch, die Eignung des Systems für sogenannte Cloud-Speicher im Forschungsumfeld zu testen.

"DESY bringt seine jahrzehntelange Expertise im Datenmanagement ein und bietet ein ideales Testumfeld unter Praxisbedingungen. Im Gegenzug verbessern die Entwicklungen im Rahmen der Kooperation direkt unsere wissenschaftliche Leistungsfähigkeit", unterstreicht DESY-Forschungsdirektor Prof. Joachim Mnich. "Die enge Zusammenarbeit mit DESY und die im Rahmen des Projekts gestellten Anforderungen helfen uns dabei, zukünftige Generationen der Technologie noch besser auf spezielle Bedürfnisse von Kunden abstimmen zu können", betont Bernd Blaudow, Leiter der Speicherentwicklung im IBM Forschungs- und Entwicklungszentrum.

"DESY hat eine lange, fast 50 Jahre alte Tradition im Management größter Datenmengen", betont der Leiter der Abteilung Informationstechnologie (IT) bei DESY, Dr. Volker Gülzow. DESY speichert und verwaltet nicht nur die Daten der eigenen Großforschungsanlagen, DESY ist auch ein sogenanntes TIER-2-Rechenzentrum für die Experimente des Large Hadron Colliders (LHC). Die LHC-Detektoren können vom DESY aus gesteuert werden, und LHC-Messdaten werden auch bei DESY gespeichert und von Forschern aus aller Welt analysiert. Mit dem System dCache hat DESY gemeinsam mit dem US-Beschleunigerzentrum Fermilab und der Nordic DataGrid Facility NDGF bereits eine Pionierlösung für das Management großer Datenmengen entwickelt. "Heute liegen rund die Hälfte der LHC-Daten auf dCache-Systemen", betont DESY-Forschungsdirektor Prof. Joachim Mnich.

Mit dem europäischen Röntgenlaser European XFEL, dessen Hauptgesellschafter DESY ist, werden die Anforderungen an das Datenmanagement künftig noch deutlich steigen. Jeder einzelne der European-XFEL-Detektoren wird 10 bis 40 Gigabyte Daten pro Sekunde liefern, das jährliche Datenvolumen wird damit allein beim European XFEL bis zu 50 Petabyte erreichen - umgerechnet ein DVD-Stapel von zwölf Kilometern Höhe.

Teil der Vereinbarung ist auch eine intensive technische Unterstützung des Projekts durch die SONAS-Experten des deutschen IBM Forschungs- und Entwicklungszentrums. "Wir sehen weitere Einsatzgebiete in datenintensiven Web 2.0-Applikationen, unter anderem im Gesundheitsbereich sowie bei digitalen Medien", sagt Frank Bröde, Leiter IBM SONAS-Entwicklung in Mainz.