APEmille Rechner erfolgreich in Betrieb genommen

APEmille-Einheit

Fundamentale Wechselwirkungen werden in der theoretischen Teilchenphysik durch Eichtheorien, wie der Quantenchromodynamik (QCD), beschrieben. Diese führen zu sehr komplexen Rechenproblemen, die meist nicht mit analytischen Methoden lösbar sind. Den wohl aussichtsreichsten Lösungsweg stellen numerische Simulationen auf Raumzeitgittern dar. Der riesige Bedarf an Rechenleistung kann aber mit den leistungsfähigsten verfügbaren Rechnern nur teilweise gedeckt werden und erfordert daher die Entwicklung von Spezialrechnern.

Bei DESY Zeuthen sind seit 1994 massiv parallele Rechner vom Typ APE100 im Einsatz. Die 896 Processoren entsprechen einer maximalen CPU Leistung von 43 Gflops (1 Gflops : 109 Floatingpoint Operationen pro Sekunde). DESY stellt diese Rechner im Rahmen des gemeinsam mit dem Forschungszentrum Jülich betriebenen NIC (John von Neumann Institut für Computing) den Kollaborationen, die auf dem Gebiet Gitterfeldtheorie arbeiten, zur Verfügung.

Der neue Parallelrechner "APEmille" wurde gemeinsam von Projektgruppen des INFN und DESY Zeuthen entwickelt. Dieser Rechner ist für eine Spitzenleistung von bis zu 1 Tflops ausgelegt und besitzt gegenüber der APE100 verschiedene Verbesserungen, z.B. ein flexibleres Kommunikationsnetzwerk, 64 – bit Arithmetik und lokale Adressierung. Wie auch die früheren APE Generationen, besitzt APEmille eine "Single Instruction Multiple Data" (SIMD) Architektur. Der von Physikern am INFN entworfene Floatingpoint Prozessor kann in jedem Taktzyklus eine sog. Normaloperation, a x b + c, mit komplexen Operanden ausführen. DESY hat besonders zu den Bereichen Software, Tests und schnelle Kommunikationslinks beigetragen.

In Zeuthen wurden in den letzten Wochen das erste Teilsysteme von APEmille aufgebaut. Das bisherige "Einfahren'' der Hardware ging äußerst zügig. Inzwischen sind 160 Prozessoren mit einer maximalen Rechenleistung von insgesamt 80 Gflops in Betrieb und werden mit Physik-Programmen getestet. Erste Messungen der bei realistischen Parallelanwendungen erzielbaren Leistung sind vielversprechend: Ein sorgfältig optimiertes Programm, das den Kern üblicher QCD-Programme bildet, und bei dem die Prozessoren in der Sekunde über 2 Gbyte an Daten austauschen, rechnet auf APEmille mit 58 % Effizienz. Auch ein erstes komplettes Physikprogramm, das die Energieabhängigkeit der starken Kopplungskonstanten berechnet, läuft problemlos auf einer Maschine mit 128 Prozessoren. Die Ergebnisse sind in Übereinstimmung mit publizierten Resultaten (berechnet auf den seit 1994 in Zeuthen eingesetzten APE100 Computern) und bit-genauen Referenz Simulationen.

In den nächsten 12 Monaten ist es vorgesehenen die APEmille Installation auf ca. 440 Gflops auszubauen. Dies entspricht gegenüber der bisherigen APE100 Installation etwa einer Verzehnfachung der Rechenleistung.

Das Bild zeigt ein APEmille Crate mit einem herausgezogenen Processerboard (12 U). Die 8 Processing Units, deren Kernstück die Floating Point Processoren bilden sind, belegen den Mittelteil des Boards. Die Spitzenleistung eines Boards beträgt insgesamt 4 Gflops. Mit einem QCD Programm wurden 2.4 Gflops reale Rechenleistung erreicht.