Nutzen Sie die Leistung des schnellsten Computers der Welt

Nutzen Sie die Leistung des schnellsten Computers der Welt

Spread the love

Fotos von Evan Krape und mit freundlicher Genehmigung des US-Energieministeriums

UD Prof. Sunita Chandrasekaran spielen Studenten eine Schlüsselrolle im Exascale-Computing

Von Fast Food bis hin zu COVID-Schnelltests hat die Welt ein unerbittliches „Bedürfnis nach Geschwindigkeit“.

Die schnellste Durchfahrt in den USA in diesem Jahr mit der kürzesten durchschnittlichen Servicezeit von der Bestellung bis zum Erhalt des Essens war Taco Bell mit 221,99 Sekunden.

Das schnellste Auto, der Bugatti Chiron Super Sport 300+, raste 2019 mit 304,7 Meilen pro Stunde in die Rekordbücher und hält zum jetzigen Zeitpunkt immer noch den Titel.

Und dann ist da noch Frontier, der Supercomputer im Oak Ridge National Lab des US-Energieministeriums in Oak Ridge, Tennessee. Im Mai 2022 wurde er mit 1,1 Exaflops zum schnellsten Computer der Welt gekürt, was mehr als einer Trillion Berechnungen pro Sekunde entspricht. Das sind eine ganze Menge mathematischer Probleme, die es zu lösen gilt – mehr als 1.000.000.000.000.000.000 davon – im Handumdrehen, eine Leistung, die Frontier den begehrten Status als erster Computer mit Exascale-Rechenleistung einbrachte.

Wissenschaftler sind bestrebt, Frontier für eine breite Palette von Studien zu nutzen, von der Kartierung des Gehirns über die Erstellung realistischerer Klimamodelle, die Erforschung der Fusionsenergie, die Verbesserung unseres Verständnisses neuer Materialien auf nanowissenschaftlicher Ebene, die Stärkung der nationalen Sicherheit und das Erreichen einer klareren, tieferen Sicht des Universums, von der Teilchenphysik bis zur Sternentstehung. Und das kratzt kaum an der Oberfläche.

An der University of Delaware haben Sunita Chandrasekaran, außerordentliche Professorin und David L. und Beverly JC Mills Career Development Chair im Department of Computer and Information Sciences, und ihre Studenten daran gearbeitet, sicherzustellen, dass Schlüsselsoftware für die Ausführung auf Frontier wann bereit ist Der Exascale-Computer ist 2023 für die wissenschaftliche Gemeinschaft „open for business“.

Da vorhandene Computercodes nicht automatisch auf Exascale portiert werden, hat sie mit einem Forscherteam in den USA und am HZDR in Deutschland zusammengearbeitet, um eine Arbeitstier-Computeranwendung namens „Particle in Cell“ (PIConGPU) einem Stresstest zu unterziehen.

Der Particle-in-Cell-Algorithmus ist ein Schlüsselwerkzeug in der Plasmaphysik und beschreibt die Dynamik eines Plasmas – Materie, die reich an geladenen Teilchen (Ionen und Elektronen) ist – durch Berechnung der Bewegung dieser geladenen Teilchen auf der Grundlage der Maxwell-Gleichungen. (James Maxwell war ein Physiker des 19. Jahrhunderts, der am besten dafür bekannt war, vier Gleichungen zur Beschreibung der elektromagnetischen Theorie zu verwenden. Albert Einstein sagte, Maxwells Einfluss auf die Physik sei der tiefgreifendste seit Sir Issac Newton.) Solche Werkzeuge sind auch für die Entwicklung von Strahlentherapien für Krebs von entscheidender Bedeutung als Erweiterung der Verwendung von Röntgenstrahlen zur Untersuchung der Struktur von Materialien.

„Ich sage meinen Schülern, stellen Sie sich vor, Ihr Laptop wäre mit Millionen anderer Laptops verbunden und könnte all diese Leistung nutzen“, sagte Chandrasekaran. „Aber dann kommt Exascale – das ist eine 1 gefolgt von 18 Nullen. Denken Sie darüber nach, wie groß und leistungsfähig ein so massives System sein kann. Ein solches System könnte möglicherweise eine ganze Stadt erleuchten.“

Die Ausführung von Anweisungen auf einem Exascale-System erfordert einen „anderen Programmierrahmen“ als andere Systeme, erklärte Chandrasekaran angesichts des einzigartigen architektonischen Designs, das aus vielen parallelen Verarbeitungseinheiten und einzigartigen Hochleistungs-Grafikverarbeitungseinheiten besteht.

Insgesamt enthält Frontier 9.408 Zentraleinheiten (CPUs), 37.632 Grafikeinheiten (GPUs) und 8.730.112 Kerne, die alle durch mehr als 90 Meilen Netzwerkkabel verbunden sind. All diese Rechenleistung half Frontier, die Exascale-Grenze zu überwinden, und Chandrasekaran arbeitet daran, sicherzustellen, dass auch die Software den Sprung schafft.

Um die spezialisierte Architektur des Systems zu nutzen, arbeiten sie und ihre Forscherkollegen daran, sicherzustellen, dass der Computercode in Software mit hoher Priorität buchstäblich der Geschwindigkeit von Frontier entspricht – und dass er fehlerfrei ist – einige der Schlüsselkomponenten des Exascale-Computing Projekt SOLLVE, das Chandrasekaran jetzt leitet. Es ist eine Zusammenarbeit von Brookhaven National Laboratory, Argonne National Laboratory, Oak Ridge National Laboratory, Lawrence Livermore National Laboratory, Georgia Tech und UD.

„Unser Team arbeitet seit 2017 zusammen, um die Software einem Stresstest zu unterziehen, um das System zu verbessern“, sagte Chandrasekaran und merkte an, dass die Arbeit die Zusammenarbeit mit mehreren Compiler-Entwicklern beinhaltet, die Implementierungen für Frontier bereitstellen.

„Die Maschine ist so neu, dass die Werkzeuge, die wir für den Betrieb benötigen, ebenfalls unausgereift sind“, sagte Chandrasekaran. „Unser Ziel ist es, Programme bereit zu haben, die von Wissenschaftlern genutzt werden können. Wir helfen, indem wir Fehler melden, Korrekturen anbieten, Beta-Versionen testen und Anbietern dabei helfen, robuste Tools für die Verwendung durch die Wissenschaftler vorzubereiten.“

UD-Studenten debuggen wichtige Programmiertools

Thomas Huber, der seinen Bachelor an der UD erwarb, arbeitete mehr als zwei Jahre mit Chandrasekaran an dem Projekt, bevor er diesen Mai seinen Master of Science in Computer- und Informationswissenschaften an der Universität abschloss. Er stammt aus Linwood, New Jersey, und ist jetzt als Softwareingenieur bei Cornelis Networks, einem Unternehmen für Computerhardware, angestellt.

„Als wir vor ein paar Jahren damit begannen, daran zu arbeiten, wussten wir, dass Frontier mit überhöhter Geschwindigkeit kommen würde, und das erforderte, eine Menge Leute zusammenzubringen, um an den etwa 20 Kernanwendungen zu arbeiten, die als geschäftskritisch erachtet wurden“, sagte Huber . „All diese Software muss fehlerfrei laufen.“

Dank dieser einzigartigen Gelegenheit, die Chandrasekaran ermöglichte, sammelte Huber wertvolle Forschungs- und Praxiserfahrungen. Er schulte auch vier Studenten in dem Projekt, als sie zusammenarbeiteten, um zu validieren, dass OpenMP, ein beliebtes Programmiertool, auf Frontier laufen konnte.

Als die Arbeit der Gruppe bei der Bewertung der Compiler fortschritt, die Implementierungen für neuartige Programmierfunktionen bereitstellen, fanden sie einige Fehler und dann noch ein paar weitere Fehler. Und da beschlossen sie, im Rahmen von ECP-SOLLVE ein GitHub – ein Forum für Softwareentwickler – zu starten, um ihre Erkenntnisse und ihren Open-Source-Code zu teilen.

„Wir haben einen GitHub gestartet, um die Releases der OpenMP-Spezifikationen zu überprüfen. Sie kommen alle paar Jahre heraus, und sie sind wie neue Features – 600 Seiten darüber, was Sie tun können und was nicht“, sagte Huber. „Am wichtigsten ist, dass der Abschnitt am Ende alle Unterschiede zwischen den Versionen des Programms aufzeigt. Wir nehmen die Liste aller neuen Funktionen und gehen sie durch und erstellen Testfälle für alle. Wir schreiben Code, den noch niemand zuvor geschrieben hat, und wir machen unseren gesamten Code öffentlich.“

Huber schätzt, dass das UD-Team in Zusammenarbeit mit dem Oak Ridge National Lab bisher etwa 500 Tests und 50.000 Codezeilen geschrieben hat.

„Das Ganze beim Hochleistungsrechnen ist parallele Programmierung“, sagte Huber. „Stellen Sie sich vor, Sie befinden sich in einem tonnenschweren Verkehr, der auf eine Mautstelle mit nur einer EZ-Passspur zusteuert. Die parallele Programmierung ermöglicht Ihnen die Aufteilung in viele EZ-Passspuren. Mit OpenMP können Sie diese parallele Arbeit erledigen und extrem schnell laufen. Was wir mit OpenMP gemacht haben, stellt sicher, dass Wissenschaftler und andere das Programm auf Frontier verwenden können. Wir sind die Versuchskaninchen dafür.“

Huber wurde durch das Vertically Integrated Program (VIP) am College of Engineering von der Forschung angezogen. Chandrasekaran war der Gruppenleiter für das Projekt. Er blieb ein Semester hier, arbeitete an einer Forschungsarbeit („Das war unglaublich“, sagte er) und lernte Kollegen kennen, die beste Freunde wurden. Sie haben sogar einen Plakatwettbewerb gewonnen.

Er schreibt Chandrasekaran zu, dass er ihn auf diesem Gebiet engagiert hat.

„Sie war so enthusiastisch und betonte, wie wichtig dieses Zeug ist, um Forschern und der realen Welt zu helfen, sie hat den Unterschied gemacht“, sagte Huber. „Sie ist eine hochkarätige Professorin für Hochleistungsrechnen.“

Leave a Comment

Your email address will not be published.