[DE] RACKlette an der SC24 in Atlanta

12/1/2024 | Renas Sahin

Wie die Jahre zuvor reisten wir auch dieses Jahr zur grössten internationalen High Performance Computing Convention – dieses Jahr in Atlanta – um als Team RACKlette am Student Cluster Competition teilzunehmen. Bei der Competition traten wir mit einem von SuperMicro bereitgestellten Cluster an, stiessen jedoch schnell auf technische Probleme, insbesondere bei der Kommunikation zwischen den GPUs. Über mehrere Tage arbeiteten wir hart an Benchmarks, nahmen an verschiedenen Events, Vorträgen und Networking-Veranstaltungen teil und erlebten sowohl Erfolge als auch Rückschläge – von technischen Herausforderungen bis zu unerwarteten Reisehindernissen, wie einer Flugannullierung und einem leichten Verkehrsunfall. Trotz aller Schwierigkeiten konnten wir schöne und coole Erfahrungen sammeln und blicken am Ende der Woche auf eine lehrreiche und unvergessliche Zeit zurück.

Im Folgenden finden Sie die Tagesberichte unserer Reise.

Tag 1: Anreise

Tief in der Novembernacht des 15. trafen wir uns um 04:30 Uhr am Zürcher Hauptbahnhof, um den ersten Zug zum Flughafen zu nehmen. Einige von uns arbeiteten die Nacht an ETH durch. Nicht alle konnten der Müdigkeit widerstehen und es gab einen kurzen Nap am Gate. Unser Flug hob mit etwas Verspätung um 07:00 Uhr ab.

Nach der Landung am Frankfurter Flughafen gingen wir direkt zum Gate für unseren Weiterflug nach Atlanta. Der Lufthansa-Flug startete pünktlich um 09:50 Uhr. Dann endlich konnten wir uns im Flieger zurücklehnen und schlafen. Das Essen an Bord war fein und die Flugbesatzung war sehr nett.

Mit einem Jetlag von sechs Stunden landeten wir schliesslich in Atlanta. Die Passkontrolle dauerte etwas länger, verlief jedoch problemlos. Anschliessend fuhren wir mit dem Taxi zu unserem Hotel Hilton 2 Suites und checkten ein. Die Einzelzimmer gefielen jedem.

Nach einer kurzen Ruhepause spazierten wir ins Stadtzentrum und weiter zum Georgia World Congress Center, wo wir die kommende Woche hauptsächlich verbringen würden. Dabei erkundeten wir ein wenig die Stadt.

Am Abend organisierte Niklas Römer, ein ehemaliger SC-Teilnehmer, ein gemeinsames Abendessen mit dem finnischen Team. Nach dem Abendessen kehrten wir ins Hotel zurück und konnten uns endlich richtig ausruhen, um dann genug fit zu sein für die kommenden anstrengenden Tage.

Tag 2: früher Rückschlag

Nach einer mehr oder weniger erholsamen Nacht trafen wir uns um 09:30 Uhr in der Hotellobby, um gemeinsam zur Convention zu gehen, nachdem wir ein eher bescheidenes Frühstück genossen hatten (ich mochte es gar nicht). Dort angekommen, trafen wir unseren Advisor Hussein Harake und besprachen einige organisatorische Dinge.

Nach einer kurzen Mittagspause folgte das erste offizielle Event: eine Begrüssung seitens der Veranstalter und ein Sicherheitsbriefing. Dabei konnten wir unsere Mitstreiter zum ersten Mal kennenlernen. Anschliessend gingen wir zu unseren Ständen, um das Cluster auszupacken und alles einzurichten. Wir waren sehr beeindruckt und freuten uns darauf, unsere Anwendungen und Benchmarks auf dem Cluster laufen zu lassen, welches wir von SuperMicro zur Verfügung gestellt bekommen haben.

Allerdings stiessen wir schnell auf ein verhängnisvolles Problem: Die 8 GPUs konnten nicht wie gewünscht effizient miteinander kommunizieren. Ein Scaling auf mehreren GPUs war ineffizienter als das Verwenden eines einzelnen GPU, da der Overhead durch diese nicht funktionierende Kommunikation grösser war. Das war ein harter Rückschlag zu Beginn unserer Reise…

Um 16:30 Uhr folgte ein ausführlicher Sicherheits- und Orientierungsvortrag, der 1,5 Stunden dauerte. Danach fand die Eröffnungsfeier statt, bei der – wie auch in den kommenden Events an den Abenden – kostenlos Essen angeboten wurde und wir die Gelegenheit hatten, neue Leute kennenzulernen.

Zurück an unserem Stand erledigten wir noch ein paar Kleinigkeiten, bevor wir uns schliesslich um 22:00 Uhr auf den Weg ins Hotel machten. Der Tag war anstrengend und lehrreich, wir bekamen einen ersten Eindruck von der gesamten Convention und dem Wettbewerb.

Tag 3: Beginn des Wettbewerbs

Nach einer kurzen Nacht brachen wir um 06:45 Uhr im Morgengrauen vom Hotel auf. An unserem bereits geschmückten Stand angekommen, machten wir uns sofort an die Arbeit, da noch einiges zu erledigen war. An diesem Tag lag der Schwerpunkt auf den Benchmarks, die wir zum Laufen bringen mussten. Ausserdem fanden Benchmark-Interviews mit den Experten statt, die insgesamt recht gut verliefen.

Nach einer typisch amerikanischen Pizza, die nicht geschmeckt hat, folgte nach dem Mittagessen ein Fototermin mit allen Teams. Bis 17:00 Uhr arbeiteten wir weiter, bevor wir zur Exhibitor Reception, der offiziellen Eröffnungsfeier der Convention, gingen. Dort gab es feines Essen und Getränke. Nach einer längeren Pause mit vollem Magen und einigen geworfenen Footbällen begann schliesslich der Wettbewerb um 19:00 Uhr offiziell.

Uns wurden die Aufgaben für die jeweiligen Anwendungen sowie die Mystery-Benchmarks mitgeteilt, die wir auf unserem nicht optimalen Cluster zum Laufen bringen mussten. Wir arbeiteten bis 22:30 Uhr und machten uns dann erschöpft, aber einigermassen zufrieden, auf den Weg zurück ins Hotel.

Tag 4: Grind

Am Dienstag hiess es früh aufstehen und sich direkt an die Arbeit machen! Jetzt mussten wir Gas geben und versuchen, alles zum Laufen zu bringen sowie die jeweiligen Aufgabenfragen zu beantworten. Von früh am Morgen bis spät in die Nacht arbeiteten einige von uns hartnäckig und blieben bis 3 Uhr morgens im Booth, um ihre Aufgaben weiterzubearbeiten.

Der Wettbewerb war intensiv, und wir wollten unbedingt mithalten. Wirklich Zeit, die Messe zu besichtigen, blieb nicht, doch es gab gelegentlichen Austausch mit den anderen Teams, und wir lernten uns gegenseitig ein wenig kennen.

An diesem Tag gab es um 17:15 Uhr eine offizielle Pause, während der wir nicht weiterarbeiten durften. Stattdessen nahmen wir an der weltbekannten Präsentation der Top500 teil, bei der die besten Supercomputer der Welt vorgestellt werden. Auch in diesem Jahr platzierte sich der Supercomputer Alps in den vorderen Rängen der Besten, was uns als Schweizer natürlich freute und stolz machte.

Tag 5: Ende des Wettbewerb

Um 17:00 Uhr war der Wettbewerb offiziell beendet, was bedeutete, dass wir bis zur letzten Minute noch einmal Gas geben mussten, um mit unseren Aufgaben fertig zu werden und die Ergebnisse rechtzeitig einzureichen. Dieser Tag war einer der hektischsten der Woche, da neben den Abgaben auch Interviews mit den Experten zu den verschiedenen Applikationen stattfanden.

Glücklicherweise schafften wir es, alles zum Laufen zu bringen und pünktlich um 17:00 Uhr mit unserer Arbeit fertig zu sein. Um 17:00 Uhr fiel eine grosse Last von unseren Schultern und wir waren erleichtert, dass der gesamte Stress endlich vorbei war. Nun konnten wir unsere Zeit frei gestalten und das tun, worauf wir Lust hatten.

Einige von uns nutzten die Gelegenheit, die Messe zu erkunden, während andere sich eine Pause gönnten, um sich ein wenig zu entspannen. Am Abend fand schliesslich eine grosse Vendor-Party statt, bei der es wieder mal reichlich zu Essen gab und bei dem wir mit anderen Teilnehmern sowie Studierenden in entspannter Atmosphäre networken konnten.

Tag 6: offizieller Abschluss

Der letzte offizielle Tag des Wettbewerbs war der Donnerstag. Früh am Morgen fand ein gemeinsames Frühstück mit allen Teams statt, gefolgt vom Awards Lunch. Um 12:45 Uhr begann dann die Preisverleihung. Neben der Student Cluster Competition wurden zahlreiche bedeutende Auszeichnungen vergeben, wie zum Beispiel der Golden Bell Award.

Da wir mit einem mehr oder weniger defekten Cluster angetreten waren, hielten sich unsere Erwartungen in Grenzen, und die Enttäuschung war entsprechend gering. Wie in den meisten Jahren zuvor (mit Ausnahme des letzten Jahres, in dem unser Team den ersten Platz erreichte) gewann die chinesische Universität Tsinghua wiedermal den Wettbewerb. Wir erreichten dennoch mit nur einer Node den sechsten Platz, was gewissermassen auch eine Leistung ist.

Nach der Preisverleihung mussten wir dann die Cluster für den Versand wieder einpacken und unsere Stände aufräumen. Um 17:00 Uhr fand dann das letzte offizielle Event statt, eine Abschlussbesprechung, in der der Wettbewerb zusammengefasst wurde und jeder Teilnehmer seine Meinung, Lob oder Kritik äussern konnte. Unser Team erhielt drei von vier Urkunden: eine für den „Most Representable Booth“, eine weitere für die „Fastest Scavenger Hunt“ und schliesslich bekam Bogdan als einziger Teilnehmer die Urkunde „Perseverance in the Face of Adversity“, die ihm von der Sicherheitsabteilung verliehen wurde.

Damit war der Wettbewerb offiziell beendet. Am Abend fand die Abschlussfeier der gesamten Messe im Georgia Aquarium statt – ein wirklich cooler Abschluss einer intensiven Woche.

Tag 7: Stadterlebnis

Am Freitagmorgen checkten wir aus dem Hotel aus. Da unser Rückflug erst am folgenden Tag geplant war, hatten wir den gesamten Tag Zeit, um die Stadt zu erkunden.

Am Abend trafen wir uns mit einem Freund von Nick, der kürzlich sein PhD-Studium an der Georgia Tech begonnen hat und ebenfalls von der ETH Zürich stammt. Er erzählte uns vom Studentenleben in den Südstaaten, führte uns über den Campus und zeigte uns einige coole Orte in Atlanta.

Tag 8/9: Odyssee des Teams

Am nächsten Tag erlebten wir eine unangenehme Überraschung. Unser Flug mit der Lufthansa wurde annulliert. Dadurch mussten wir kurzfristig eine neue Unterkunft für die Nacht organisieren. Am Nachmittag erhielten wir schliesslich die Nachricht, dass wir erst am Sonntag zurückfliegen könnten mit einer sechsstündigen Wartezeit in Washington.

Den Samstag konnte jeder individuell gestalten, doch jeder von uns verbrachte die Zeit in der Hotellobby oder im Hotelzimmer mit Lernen, schliesslich kennt die ETH Zürich keine Pause.

Am Sonntagmorgen fuhren wir um 5:00 Uhr vom Hotel zum Flughafen. Als hätte uns das Pech nicht schon genug getroffen, fuhr uns auf der Autobahn ein Auto von hinten ins Taxi. Glücklicherweise wurde niemand verletzt, und wir kamen mit einem Schrecken davon. Unsere grösste Sorge war nun, den Flug zu verpassen. Zum Glück wurde rasch ein anderes Taxi organisiert, das uns zum Flughafen brachte.

Eine eher kuriose Beobachtung war, dass für diesen Unfall gleich vier Polizeiwagen mit Blaulicht erschienen. Trotz allem schafften wir es rechtzeitig zu unserem Flug und kamen nach einer 17-stündigen Heimreise endlich am Montagmorgen in Zürich an.

Fazit

Die Teilnahme am SC24 in Atlanta war eine intensive und lehrreiche Erfahrung. Trotz technischer Probleme mit unserem Cluster gaben wir bis zum Schluss unser Bestes, wobei Teamarbeit und die Gruppendynamik sehr gut funktionierten. Die Herausforderungen haben uns persönlich gefordert und weitergebracht.

Neben den technischen Aufgaben war auch der Austausch mit internationalen Studierenden und Expert:innen erfreulich. Die Messe insgesamt gab uns allen wertvolle Einblicke in die Welt des High Performance Computing.

Trotz unerwarteter Rückreiseprobleme blicken wir dankbar auf diese ereignisreiche Woche zurück, eine Erfahrung, die bestimmt jedem von uns in Erinnerung bleiben wird.