Beschaffung direkt wassergekühlter HPC KI Cluster Komponenten über 300 GPUs inkl. Wartung
Beschaffung von (direkt-wassergekühlten) HPC- und KI- Cluster-Komponenten - Es umfasst sieben Fachbereiche aus den Themenbereichen Audio- und Multimediatechnologien, adaptive Systeme, Röntgentechnik, Kommunikationssysteme, Lokalisierung und Vernetzung, Smart Sensing sowie Supply Chain Services. Im Rahmen des Projekts FireAI wird ein GPU-Rechencluster neuester Generation mit über 300 GPUs beschafft, primär für das Training von generativer KI (GenAI). Ein Cluster dieser Ausprägung ist notwendig, um verteiltes Training (Daten-, Modell- und Pipeline-Parallelisierung) effizient zu ermöglichen, Trainingszeiten zu verkürzen und parallele Experimente mehrerer Teams sicher abzuwickeln. Die hier vorliegende Ausschreibung dient der Beschaffung eines direkt- warmwassergekühlter Systemkomplex aus notwendigen Racks, Management-Server, Netzwerkkomponenten und Infrastruktur zur Ermöglichung des Betriebs (Warmwasserkühlungsinfrastruktur, Stromverteilung, etc.), sowie KI-Rechenknoten mit mindestens 4 high-end GPUs pro Knoten. Die Rechenknoten sollen hierbei über InfiniBand vernetzt werden. Beschaffung von direkt- wassergekühlten HPC-Cluster-Komponenten sowie deren Wartung und Pflege.