Computerwoche

Nvidias DGX-2 – die wahrschein­lich größte Graphic Processing Unit der Welt

-

Der Grafikchip-Spezialist Nvidia hat einen neuen Superrechn­er speziell für Aufgaben rund um künstliche Intelligen­z (KI) und Machine Learning vorgestell­t. Firmenchef Jensen Huang bezeichnet­e das System „DGX-2“Ende März auf der hauseigene­n GPU Technology Conference (GTC) als „die größte GPU der Welt“. Der Hochleistu­ngsrechner arbeitet mit zwei Platinen, die jeweils mit acht TeslaV100-GPUs bestückt sind. Jede der 16 GPUs wird von 32 GB HBM2RAM (High Bandwidth Memory) unterstütz­t. Für die Datenübert­ragung zwischen den einzelnen GPUs hat Nvidia eine neue spezielle Steuerungs­technik entwickelt. NVSwitch basiert auf Chips, die 18 NVLink-Ports bieten. Jeder Port erlaubt einen Datendurch­satz von 50 GB pro Sekunde. Das bedeutet: Jeder NVSwitch-Chip schafft 900 GB pro Sekunde. Mit insgesamt zwölf Chips kommt der DGX-2 auf einen theoretisc­hen Datendurch­satz von 10,8 TB pro Sekunde. Das entspräche einem Download von 14.000 Kinofilmen pro Sekunde, vergleicht Jensen Huang. Die Hauptaufga­be für den DGX-2 dürfte allerdings darin liegen, neuronale Netze zu trainieren. Dabei soll das neue System deutlich schneller sein als sein Vorgänger. Für ein Training, das auf dem DGX-1 rund 15 Tage dauerte, soll der Nachfolger nur noch eineinhalb Tage benötigen. Neben dem neuen Superrechn­er hat Nvidia auf seiner Hauskonfer­enz ein Multi-Cloud-GPU-Cluster auf Basis von Kubernetes gezeigt. Fallen GPU-Server aus, erkennt dies Kubernetes automatisc­h und kann andere Systeme, auch aus einer anderen Cloud, automatisc­h dazuschalt­en.

Der Grafikchip­spezialist will zudem künftig enger mit ARM kooperiere­n. Der Chipdesign­er will Nvidias Deep-Learning-Architektu­r NVDLA in sein Projekt „Trillium“integriere­n. Dahinter steckt die Absicht von ARM, KIund Machine-Learning-Funktionen in Geräten im Internet of Things (IoT) zu integriere­n.

 ??  ?? Mit fast 82.000 Cuda-Rechenkern­en erreicht der DGX-2 von Nvidia eine Rechenleis­tung von etwa zwei Petaflops – das entspricht rund 300 klassische­n Dual-CPU-Servern.
Mit fast 82.000 Cuda-Rechenkern­en erreicht der DGX-2 von Nvidia eine Rechenleis­tung von etwa zwei Petaflops – das entspricht rund 300 klassische­n Dual-CPU-Servern.

Newspapers in German

Newspapers from Germany