Rechenzentrumsbetrieb
Ausfälle vermeiden
Vorsorgepläne und ein guter Notbetrieb verhindern Katastrophen im Rechenzentrum www.cowo.de/a/3544994
Data Center abschalten
Ein Rechenzentrum ohne Störungen im Geschäftsbetrieb stillzulegen, ist komplizierter als es scheint. www.cowo.de/a/3547927
Denken wie ein KI-Entwickler
Bei der Ausstattung von Rechenzentren sollte die KI-Zukunft eingeplant werden. www.cowo.de/a/3549648
stehenden Ressourcen verteilen. Viele Tools für das WorkloadManagement beziehen darüber hinaus auch Systeme in der Cloud oder vom Netzwerkrand (Edge) mit ein. Algorithmen seien künftig in der Lage, in Echtzeit zu entscheiden, wo ein bestimmter Workload am besten ablaufen sollte, ergänzt Bizo. Dabei ließen sich unterschiedliche Parameter definieren, anhand derer ein KI-System über die Verteilung der Rechenlasten entscheidet. Das könnten Leistung, Kosten, Governance oder die Sicherheit sein.
Eine solche Lastverteilung auf Basis verschiedener Variablen, die laufend überwacht werden müssen, ist nicht trivial. Im vergangenen Jahr hatte das Massachusetts Institute of Technology (MIT) ein KI-System präsentiert, das Rechenoperationen über Tausende von Servern hinweg verteilen kann. Tatsächlich ist das effiziente Workload-Management aber in erster Linie eine Spezialität der großen Hyperscaler Amazon Web Services, Google und Microsoft.
KI-Rechenzentrum: Von der Pflicht zur Kür
Für Unternehmen mit einem eigenen RZ-Betrieb ist der Einsatz von KI in aller Regel noch nicht gelernter Alltag. Oft ist diesen Firmen nicht bewusst, wie sie ansetzen und automatisieren können. Dabei rückt das Ziel eines sich selbst reparierenden Rechenzentrums, das nur noch seltenes Eingreifen von Administratoren erfordert und außerdem effizient und widerstandsfähig läuft, mit diesen Technologien durchaus in Sichtweite.
Es dürfte aber noch dauern, bis entsprechende Werkzeuge neben dem klassischen Data Center Infrastructure Management (DCIM) in die Cockpits der Admins Einzug halten. Immerhin: Laut Said Tabet, Techniker aus dem CTO-Team bei Dell Technologies, haben im Zuge der Coronakrise Ideen für mehr Automatisierung und KI-betriebene, sich selbst reparierende digitale Data Center einen deutlichen
Schub erfahren. Allerdings gebe es noch viele Hürden. Vor allem fehlen den Rechenzentrumsbetreibern Experten, um die KI-Systeme zu trainieren und zu managen, sagt der Dell-Manager. Eine weitere Schwierigkeit liege darin, dass es keine einheitlichen Datenstandards für das Monitoring der unterschiedlichen Systeme gebe. Zudem gefalle es Admins oft nicht, wenn man ihnen die Kontrolle über ihre Systeme aus der Hand nehme.
Ein knappes Viertel der vom Uptime Institute befragten Manager glaubt nicht, dass mehr Automatisierung und ein verstärkter Einsatz von KI den Betrieb vereinfachen und die personelle Situation entspannen könnten. Viele halten auch die verfügbare Technologie für nicht ausgereift. Dabei zeigen Beispiele wie das von Google längst, welche Einsparungen durch KI-Systeme möglich wären.