Löschen bevor es brennt
Wie sieht ein modernes Monitoring der Rechenzentrums-infrastruktur heute aus? Was muss es leisten und welche Vorteile liefert es über die Kernaufgabe der Überwachung hinaus?
Rechenzentren sind eine der zentralen Säulen für die ● Geschäftskontinuität moderner Unternehmen. Ohne It-infrastruktur und digitale Prozesse können heute nur die wenigsten ihr Geschäft ausüben. Steht die IT, ist zumeist der gesamte Betrieb blockiert – mit den entsprechend negativen Auswirkungen auf die Unternehmensergebnisse. Die möglichen Folgen von It-systemausfällen reichen von einer unangenehmen Arbeitsunterbrechung, höheren Personalkosten, Umsatzverlusten, Vertrauenseinbrüchen bei Kunden und gröberen Imageschäden am Markt bis hin zu Schadenersatzansprüchen und Konventionalstrafen. Fakt ist: Von der Leistungsfähigkeit und der Zuverlässigkeit der IT bzw. des Rechenzentrums hängt in der zunehmend digitalisierten Wirtschaft der Geschäftserfolg maßgeblich mit ab.
Physische Ursachen
Entsprechend ihrer Bedeutung genießen It-ausfälle sowohl unternehmensintern als auch in der Öffentlichkeit große Aufmerksamkeit. Mittlerweile sind ungeplante It-stillstände in Unternehmen sowie deren Folgen und Kosten ein mediales Dauerthema. Dabei dominieren vorwiegend Ausfälle aufgrund von Cyberangriffen die Diskussion, etwa Denial-of-service-attacken, Kennwort- und Phishing-angriffe sowie Schadsoftwarevorfälle mit und ohne Lösegeldforderungen. Weniger Beachtung findet die Tatsache, dass mindestens die Hälfte der It-ausfälle in den deutschen Unternehmen schlichtweg physische Ursachen hat. Sie werden hervorgerufen durch Übertemperatur der It-infrastruktur, Netzausfall oder Usv-defekte, durch Schmorbrände und Feuer, Wasser, Stromüberlastung oder Einbrüche. Im Unterschied zu It-downtimes, denen Softwarefehler zugrunde liegen, dauern die Ausfallzeiten bei physischen Defekten meist länger und sie erzeugen auch höhere Kosten.
Paradigmenwechsel
Moderne Rechenzentren sind hoch komplexe Bereiche, was die Anforderungen an ihre Verwaltung, die Absicherung und ihre Überwachung deutlich erhöht. Dennoch ist ein ausgeklügeltes Monitoring essenziell, dient es doch dazu, das Geschäft aufrecht zu erhalten. Überwacht werden muss nicht nur die It-infrastruktur, also Server, Speicher und Netzwerk-switches, sondern auch die Rechenzentrumsinfrastruktur, zu der etwa die Stromverteilungseinheiten, Generatoren, Klimageräte, Ventilatoren oder Hlk(heizung Lüftung Kühlung) Geräte gehören. Nach wie vor ist das Infrastrukturmonitoring in vielen Unternehmen auf einen rein reaktiven Betrieb ausgerichtet. Erkennt das Monitoringsystem ein Problem, erhält der firmeninterne It-administrator eine E-mail und kann die nötigen Schritte setzen. Gelöscht wird, sobald ein Feuer ausgebrochen ist. Ein modernes Monitoring aber muss nicht nur in Echtzeit erfolgen und eine angemessene Reaktion auf Vorkommnisse ermöglichen, sondern datenbasiert und vorausschauend sein. Messdaten müssen präventiv erfasst, gespeichert, berechnet, analysiert und genutzt werden. It-ausfälle sollen idealerweise nicht nur schnell behoben werden, sondern erst gar nicht entstehen.
Unternehmen, die ihr Augenmerk auf eine ganzheitliche Betrachtung ihres Rechenzentrums legen, können von modernen Monitoringlösungen deutlich profitieren.
Neben der Überwachung hat das Monitoring zudem die Aufgabe, Optimierungen im Rechenzentrum auf Basis der Messdaten zu ermöglichen.
Know-how und Service
Bei der Auswahl der relevanten Messdaten sollten erfahrene Spezialisten Unterstützung leisten. Denn prinzipiell sind in einem Rechenzentrum mehr als 1000 Datenpunkte auswertbar. Allein bei einer Wasserpumpe könnten 30 bis 40 Kriterien, Drehzahl, Druck, etc., überwacht werden. Es kommt also darauf an, die aussagekräftigsten Daten zu nutzen. Für Unternehmen, deren It-fachkräfte auch so schon mehr als ausgiebig beschäftigt sind, bietet sich die Full-service-variante des Monitorings an. Dabei wird die Planung und Umsetzung genauso übernommen wie der laufende Überwachungsbetrieb, der anhand von definierten Workflows automatisiert läuft.
Ein Beispiel:
Zeigen die von den Sensoren erfassten Werte eine Unregelmäßigkeit an, informiert das System nicht den internen It-administrator, wie es bei herkömmlichen Lösungen der Fall ist. Informiert wird die Serviceleitstelle des Monitoringpartners. Diese arbeitet im 24/7 Betrieb und weiß, was im jeweiligen Fall zu tun ist. Dabei reichen die Maßnahmen von der Information des Wachdienstes vor Ort, der den Servicemitarbeiter ins Rechenzentrum einlässt, bis zur Begutachtung des aufgetauchten Verdachtsfalles oder zur Behebung des effektiven Vorfalles.
Mehrwert durch Optimierung
Größtmögliche Verfügbarkeit ist der eine Baustein, Performance der andere. Daher spielen Leistungsindikatoren, wie die Auslastung der Systeme, der Wirkungsgrad der Kühlung oder die effiziente Energienutzung eine große Rolle. Monitoringlösungen, die alle Systeme kontinuierlich überwachen, liefern die Daten für Prognosen, anhand derer künftige Entwicklungen diagnostiziert werden. So können versteckte Kapazitäten sowie unentdeckte Schwachstellen aufgespürt und Optimierungspotentiale genutzt werden. Das erhöht die Performance und Flexibilität, ermöglicht ein nachhaltiges, klimaschonendes Wirtschaften im Rechenzentrum und senkt gleichzeitig die Kosten.