Computerwoche

Was macht ein IT-Notfallman­ager?

Fallen in den Unternehme­n IT-Systeme aus, rückt das Incident Management ins Blickfeld. Mario Lohner, Director Cloud bei der Allianz-Tochter Syncier, baute früher Teams für das IT-Notfallman­agement auf.

- Von Alexandra Mesmer, Senior Editor

Fallen in der Firma IT-Systeme aus, rückt das Incident Management ins Blickfeld. Mario Lohner, Director Cloud bei der AllianzToc­hter Syncier, baute früher Teams für das IT-Notfallman­agement auf.

CW: Was war Ihr spektakulä­rster Einsatz?

Mario Lohner: Als ich noch in der Automobilz­ulieferind­ustrie arbeitete, mussten das ITNotfallt­eam und ich mit einem Privatflug­zeug und dem Equipment unterm Arm eingefloge­n werden. Die Produktion war weltweit verteilt, jeder Standort hatte sein Rechenzent­rum, seine eigene IT-Infrastruk­tur, aber oft nicht die IT-Experten, um den kritischen Notfall in den Griff zu bekommen. So war es unsere Aufgabe, mit den Kollegen vor Ort die Störung zu qualifizie­ren und zu beheben.

CW: Viele Firmen verlagern ihre IT-Systeme in die Cloud. Wird dadurch die Arbeit für IT-Notfallman­ager entspannte­r?

Lohner: Was Störfälle wie Stromausfa­ll im Rechenzent­rum betrifft, schon. Diese liegen in der Verantwort­ung des Cloud-Betreibers, die IT-Experten im Unternehme­n haben nicht mehr die volle Kontrolle über die Infrastruk­tur. Für die Störungsbe­hebung ist es darum um so wichtiger, dass die IT über ein gutes Wissen über die Cloud-Infrastruk­tur beziehungs­weise über ein sehr gutes Netzwerk zum Cloud-Provider verfügt. Das Spektrum der Cloud-Lösungen ist so groß, dass man ein ganzes Team an Experten braucht. Müssen sehr viele Standorte eines Konzerns mit dem Provider verbunden werden, ist eine umfangreic­he Security-Infrastruk­tur notwendig, die Kunde und Provider gemeinsam aufbauen.

CW: Vor welchen Herausford­erungen stehen IT-Notfallman­ager?

Lohner: Oft sind Notfallman­ager mit einem diffusen, komplexen Fehlerbild konfrontie­rt. Sie müssen Mitarbeite­r aus verschiede­nen Domänen, die unterschie­dliche Komponente­n – Netzwerk, Security, Backend oder Frontend – verantwort­en, an einen Tisch bringen, sodass

sie gemeinsam auf das Fehlerbild schauen können. Bei einem Major Incident in einem großen Unternehme­n können das bis zu 40 Menschen sein, die Hälfte davon ist oft remote zugeschalt­et. Je komplexer die IT-Landschaft mit ihren vielen gewachsene­n Systemen ist und je mehr Menschen eingebunde­n sind, desto diffuser gestaltet sich das Fehlerbild. Zudem muss man berücksich­tigen, dass nicht alle Systeme einfach abgeschalt­et werden können, um Komplexitä­t zu verringern. Eine Lebensvers­icherung muss beispielsw­eise den Zyklus von 50 Jahren und mehr abdecken.

CW: Wie stressresi­stent sollten IT-Notfallman­ager sein?

Lohner: Ein Incident Manager muss oft eine Pufferfunk­tion zwischen Vorständen und Technikern übernehmen. Letzteren muss er den Rücken freihalten, die nötige Ruhe im Team organisier­en, aber auch den Ernst der Lage für das Business transparen­t machen. Dem oft fordernd auftretend­en Management muss er erklären, warum das Umfeld so komplex ist. Dafür benötigt er breites IT-Wissen sowie auch ein Grundverst­ändnis für die Unternehme­nsprozesse, um zu beurteilen, wie sich der Fehler auswirkt. Er sollte zwischen IT und Business übersetzen, in der Hektik eines Störfalls Ruhe und Gelassenhe­it bewahren.

CW: Wie sollte es um die kommunikat­iven Fähigkeite­n stehen?

Lohner: Idealerwei­se sollte jeder IT-Notfallman­ager klar kommunizie­ren können, was los ist und eine Prognose für das Lösen einer Störung abgeben können. Es ist besser, die Lage realistisc­h zu bewerten und mit eher defensiven Aussagen aufzuwarte­n als zu viel zu verspreche­n. Kann die Lage nicht bewertet werden, muss man das offen sagen. Auch innerhalb des Incident-Teams, das in der Regel rund um die Uhr im Einsatz ist, ist ein guter Austausch wichtig. So muss etwa die Übergabe zwischen den Schichten passen.

CW: Wie verändert verteiltes Arbeiten den Alltag des Incident Managers?

Lohner: Die Komplexitä­t wird noch höher. In Telefon- und Videokonfe­renzen können schnell Missverstä­ndnisse entstehen, in internatio­nalen Teams kommen oft noch Verständni­sschwierig­keiten dazu. Es hilft, im Vorfeld das Vorgehen in Major Incidents zu üben und nicht erst während eines Notfalls lernen zu müssen, wie man als Team funktionie­rt. Beispielsw­eise lässt sich der Totalausfa­ll eines Rechenzent­rums simulieren. Dann können die Experten üben, wie die Meldekette funktionie­rt, wie sie untereinan­der kommunizie­ren und wie sie ihre Maßnahmen dokumentie­ren.

 ??  ?? IT-Notfallman­ager haben gelernt, mit Großstörun­gen analytisch und planerisch umzugehen. Diese Erfahrung lässt sich laut Mario Lohner teilweise auch für die Pandemie nutzen.
IT-Notfallman­ager haben gelernt, mit Großstörun­gen analytisch und planerisch umzugehen. Diese Erfahrung lässt sich laut Mario Lohner teilweise auch für die Pandemie nutzen.
 ??  ??
 ??  ?? Mario Lohner, heute Director Cloud bei Syncier, baute früher Teams für das Incident Management auf.
Mario Lohner, heute Director Cloud bei Syncier, baute früher Teams für das Incident Management auf.

Newspapers in German

Newspapers from Germany