Der Kunde
Ein großes globales Unternehmen für Investment-, Vermögens- und Servicemanagement sowie einer der weltweit größten Verwahrer von Vermögenswerten wollte seine IT-Stabilität durch eine bessere Root Cause Analysis bei großen, kundenwirksamen Vorfällen erhöhen.
Herausforderung
IT-Probleme wurden von einer dezentral verteilten Gruppe von Einzelpersonen bearbeitet. Sobald ein größeres, kundenwirksames Ereignis gelöst war, wurde die Untersuchung zur Ermittlung der zugrunde liegenden Ursache einem Technologen übertragen, der sich in ein Silo zurückzog, um Grundursache und Korrekturmaßnahmen zu bestimmen. Unterstützt wurde dies von einer Gruppe von „Problem Administrators“, jedoch ohne klare Strategie oder abgestimmtes Vorgehen, sodass nachhaltige Verbesserungen praktisch unmöglich waren.
Lösung
Innerhalb der Infrastrukturorganisation wurde ein Pilotprojekt umgesetzt, um den gesamten Root-Cause-Analysis-(RCA)-Prozess zu verbessern – mit dem übergeordneten Ziel, die Stabilität zu erhöhen. Alle „Problem Administrators“ wurden in der Kepner-Tregoe-Methodik geschult und steigerten dadurch ihre Kompetenzen deutlich. Nach der Schulung wurden sie intern durch einen zertifizierten KT-Coach gecoacht. Gleichzeitig wurde die Gruppe zu einer zentralen, abgestimmten Funktion echter Problem Manager reorganisiert, die nun für die Durchführung aller RCAs innerhalb der Technologieeinheit verantwortlich waren. Sobald die Untersuchung der Grundursache begann, nutzten die Problem Manager die KT-Problem Analysis, um den Prozess in Zusammenarbeit mit den Fachexperten (SMEs) konsequent voranzutreiben, die Grundursache zu finden und Korrekturmaßnahmen festzulegen. Zusätzlich wurde ein neues Governance-Modell eingeführt, das Reporting und die Verantwortung des Senior Managements für den Prozess umfasste. Ziel war es, bei Priority-1-Vorfällen eine mindestens 20%ige Verbesserung der Gesamtstabilität zu erreichen, gemessen an der Anzahl hochwirksamer Vorfälle in der Organisation.
Ergebnisse
Aufgrund der schnellen Einbindung von Fachexperten (SMEs) durch den Problem Manager für die Untersuchung der Grundursache, gestützt durch den disziplinierten Ansatz der Root Cause Analysis, der zu präziseren Ergebnissen führte (und damit dazu, dass die richtigen Korrekturmaßnahmen identifiziert und umgesetzt wurden), verzeichnete das Programm eine deutliche Verbesserung der Gesamtstabilität.
Das Vertrauen in die Fähigkeit des Infrastrukturteams, greifbare und nachhaltige Verbesserungen der Stabilität zu liefern, führte dazu, dass diese große Leistung auf höchster Ebene der Organisation stärker anerkannt wurde. Das Endergebnis war eine signifikante Steigerung der Qualität der Problemdaten, eine Verkürzung der Zeit bis zur Grundursache sowie weniger Major Incidents – und damit insgesamt eine deutlich höhere IT-Stabilität.
Am Ende des Pilotprogramms genehmigte das Senior-IT-Management, dass dieser im Infrastrukturbereich erprobte Ansatz auf den übrigen IT-Bereich ausgeweitet wird.
Erfolge
- 76 % Reduzierung der durchschnittlichen Anzahl der Tage bis zum Abschluss der RCA
- 38 % Reduzierung von Vorfällen mit großen Auswirkungen
- Proaktive Identifizierung und Vermeidung von über 10.000 potenziellen Problemen
- Anerkennung dieser großen Leistung auf höchster Ebene der Organisation