Major Incident Management – Vorbereitet sein, wenn eine Änderung katastrophal schiefgeht

Wenn ein Unternehmen einen Major-Incident-Prozess entwickelt, wird zunächst definiert, was einen Major Incident ausmacht. Organisationen neigen dazu, ihre Aufmerksamkeit extern auf das Potenzial von Hackern und Cyberangriffen zu richten, die Netzwerke verwüsten und Datensicherheitsbedenken hervorrufen können. Sie definieren die Incident-Priorität entsprechend mit Schwerpunkt auf externen Ursachen.

Dies ist ein berechtigtes Anliegen. Im heutigen Unternehmensumfeld ist ein Systembruch nicht unbedingt eine Frage des „Ob“, sondern des „Wann“. Infolgedessen konzentrieren Unternehmen die Verantwortlichkeiten von Teams für das Management schwerwiegender Vorfälle auf externe Faktoren, die einen Dienstausfall verursachen könnten. Jedoch vergessen sie oft, dass schwerwiegende Vorfälle nicht nur durch Systemausfälle oder externe Angriffe verursacht werden. Sie können das Ergebnis einer fehlgeschlagenen geplanten Änderung sein.

Was passiert, wenn ein Major Incident durch Change Management verursacht wird

Zunächst sollten Sie erkennen, dass nicht nur Ihre Benutzer betroffen sind, sondern dass höchstwahrscheinlich auch Verwirrung über Prozesse, Rollen und Verantwortlichkeiten auftreten wird.

Wenn Sie einen Major Incident haben, der durch eine Änderung verursacht wurde, befinden sich Systeme häufig zwischen Zuständen, und viele Stakeholder sind aufgrund der geplanten Ausfallzeiten nicht eingebunden. Ihre Change-Management- und Incident-Management-Prozesse müssen parallel arbeiten, und jedes Team kann einen anderen Prozessverantwortlichen haben. Die dadurch entstehende Komplexität macht die Verwaltung des Incidents äußerst schwierig – zu einem Zeitpunkt, an dem die Auswirkungen auf das Geschäft erhöht sind. Dies führt zu einer Hochrisikosituation für Ihr Unternehmen.

Wenn Sie dieses Szenario nicht im Voraus berücksichtigen und herausfinden, wie Sie damit umgehen werden, besteht eine hohe Wahrscheinlichkeit, dass Ihre Change-Management- und Incident-Management-Prozesse kollidieren. Dies wird technische Support-Mitarbeiter und das Management im Unklaren darüber lassen, wer die Kontrolle hat, wer kommunizieren sollte und wie Entscheidungen getroffen werden sollten, um Services so schnell wie möglich wiederherzustellen.

Seien Sie vorbereitet, wenn Major Incidents auftreten. Major Incident Management Training

Wie Sie Ihre Change-Management- und Incident-Management-Pläne aufeinander abstimmen

Während Sie die Pläne Ihres Unternehmens für den Umgang mit Major Incidents, die durch Änderungen verursacht werden, analysieren und vorbereiten, finden Sie hier einige der Schlüsselbereiche, in denen sich die normalen Change-Management- und Incident-Management-Ansätze unterscheiden und eine Abstimmung erfordern.

Kommunikation

Der erste Konfliktbereich betrifft die Kommunikation. In einer normalen Change-Umgebung sind Kommunikationspläne geskriptet, routinemäßig und selten – wobei technische Details über die Situation, stattfindende Aktivitäten und Auswirkungen auf den Betrieb weggelassen werden. In einer Major-Incident-Situation sind die Kommunikationsbedürfnisse nahezu entgegengesetzt. Stattdessen konzentrieren Sie sich darauf, Ihre Stakeholder häufig über Auswirkungen, Diagnoseaktivitäten und Status auf dem Laufenden zu halten. Dies versichert den Stakeholdern, dass das Support-Team das Problem unter Kontrolle hat.

Widersprüchliche Kommunikationsansätze können auch zu verlängerten Lösungszeiten führen, wenn diese Szenarien kollidieren. Wenn beide Situationen gleichzeitig auftreten, ist es wichtig festzulegen, wer kommunizieren sollte und wie oft. Definieren Sie, worauf sich jede Kommunikation konzentrieren sollte. Am wichtigsten ist, dass alle Anfragen nach Updates über den designierten Kontakt geleitet werden sollten, um Verwirrung und Ablenkung zu vermeiden.

Entscheidungsstrukturen

Die Entscheidungsbefugnis für Change Management ist typischerweise stark strukturiert mit einem regelmäßigen Rhythmus, standardisierter Dokumentation und Fokus auf die Verlässlichkeit der getroffenen Empfehlungen. In einer Major-Incident-Situation muss die Entscheidungsfindung in Echtzeit erfolgen, um den Incident zu lösen, wobei der Fokus auf Kosten-Nutzen-Verhältnis, Kompromissen und Risiko liegt.

Um Verwirrung zu vermeiden, sollte klar sein, wann die Entscheidungsbefugnis vom Change Management zum Incident Management wechselt und wie nach der Lösung des Incidents der Übergang zurück zum Change Management erfolgt.

Roll-Forward vs. Rollback

Der gängige Ansatz für die meisten Change-Management-Prozesse beim Umgang mit einer fehlgeschlagenen Änderung besteht darin, die Änderung zurückzusetzen und zur vorherigen funktionierenden Konfiguration des Systems zurückzukehren. Dies wird weitgehend erfolgreich sein, um die Wiederherstellung des Service sicherzustellen, es sei denn, ein Major Incident ist beteiligt.

Wenn ein Major Incident auftritt, muss Ihr Unternehmen möglicherweise eine andere Option in Betracht ziehen: Roll-Forward statt Rollback. Die Entwicklung und Bereitstellung einer neuen Änderung kann zu kürzeren Lösungszeiten führen. Die Entscheidung für ein Roll-Forward kann auch das Ergebnis eines fehlgeschlagenen Rollback-Plans sein. Sie kann auch auf einer Neudefinition der geschäftskritischen Bedeutung der Implementierung der geplanten Änderungen beruhen oder das Ergebnis einer Bewertung des vergleichenden Kosten-Nutzen-Risiko-Profils verschiedener Optionen sein.

Root Cause Analysis

Wenn ein Major Incident aufgrund einer Änderung auftritt, müssen zwei Root-Cause-Analysen durchgeführt werden. Die erste ist eine technische Analyse der Änderung, um zu verstehen, warum sie fehlgeschlagen ist und was getan werden muss, um das Problem zu beheben und ein erneutes Auftreten zu verhindern. Die zweite ist eine Analyse des Change-Management-Prozesses, um festzustellen, wie die fehlerhafte Änderung zur Freigabe genehmigt wurde. Dieser zweite Teil ist entscheidend, um Probleme im Entwicklungs- und Testprozess aufzudecken und die Prozesskontrollen innerhalb des Change-Management-Prozesses zu verbessern.

Major Incidents, die durch Änderungen verursacht werden, stellen ein Hochrisikoszenario für Ihr Unternehmen dar – sie treten mit hoher Wahrscheinlichkeit auf und haben erhebliche Auswirkungen, wenn sie eintreten. Sie können zu Umsatzverlusten und noch wichtiger zu Glaubwürdigkeitsverlusten bei Ihren Kunden führen.

Ihre beste Vorbereitung auf einen Major Incident, der durch Change Management verursacht wird, besteht darin zu planen, wie Ihre Teams reagieren werden, wenn diese Szenarien eintreten, und im Voraus zu üben. Wenn Sie noch keinen Plan haben, ist die Konzentration auf die Grundlagen (Kommunikation, Entscheidungsfindung, technische Optionen und kontinuierliche Verbesserung/Root-Cause-Analyse) ein guter Ausgangspunkt. Wenn Sie bereits einen bestehenden Prozess haben, verfeinern und optimieren Sie den Prozess, um die Auswirkungen auf das Geschäft zu minimieren, gezielte Stakeholder-Kommunikation bereitzustellen und Schritte hinzuzufügen, um Root-Cause-Analyse-Informationen zu erfassen, während Diagnose und Entscheidungsfindung stattfinden.

Weitere Informationen über die Beratungsdienstleistungen von Kepner-Tregoe für IT & Service Operations

Major Incident Management – Vorbereitet sein, wenn eine Änderung katastrophal schiefgeht

Was passiert, wenn ein Major Incident durch Change Management verursacht wird

Wie Sie Ihre Change-Management- und Incident-Management-Pläne aufeinander abstimmen

Kommunikation

Entscheidungsstrukturen

Roll-Forward vs. Rollback

Root Cause Analysis

Aktuelles & Insights

2 Stunden KT: Lernen Sie die Problemlösungs-Methoden von Kepner-Tregoe kennen!

Why Jumping to Solutions Without Finding the Root Cause Costs Organizations More in the Long Run

Kepner-Tregoe Announces Winners and Nominees of the 2026 KT Global Excellence Awards