Globale Präsenz, lokale Betreuung

Kepner-Tregoe bietet weltweit Schulungen zu Problemlösung und Entscheidungsfindung an – online oder vor Ort und in mehreren Sprachen. Sollte Ihr Land nicht aufgeführt sein, kontaktieren Sie uns bitte über das Kontaktformular unserer Zentrale. Unser Kundenservice-Team hilft Ihnen gerne weiter und vermittelt Ihnen den passenden Ansprechpartner in Ihrer Region.

Beenden Sie die Brandbekämpfung mit proaktivem Problemmanagement

Von Tim Roberts, Christoph Goldenstern

In jeder Organisation, sei es im Bereich Service Delivery oder im operativen Betrieb, gibt es in der Regel ein System zur Überprüfung größerer Vorfälle, nachdem der Vorfall zunächst bearbeitet wurde. Dies kann als Post Incident Review (PIR) oder als After-Action-Review bezeichnet werden (ein Begriff, der häufig im Fertigungsumfeld verwendet wird). Die Organisation kann mehr als einen Ansatz verwenden, und verschiedene organisatorische Silos können unterschiedliche Methoden anwenden.

Problemmanagement kann reaktiv oder proaktiv sein

Reaktives Problemmanagement zielt darauf ab, die Ursache bekannter Vorfälle zu finden und zu beseitigen. Proaktives Problemmanagement verfolgt einen ganzheitlicheren Ansatz und blickt über den Vorfall hinaus, um zukünftige Vorfälle durch Identifizierung und Beseitigung (systemischer) Grundursachen zu erkennen und zu verhindern, die immer wieder ähnliche Arten von Vorfällen verursachen.

Proaktives Problemmanagement berücksichtigt den Vorfall und die Ursache(n), die ihn ausgelöst haben, sowie die umfassenderen Bedingungen, die den Vorfall ermöglicht haben, sodass alle beitragenden Faktoren eingehender analysiert werden können. Ein entscheidender Schritt nach Abschluss dieser Analyse besteht darin, sorgfältig präventive Maßnahmen zu platzieren, die darauf ausgelegt sind, spezifische Vorfälle zu verhindern, von denen bekannt ist, dass sie erhebliche negative Auswirkungen haben.

Wenn Sie die Probleme betrachten, die Ihrer Organisation die größten Schwierigkeiten bereiten, werden Sie wahrscheinlich feststellen, dass es sich um wiederkehrende Vorfälle handelt, die meist kurzfristig mit einem Workaround oder „Patch“ behandelt, aber nie vollständig gelöst werden. Das Team gelangt nie zu den „strukturellen Ursachen“ und ergreift daher keine Maßnahmen, um die Situation langfristig zu verhindern oder abzumildern.

Ein Vorteil des proaktiven Problemmanagements ist die Möglichkeit, sich auf die Beseitigung dieser systemischen, wiederkehrenden Vorfälle zu konzentrieren. Diese Methodik wird typischerweise angewendet:

  • Während einer Post-Mortem-Überprüfung größerer Ausfälle/Vorfälle
  • Während der Live-Moderation bei der Bearbeitung größerer Vorfälle
  • Als Bestandteil eines Programms zur kontinuierlichen Serviceverbesserung

Organisationen, die einen aktiven Ansatz zur kontinuierlichen Serviceverbesserung verfolgen, werden feststellen, dass dieser Prozess mehrere Möglichkeiten zur Verbesserung sowohl von Geschäftsprozessen als auch von Technologie identifizieren kann. Nach einem größeren Vorfall oder Ausfall wird dringend empfohlen, eine Post-Mortem-Überprüfung unter Einbeziehung der wichtigsten Stakeholder durchzuführen.

Was ist Incident Mapping?

Bei Kepner-Tregoe basiert Proaktives Problemmanagement auf einem Kernwerkzeug, das wir „Incident Mapping“ nennen – eine Methode, um den Vorfall zu visualisieren und „das Ereignis“ abzubilden.

Die linke Seite von Abbildung 1 (siehe PDF-Version) bietet eine Momentaufnahme typischer Dokumentation zur Vorfallüberprüfung, die zur Moderation eines Live-Meetings zum Verständnis eines größeren Vorfalls verwendet wird. Es ist nicht ungewöhnlich, dass dieses Dokument bis zu fünf oder sechs Seiten dicht gepackten Text umfasst, in dem Beobachtungen, Maßnahmen und Kommunikation über den gesamten Zeitraum des Vorfalls aufgezeichnet werden. Das Ergebnis ist ein Durcheinander detaillierter Informationen, das es schwierig macht, Relevantes von Irrelevantem, Wichtiges von Unwichtigem zu trennen.

Auf der rechten Seite von Abbildung 1 wird die gesamte fünfseitige Beschreibung des Vorfalls in einem visuellen Flussdiagramm dargestellt, das allgemein als Incident Map bekannt ist.

Es sollte ohne Weiteres erkennbar sein, dass die Karte für die Personen, die den Vorfall verwalten, wesentlich einfacher und praktischer ist. Sie ist auch eine weitaus bessere Möglichkeit, den Vorfall dem oberen Management zu berichten, das selten die Zeit oder Toleranz für dichte, detaillierte Dokumentation hat.

Wenn dies effektiv durchgeführt wird, ist diese Visualisierung das Produkt eines Prozesses, der den Vorfall systematisch beschreibt in Bezug auf:

  • Das Hauptproblem und seine Auswirkungen
  • Alle Ursache-Wirkungs-Ketten, die es ausgelöst haben
  • Die Umstände, die zur Auswirkung des Vorfalls beitragen – beschreiben, warum die Auswirkung so schlimm war oder nicht so schlimm war, wie sie hätte sein können
  • Barrieren, die durchbrochen wurden – Maßnahmen, die die Ursache-Wirkungs-Kausalität hätten unterbrechen können, und warum sie nicht funktioniert haben
  • Maßnahmen, die ergriffen wurden
  • Maßnahmen, die vorgeschlagen, ausgewählt oder umgesetzt werden, um ein erneutes Auftreten des Problems zu verhindern
  • Maßnahmen zur Risikominderung aus vorgeschlagenen Änderungen (um keine neuen, separaten Vorfälle zu verursachen!)

Abbildung 2 (siehe PDF) bietet eine Visualisierung des Incident-Mapping-Prozesses. Es handelt sich um einen schrittweisen Prozess, der mit einer Beschreibung des primären Vorfalls beginnt, der Identifizierung der Kausalkette und in der Entwicklung und dem Schutz von Empfehlungen zur Verhinderung eines erneuten Auftretens gipfelt. Die Vorbereitung ist ein entscheidender Schritt in diesem Prozess (dargestellt als Schritt 0). Eine Schlüsselkomponente dieses Schritts besteht darin, sicherzustellen, dass die Personen mit der entsprechenden Fachkompetenz zur Verfügung stehen, um einen Beitrag zu leisten.

Die Abfolge der Schritte kann mit den Werkzeugen verknüpft werden, die Personen vertraut sind, die mit Kepner-Tregoe gearbeitet haben (rechts angegeben) oder über dessen Methoden gelesen haben. Incident Mapping ist vor allem eine Form der hochgradig visuellen Situationsbeurteilung. Falls erforderlich, können andere Problemlösungs- und Entscheidungswerkzeuge im Kontext dieser Methodik/dieses Frameworks verwendet werden.

Wie Incident Mapping durchgeführt wird

Diese Analysetechnik (Incident Mapping) wird in IT- und Betriebsabteilungen in einer Vielzahl von Branchen weit verbreitet eingesetzt. Sie bietet mehrere Vorteile, darunter eine schnellere, klarere und produktivere Post-Incident-Review (PIR), deren Ergebnisse eine größere Wirkung auf die Organisation haben. An einer PIR können 10 bis 12 Personen beteiligt sein, die um einen Tisch sitzen, typischerweise für ein oder zwei Stunden. Es ist wahrscheinlich, dass sie alle auf die eine oder andere Weise am ursprünglichen Vorfall beteiligt waren, und sie überprüfen, was passiert ist, warum es passiert ist, welche Maßnahmen ergriffen wurden und was getan werden kann, um ein erneutes Auftreten zu verhindern.

Die vorhandene Dokumentation sollte vor dieser Überprüfung gesichtet werden. Dies sollte alle Maßnahmen oder Wiederherstellungen umfassen, die während des Vorfalls selbst aufgetreten sind. Diese Daten werden in der Regel von jemandem innerhalb der Support-Organisation aufgezeichnet, häufig von einem Major Incident Manager oder einem Problem Manager, der am Vorfall beteiligt war.

Die traditionelle textlastige Version der Vorfallüberprüfung ist in der Regel eine chronologische Geschichte darüber, wie sich das Problem entwickelt hat. Der Moderator muss die Gruppe Zeile für Zeile durch dieses Dokument führen, um eine Einigung über die Chronologie und die Beschreibung zu erzielen. Eine Incident Map hingegen bietet eine dynamische Möglichkeit, die Sitzung durchzuführen, indem die Informationen wie folgt aufgeschlüsselt werden:

  • Identifizierung einer Liste von Kausalketten
  • Definition einer Reihe von Elementen, die den Vorfall hätten verhindern sollen
  • Darstellung der Umstände, die den Schweregrad beeinflusst haben
  • Klare Identifizierung der Verantwortlichen für alle zukünftigen Maßnahmen

Viele finden den in Abbildung 3 dargestellten Mapping-Prozess prägnanter als eine Textdarstellung, da er den Vorfallpfad zeigt, indem er eine Reihe von Formen und Farben positioniert, die Details und Ereignisse darstellen, mit Pfeilen, die Beziehungen zueinander zeigen. Diese Darstellung ist eine schrittweise Visualisierung, die tendenziell einen schnelleren Konsens ermöglicht, als dies durch Textbeschreibungen erreicht werden kann.

Mithilfe dieser Karte kann das Team seinen Weg vom primären Ereignis – dem Ereignis, das das Support-Team darauf aufmerksam gemacht hat, dass ein Vorfall aufgetreten ist – zu den zugrunde liegenden Ursachen und dann zur Identifizierung von Barrieren, Systemen oder Maßnahmen arbeiten, die darauf ausgelegt sind, die Verbindungen zwischen diesen Bedingungen zu unterbrechen. Von dort aus geht das Team zu tieferen Analysen oder Entscheidungsfindungen über, um eine unbekannte Ursache zu untersuchen oder bestimmte Maßnahmen auszuwählen.

Die Probleme, die die größten Schwierigkeiten verursachen, sind wiederkehrende Vorfälle, die in der Regel mit einer Notlösung behoben, aber nie vollständig gelöst werden

Organisationen haben begonnen, proaktives Problemmanagement und Incident Mapping in ihre Post-Incident- oder After-Action-Reviews und in einigen Fällen in die Verwaltung ihrer laufenden Vorfälle zu integrieren. Ein Beispiel ist eine große und komplexe Regierungsbehörde in Großbritannien, in der von KT zertifizierte Programmleiter, die Problemlösung innerhalb der IT-Service-Organisation lehren und moderieren, eine visuelle Karte auf einem Whiteboard erstellen, um ihre Analyse eines Vorfalls zu dokumentieren und Folgemaßnahmen zuzuweisen. Einzelpersonen sind immer dafür verantwortlich, ausgewählte Maßnahmen in ergriffene Maßnahmen umzusetzen. Diese einfache Incident Map bildet die Grundlage für die Managementkommunikation und ist jetzt das Format, das das Management bei der Darstellung eines Vorfalls erwartet.

Zunehmend wird diese Mapping-Methodik in der „Pre-Mortem“-Analyse eingesetzt, einer Form des proaktiven Problemmanagements, die vor einem Vorfall stattfindet. Wenn eine größere Veränderung vorgenommen wird, fragen sich die Stakeholder: „Wenn wir diese Veränderung umsetzen, was könnte schiefgehen?“ Pre-Mortem-Incident-Maps erfordern viel kreatives, unkonventionelles Denken. Dieses Brainstorming kann sehr umfangreiche Maps hervorbringen, doch die Formatierung liefert eine Struktur für eine Analyse, die genutzt werden kann, um potenzielle Vorfälle zu verhindern oder abzumildern.

Eine Brückentechnik

Eine Incident Map ist eine weitaus bessere Möglichkeit, den Vorfall dem oberen Management zu berichten, das selten die Zeit oder Toleranz für dichte, detaillierte Dokumentation hat.

Die Incident Map dient als permanente Aufzeichnung eines Vorfalls. Wenn sie während der Verwaltung eines Live-Vorfalls erstellt wird, zeichnet die Incident Map die zu diesem Zeitpunkt ergriffenen Maßnahmen auf und kann mehrmals aktualisiert werden, wenn zusätzliche Maßnahmen ergriffen und Barrieren eingerichtet werden. Dies kann sich bis zum Abschluss einer Post-Incident-Review erstrecken. Die Incident Map dient als Audit des Denkens der Beteiligten, sodass jeder die Reise nachvollziehen kann, die das Incident-Management-Team unternommen hat, um eine Grundursache und eine Lösung zu erreichen.

Die Verwendung von Formen und Farben muss keiner bestimmten Konvention folgen, solange sich alle im Raum darüber einig sind, was jede Form darstellt. Die Methodik ist nicht von einer bestimmten Technologie abhängig, obwohl die Verwendung von Software, die für die Erleichterung des Incident Mapping entwickelt wurde, dem Prozess erheblichen Mehrwert verleihen kann. Beispiele sind Flussdiagramm-Tools wie Microsoft Visio® und CauselinkTM, ein Software-Tool, das auf die KT-Methodik ausgerichtet ist, wie unten in Abbildung 4 dargestellt (siehe PDF)

Die Verwendung eines dynamischen Software-Tools kann dazu beitragen, Cause-Mapping auf die nächste Ebene zu bringen, indem:

  • Unterstützung bei der Durchführung von Moderationen in Echtzeit
  • Aufbau und Nutzung einer Wissensdatenbank, die in der Lage ist, Datenelemente wie Beweise, Notizen, Aufgaben und Lösungen mit jeder Ursache zu verknüpfen
  • Ermöglichung von Berichterstattung, Aktionsverfolgung, Workflow-Verfolgung und Suche

Dies kann besonders relevant für Branchen und Funktionen sein, die stark compliance-getrieben sind und laufende Anforderungen haben, Dokumentation und Prüfpfade für Untersuchungen bereitzustellen.

Die Incident Map ermöglicht es dem Benutzer, einen Vorfall auf Schlüsselelemente zu destillieren, die von anderen leicht erfasst werden können, unabhängig davon, ob sie am Vorfall beteiligt waren oder nicht. Sie bietet ein effektives Vokabular und eine Reihe von Konventionen zur Sinnstiftung, indem Ereignisse in einer Kausalkette visuell dargestellt werden.

Einmal beherrscht, kann Incident Mapping eine effektive Brückentechnik sein, um die Organisation von der Abhängigkeit vom reaktiven Problemmanagement zu einer Denkweise der kontinuierlichen Verbesserung zu führen.

Tim Roberts, Senior Consultant, Kepner-Tregoe

Tim hat internationale Projekte geleitet, die kontinuierliche Verbesserung durch die Implementierung von Geschäftsprozessen unterstützen, einschließlich Root Cause Analysis, Incident Mapping und Projektmanagement. Er hat die Entwicklung neuer Strategien auf globaler Ebene auf Vorstandsebene moderiert und dann eine globale Implementierung mit dem oberen Management entworfen und koordiniert. Tims Branchenfokus liegt im IT-Service-Bereich, insbesondere bei privaten und öffentlichen Kunden, für die IT-Support eine kritische Funktion ist.

Christoph Goldenstern, Regional Managing Director Europe, Kepner-Tregoe

Christoph ist eine Führungskraft im Beratungsbereich mit über 20 Jahren Erfahrung in der Unterstützung von Organisationen in den Bereichen Strategie, operative und Service-Verbesserung. Als Mitglied des Executive Leadership Teams von KT und globaler VP für Strategie und Service Excellence war er für die Geschäftsstrategie von KT sowie für dessen Lösungen für IT Service Management und technischen Support verantwortlich.