Von Tim Roberts, Christoph Goldenstern
In jeder Organisation, sei es in der Dienstleistungserbringung oder im Betrieb, gibt es in der Regel ein System zur Überprüfung größerer Vorfälle, nachdem der Vorfall zunächst bewältigt wurde. Dieses System kann als Post-Incident-Review (PIR) oder als After-Action-Review (ein Begriff, der häufig in der Fertigungsumgebung verwendet wird) bezeichnet werden. Die Organisation kann mehr als einen Ansatz verwenden und verschiedene organisatorische Silos können unterschiedliche Methoden haben.
Problemmanagement kann reaktiv oder proaktiv sein
Reaktives Problemmanagement zielt darauf ab, die Ursache bekannter Vorfälle zu finden und zu beseitigen. Das proaktive Problemmanagement, das eine ganzheitlichere Sichtweise einnimmt, blickt über den Vorfall hinaus, um künftige Vorfälle durch die Identifizierung und Beseitigung von (systemischen) Grundursachen, die immer wieder ähnliche Arten von Vorfällen verursachen, zu erkennen und zu verhindern.
Proaktives Problemmanagement berücksichtigt den Vorfall und die Ursache(n), die ihn ausgelöst haben, sowie die allgemeinen Bedingungen, die den Vorfall ermöglicht haben, so dass alle beitragenden Faktoren eingehender analysiert werden können. Ein entscheidender Schritt nach Abschluss dieser Analyse ist die sorgfältige Platzierung von Präventivmaßnahmen, die darauf abzielen, bestimmte Vorfälle, von denen bekannt ist, dass sie erhebliche negative Auswirkungen haben, zu entschärfen.
Wenn Sie die Probleme überprüfen, die Ihrem Unternehmen den größten Ärger bereiten, werden Sie wahrscheinlich feststellen, dass es sich um wiederkehrende Vorfälle handelt, die in der Regel kurzfristig mit einer Umgehung oder einem "Patch" angegangen werden, aber nie vollständig gelöst werden. Das Team geht nie den "strukturellen Ursachen" auf den Grund und ergreift daher keine Maßnahmen, um die Situation langfristig zu entschärfen.
Ein Vorteil des proaktiven Problemmanagements ist die Möglichkeit, sich auf die Beseitigung dieser systembedingten, wiederkehrenden Vorfälle zu konzentrieren. Diese Methodik wird in der Regel angewandt:
- Bei einer Post-Mortem-Überprüfung von größeren Ausfällen/Vorfällen
- Während der Live-Moderation bei größeren Zwischenfällen
- Als Bestandteil eines Programms zur kontinuierlichen Serviceverbesserung
Unternehmen, die einen aktiven Ansatz zur kontinuierlichen Serviceverbesserung verfolgen, werden feststellen, dass dieser Prozess verschiedene Möglichkeiten zur Verbesserung von Geschäftsprozessen und Technologien aufzeigen kann. Nach einem schwerwiegenden Vorfall oder Ausfall ist es sehr empfehlenswert, eine Post-Mortem-Überprüfung unter Einbeziehung der wichtigsten Beteiligten durchzuführen.
Was ist Incident Mapping?
Bei Kepner-Tregoe basiert das proaktive Problemmanagement auf einem zentralen Tool, das wir "Incident Mapping" nennen - ein Mittel zur Visualisierung des Vorfalls und zur Darstellung des "Ereignisses".
Die linke Seite von Abbildung 1 zeigt eine Momentaufnahme einer typischen Dokumentation zur Überprüfung eines Vorfalls, die zur Erleichterung einer Live-Sitzung zum Verständnis eines größeren Vorfalls verwendet wird. Es ist nicht ungewöhnlich, dass dieses Dokument bis zu fünf oder sechs Seiten dicht gepackten Textes umfasst, in dem Beobachtungen, Maßnahmen und Mitteilungen über den gesamten Zeitraum des Vorfalls aufgezeichnet werden. Das Ergebnis ist ein Wirrwarr detaillierter Informationen, die es schwierig machen, Relevantes von Irrelevantem, Wichtiges von Unwichtigem zu unterscheiden.
Auf der rechten Seite von Abbildung 1 wird der gesamte fünfseitige Bericht über den Vorfall in einem visuellen Flussdiagramm dargestellt, das allgemein als Vorfallskarte bekannt ist.
Es sollte leicht ersichtlich sein, dass die Karte viel einfacher und praktischer für die Personen ist, die den Vorfall verwalten. Sie ist auch ein weitaus besseres Mittel, um der Geschäftsleitung, die selten die Zeit oder die Toleranz für eine dichte, detaillierte Dokumentation hat, über den Vorfall zu berichten.
Wenn sie effektiv durchgeführt wird, ist diese Visualisierung das Ergebnis eines Prozesses, der den Vorfall systematisch in Bezug auf die folgenden Aspekte beschreibt:
- Untersuchungen der Hauptproblem und seine Auswirkungen
- Alle Ursache-Wirkungs-Kette(n) die ihn ausgelöst haben
- Untersuchungen der Umstände Beitrag zu den Auswirkungen des Vorfalls - Beschreibung, warum die Auswirkungen so schlimm waren oder nicht so schlimm waren, wie sie hätten sein können
- Herausforderungen gegen die verstoßen wurde - Maßnahmen, die die Ursache-Wirkung-Kausalität hätten unterbrechen können, und warum sie nicht funktioniert haben
- Aktionen die genommen wurden
- Aktionen die vorgeschlagen, ausgewählt oder umgesetzt werden, um ein erneutes Auftreten des Problems zu verhindern
- Maßnahmen zur Risikominderung von vorgeschlagenen Änderungen (um keine neuen, separaten Vorfälle zu verursachen!)
Abbildung 2 veranschaulicht den Prozess der Vorfallserfassung. Es handelt sich um einen schrittweisen Prozess, der mit der Beschreibung des primären Vorfalls und der Identifizierung der Kausalkette beginnt und mit der Entwicklung und dem Schutz von Empfehlungen zur Verhinderung eines erneuten Vorfalls endet. Die Vorbereitung ist ein entscheidender Schritt in diesem Prozess (dargestellt als Schritt 0). Eine Schlüsselkomponente dieses Schritts besteht darin, sicherzustellen, dass die Personen mit dem richtigen Fachwissen zur Verfügung stehen.
Die Abfolge der Schritte kann mit den Instrumenten verknüpft werden, die denjenigen vertraut sind, die mit Kepner-Tregoe gearbeitet (siehe rechts) oder über dessen Methoden gelesen haben. Das Incident Mapping ist vor allem eine Form der hochgradig visuellen Lagebeurteilung. Falls erforderlich, können andere Problemlösungs- und Entscheidungsfindungsinstrumente im Rahmen dieser Methodik/des Rahmens verwendet werden.
Wie das Incident Mapping durchgeführt wird
Diese Analysetechnik (Incident Mapping) wird in IT- und Betriebsabteilungen in einer Vielzahl von Branchen eingesetzt. Sie bietet zahlreiche Vorteile, u. a. eine schnellere, klarere und produktivere Überprüfung nach einem Vorfall (Post-Incident Review, PIR), deren Ergebnisse eine größere Wirkung auf das Unternehmen haben. Bei einer PIR sitzen in der Regel 10 bis 12 Personen ein bis zwei Stunden lang an einem Tisch. Wahrscheinlich waren sie alle auf die eine oder andere Weise in den ursprünglichen Vorfall involviert, und sie überprüfen, was passiert ist, warum es passiert ist, welche Maßnahmen ergriffen wurden und was getan werden kann, um eine Wiederholung zu verhindern.
Vor dieser Überprüfung sollten die vorhandenen Unterlagen geprüft werden. Dazu gehören alle Maßnahmen oder Wiederherstellungen, die während des Vorfalls selbst stattgefunden haben. Diese Daten werden in der Regel von einer Person innerhalb der Support-Organisation aufgezeichnet, häufig von einem Major Incident Manager oder einem Problem Manager, der an dem Vorfall beteiligt war.
Die traditionelle, textlastige Version der Vorfallsbesprechung ist in der Regel eine chronologische Geschichte, wie sich das Problem entwickelt hat. Der Moderator muss die Gruppe Zeile für Zeile durch dieses Dokument führen, um eine Einigung über die Chronologie und die Beschreibung zu erzielen. Eine Ereigniskarte hingegen bietet eine dynamische Möglichkeit, die Sitzung durchzuführen, indem sie die Informationen wie folgt aufschlüsselt:
- Identifizierung einer Liste von Kausalketten
- Festlegung einer Reihe von Punkten, die den Vorfall hätten verhindern sollen
- Aufzeigen der Umstände, die den Schweregrad beeinflusst haben
- Eindeutige Bestimmung der Verantwortlichen für alle künftigen Maßnahmen
Viele finden den in Abbildung 3 gezeigten Mapping-Prozess prägnanter als eine Textdarstellung, da er den Weg des Vorfalls durch die Positionierung einer Reihe von Formen und Farben zeigt, die Details und Ereignisse mit Pfeilen darstellen, die Beziehungen zueinander aufzeigen. Diese Darstellung ist eine schrittweise Visualisierung, die in der Regel zu einem schnelleren Konsens führt, als dies durch Textbeschreibungen erreicht werden kann.
Mithilfe dieser Karte kann sich das Team vom Primärereignis - dem Ereignis, das das Support-Team auf einen Vorfall aufmerksam gemacht hat - zu den zugrunde liegenden Ursachen vorarbeiten und dann Hindernisse, Systeme oder Maßnahmen ermitteln, die die Verbindungen zwischen diesen Bedingungen aufbrechen sollen. Von dort aus geht das Team zu tieferen Analysen oder zur Entscheidungsfindung über, um eine unbekannte Ursache zu untersuchen oder bestimmte Maßnahmen auszuwählen.
Die Probleme, die den größten Ärger verursachen, sind wiederkehrende Vorfälle, die in der Regel mit einer Umgehungslösung angegangen werden, aber nie vollständig gelöst werden
Organisationen haben damit begonnen, proaktives Problemmanagement und Incident Mapping in ihre Post-Incident- oder After-Action-Reviews und in einigen Fällen auch in das Management ihrer laufenden Incidents einzubauen. Ein Beispiel ist eine große und komplexe Regierungsbehörde in Großbritannien, in der KT-zertifizierte Programmleiter, die die Problemlösung innerhalb der IT-Service-Organisation lehren und erleichtern, eine visuelle Karte auf einem Whiteboard erstellen, um ihre Analyse eines Vorfalls zu dokumentieren und Folgemaßnahmen zuzuweisen. Jeder Einzelne ist stets dafür verantwortlich, dass die gewählten Maßnahmen auch umgesetzt werden. Diese einfache Karte bildet die Grundlage für die Kommunikation mit dem Management und ist nun das Format, das das Management erwartet, wenn ein Vorfall dargestellt wird.
Diese Mapping-Methode wird zunehmend in der "Pre-Mortem"-Analyse eingesetzt, einer Art proaktivem Problemmanagement, das vor einem Vorfall stattfindet. Wenn eine größere Änderung ansteht, fragen sich die Beteiligten: "Was könnte schief gehen, wenn wir diese Änderung vornehmen?" Pre-Mortem-Zwischenfallpläne beinhalten viel kreatives, unkonventionelles Denken. Diese Art von Brainstorming kann recht umfangreiche Karten hervorbringen, aber die Formatierung bietet eine Struktur für eine Analyse, die zur Vermeidung oder Abschwächung potenzieller Zwischenfälle genutzt werden kann.
Eine Überbrückungstechnik
Eine Vorfallskarte ist ein weitaus besseres Mittel, um den Vorfall der Geschäftsleitung zu melden, die selten die Zeit oder die Toleranz für eine dichte, detaillierte Dokumentation hat.
Die Ereigniskarte dient als permanente Aufzeichnung eines Ereignisses. Wird sie während des Managements eines aktuellen Vorfalls erstellt, zeichnet sie die zu diesem Zeitpunkt ergriffenen Maßnahmen auf und kann mehrmals aktualisiert werden, wenn zusätzliche Maßnahmen ergriffen und Barrieren errichtet werden. Dies kann bis zum Abschluss einer Überprüfung nach einem Zwischenfall geschehen. Die Incident Map dient als Audit des Denkens der Mitarbeiter, so dass jeder den Weg nachvollziehen kann, den das Incident Management Team zurückgelegt hat, um die Ursache und eine Lösung zu finden.
Die Verwendung von Formen und Farben muss nicht einer bestimmten Konvention folgen, solange sich alle Anwesenden darüber einig sind, was jede Form darstellt. Die Methodik ist nicht von einer bestimmten Technologie abhängig, obwohl der Einsatz von Software, die das Incident Mapping erleichtert, einen erheblichen Mehrwert für die
den Prozess. Beispiele hierfür sind Flussdiagramm-Tools wie Visio® von Microsoft und CauselinkTM, ein Software-Tool, das auf die KT-Methodik abgestimmt ist (siehe Abbildung 4).
Der Einsatz eines dynamischen Softwaretools kann dazu beitragen, das Cause-Mapping auf die nächste Stufe zu heben:
- Hilfe bei der Durchführung von Fazilitationen in Echtzeit
- Aufbau und Nutzung einer Wissensdatenbank, die in der Lage ist, Datenelemente wie Beweise, Notizen, Aufgaben und Lösungen zu jeder Ursache in Beziehung zu setzen
- Ermöglichung von Berichterstattung, Aktionsverfolgung, Workflow-Verfolgung und Suche
Dies kann besonders für Branchen und Funktionen von Bedeutung sein, die stark auf die Einhaltung von Vorschriften angewiesen sind und ständig Dokumentationen und Prüfpfade für Untersuchungen vorlegen müssen.
Die Ereigniskarte ermöglicht es dem Benutzer, einen Vorfall auf Schlüsselelemente zu reduzieren, die von anderen leicht verstanden werden können, unabhängig davon, ob sie an dem Vorfall beteiligt waren oder nicht. Sie bietet ein effektives Vokabular und eine Reihe von Konventionen für die Sinnfindung, indem sie Ereignisse in einer Kausalkette visuell darstellt.
Wenn sie einmal beherrscht wird, kann das Incident Mapping eine wirksame Brückentechnik sein, um die Organisation von einem reaktiven Problemmanagement zu einer kontinuierlichen Verbesserungsmentalität zu führen.
Tim Roberts, leitender Berater, Kepner-Tregoe
Tim hat internationale Projekte geleitet, die die kontinuierliche Verbesserung der Geschäftsprozesse bei der Installation unterstützen, einschließlich Ursachenanalyse, Incident Mapping und Projektmanagement. Er hat die Entwicklung einer neuen Strategie auf globaler Ebene auf Vorstandsebene unterstützt und dann eine globale Implementierung mit der Geschäftsleitung entworfen und koordiniert. Tims Branchenschwerpunkt liegt im Bereich der IT-Dienstleistungen, insbesondere bei Kunden aus dem privaten und öffentlichen Sektor, für die der IT-Support eine wichtige Funktion darstellt.
Christoph Goldenstern, VP Innovation & Service Excellence, Kepner-Tregoe
Christoph ist ein führender Berater mit mehr als 20 Jahren Erfahrung in der Unterstützung von Unternehmen in den Bereichen Strategie, Betriebs- und Serviceverbesserung. Als Mitglied des KT-Führungsteams und Global VP of Strategy and Service Excellence ist er für die Geschäftsstrategie von KT sowie für die Lösungen für IT-Service-Management und technischen Support verantwortlich.
Tim Roberts (troberts@kepner-tregoe.com) befindet sich im Vereinigten Königreich, während Christoph Goldenstern (cgoldenstern@kepner-tregoe.com) in der KT-Geschäftsstelle in den USA arbeitet. Setzen Sie sich mit ihnen in Verbindung, um mehr darüber zu erfahren, wie diese Verfahren für Ihr Team geeignet sein könnten.