Welche Probleme verursachen in Ihrer Organisation den größten Ärger und die höchsten Kosten? Abgesehen von existenzbedrohenden geschäftlichen Katastrophen, die Sie möglicherweise erlebt haben, werden Sie wahrscheinlich zustimmen, dass es sich um wiederkehrende Incidents handelt – im Grunde dieselben Problemtypen, die immer wieder auftreten.
Diese Incidents werden typischerweise kurzfristig mit Workarounds oder „Patches“ triagiert, aber nie vollständig gelöst. Die Organisation hat zu viele konkurrierende Prioritäten; sie kommt nie zu den „strukturellen Ursachen“ und setzt keine Maßnahmen um, um diese langfristig zu adressieren.
Der Ansatz im Problemmanagement ist reaktiv … sofern wir überhaupt aus dem Incident-Management-Modus herauskommen. Aber das muss nicht so sein. Problemmanagement kann reaktiv und/oder proaktiv sein. Proaktives Problemmanagement (PPM) ist nach wie vor ein stark unterschätzter Bestandteil von ITIL®, doch Organisationen beginnen, PPM sowie unterstützende Tools und Prozesse zu übernehmen.
Proaktives Problemmanagement (PPM) betrachtet Incidents ganzheitlich und zielt darauf ab, zukünftige Incidents zu identifizieren und zu verhindern, indem systemische Ursachen im Vorfeld erkannt und beseitigt werden – bevor sie eintreten oder Auswirkungen haben.
Das Problem visualisieren
PPM hat mindestens drei wesentliche Dimensionen:
- Monitoring – Geschäftsprozesse und Technologie, die darauf ausgelegt sind, Anomalien zu erkennen und zu protokollieren sowie Incidents abzufangen, bevor sie Auswirkungen haben
- Untersuchung nach einem Major Incident – Zu den zugrunde liegenden systemischen Themen vordringen, die wiederkehrende Incidents verursachen
- Kontinuierliche Serviceverbesserung (CSI) – Wir haben Themen, die über die technischen Aspekte hinausgehen. Was sagt uns das über unsere Value Streams, Praktiken oder Services? Was können wir besser machen?
Ein entscheidender Faktor beim Aufbau einer Disziplin für proaktives Problemmanagement ist die Kommunikation, damit alle Beteiligten im IT-Support – diejenigen, die Major Incidents direkt bearbeiten, und diejenigen, die sie aus einer eher entfernten, strategischen Perspektive verstehen müssen – nachvollziehen können, was passiert.
Ein typisches Incident-Review, das entweder während eines Problems oder als Post-Mortem nach der Behebung durchgeführt wird, findet als moderierte Konferenz statt. Dazu gibt es ein Moderationsdokument, das sich über fünf oder sechs Seiten erstrecken kann und im Wesentlichen den gesamten zeitlichen Ablauf eines Incidents festhält. In dem dichten und detaillierten Text ist es schwierig, Relevantes von Irrelevantem, Wichtiges von Unwichtigem zu trennen.
Eine einfachere und praktischere Möglichkeit für die Beteiligten zu kommunizieren, ist eine grafische Darstellung, die als Incident Map bezeichnet wird. Eine Incident Map ist das Ergebnis eines Prozesses, der den Incident systematisch beschreibt in Bezug auf:
- Den Haupt-Incident/das Hauptproblem und seine Auswirkungen
- Die Ursache-Wirkungs-Kette(n), die ihn ausgelöst haben
- Die Umstände, die zur Wirkung des Incidents beigetragen haben – warum die Auswirkungen mehr oder weniger schwer waren, als sie hätten sein können
- Barrieren, die durchbrochen wurden (sich als unwirksam erwiesen haben) – Maßnahmen, die die Ursache-Wirkungs-Kausalität hätten unterbrechen können, und warum sie nicht funktioniert haben
- Maßnahmen, die ergriffen wurden
- Maßnahmen, die vorgeschlagen, ausgewählt oder umgesetzt werden, um ein Wiederauftreten des Problems zu verhindern
- Maßnahmen zur Risikominderung bei vorgeschlagenen Änderungen (um keine neuen, separaten Incidents zu verursachen!)
Organisationen haben begonnen, proaktives Problemmanagement und Incident Mapping in ihre Post-Incident-Reviews zu integrieren – und in einigen Fällen auch in das Management laufender Incidents. Zudem wird die Mapping-Methodik zunehmend in der „Pre-Mortem“-Analyse eingesetzt – einer Form proaktiven Problemmanagements, die vor einem Incident stattfindet, wenn eine größere Änderung vorgenommen wird, bei der sich die Stakeholder fragen: „Wenn wir diese Änderung vornehmen, was könnte schiefgehen?“
Die Pre-Mortem-Risikobewertung ist kein neues Konzept. Vordenker im Operations-Bereich haben seit mindestens einem Dutzend Jahren darüber geschrieben. Doch erst seit Kurzem setzt es sich in IT-Support-Kreisen durch.
Eine strategische Notwendigkeit
Der Nutzen proaktiven Problemmanagements für das Risikomanagement liegt auf der Hand. Man muss die Erträge nicht einmal quantifizieren, um den Wert zu erkennen, große Incidents zu verhindern, bevor sie eintreten. Warum also verpflichtet sich nicht jede Organisation zu PPM?
Es gibt mehrere Gründe, aber wahrscheinlich ist die wichtigste Hürde kultureller Natur. In Infrastruktur-Support-Kreisen ist Prävention nicht sexy. Wir verehren heroische Problemlöser – diejenigen, die die großen Brände löschen. Wir können den geschäftlichen Impact in Dollar beziffern, wenn jemand Schmerzen lindert, die wir tatsächlich spüren. Es ist viel schwieriger, den Wert zu quantifizieren, ein Problem abzuwenden, das noch nie passiert ist – selbst wenn offensichtlich ist, dass es katastrophal wäre, wenn es jemals eintreten würde. Wenn Organisationen Support-Manager gebeten haben, Zeit und Budget in proaktives Problemmanagement zu investieren, haben diese Manager das nicht immer als attraktive Aufgabe gesehen.
In den letzten 15 bis 20 Jahren hat sich jedoch innerhalb der Support-Community eine Subkultur herausgebildet, die sich zunehmend mit der Komplexität von Infrastrukturen beschäftigt. 1997, bevor Netzwerke zu den riesigen, datengetränkten und miteinander vernetzten Ökosystemen wurden, die sie heute sind, war es sinnvoll, zu warten, bis etwas kaputtgeht, und es dann zu reparieren. Doch Systeme sind heute so groß und komplex, dass Chaoseffekte große Ausfälle unvorhersehbar, aber unvermeidlich machen. Proaktives Problemmanagement ist eine strategische Notwendigkeit.
Wenn Sie überzeugt sind, dass Ihr Support-Prozess proaktiver werden muss, ist ein guter erster Schritt, Ihre Kommunikation für Pre- oder Post-Mortem-Incident-Reviews zu verbessern. Wir haben gerade ein hilfreiches Whitepaper zu Incident Mapping und PPA veröffentlicht.
Holen Sie sich Ihr Exemplar von Beenden Sie das Feuerlöschen mit proaktivem Problemmanagement
Über Kepner-Tregoe
Kepner-Tregoe ist seit mehr als 60 Jahren Branchenführer für Trainings und Beratung im Problemlösen. Die Expertinnen und Experten haben mit Unternehmen jeder Größe zusammengearbeitet, um Best Practices und Techniken zu implementieren, Probleme schnell zu lösen, sie konsequent nachzuverfolgen und fundierte Entscheidungen zu treffen.