Das Ziel von IT-Organisationen ist es, die bestmöglichen Services und Systeme bereitzustellen, um ihre Anwender und Geschäftsprozesse zu unterstützen. Leider sind Systeme (wie Menschen) nicht perfekt und fallen manchmal aus. Wenn dies geschieht, werden wohlmeinende IT-Mitarbeiter alles tun, um das Problem schnell zu beheben und das System wieder in den Normalzustand zu versetzen, damit die Anwender, die darauf angewiesen sind, ihre Arbeit fortsetzen können. Die Sicherstellung der Geschäftskontinuität ist für die IT-Funktion von entscheidender Bedeutung, aber die Antizipation und Verhinderung des erneuten Auftretens von Problemen ist ebenso wichtig.
Die Herausforderung entsteht, wenn diese beiden voneinander abhängigen ITSM-Prozesse miteinander in Konflikt geraten (ein häufiges Vorkommnis). In diesem Fall müssen IT-Mitarbeiter oft ihr Gift wählen – den Service schnell wiederherstellen oder das Problem dauerhaft lösen. Die Entwicklung von Leitlinien für den Umgang mit diesem Konflikt kann Mitarbeitern helfen, effektiver zu arbeiten und das richtige Gleichgewicht für Ihre Organisation sicherzustellen. Hier sind 6 Faktoren, die Sie bei der Entflechtung Ihrer Vorfall- und Problemmanagementprozesse berücksichtigen sollten.
1. Geschäftsauswirkungen – Jeder Vorfall und jedes Problem ist anders, und eine fundierte Entscheidung darüber zu treffen, wo Prioritäten gesetzt werden sollen, hängt weitgehend davon ab, über ein objektives Mittel zur Messung und Klassifizierung aktueller und zukünftiger Geschäftsauswirkungen zu verfügen. Die Anzahl der betroffenen Personen, die Kritikalität der betroffenen Geschäftsprozesse, die Zeitdauer, in der das System/der Service beeinträchtigt sein wird, und immaterielle Auswirkungen wie die Kundenwahrnehmung sollten alle berücksichtigt werden.
2. Ressourcennutzung – Dieselben IT-Mitarbeiter und technischen Ressourcen werden häufig sowohl zur Lösung aktiver Vorfälle als auch zur Verhinderung von Problemen eingesetzt. Das Ziel besteht darin, aus den Aktivitäten, an denen Ihre Ressourcen arbeiten, den größtmöglichen Gesamtnutzen für die Organisation zu erzielen. Die Anwendung von Portfoliomanagement-Techniken auf diese begrenzten Ressourcen kann dabei helfen zu bestimmen, ob die Fokussierung von Ressourcen auf einige wenige hochpriorisierte Aktivitäten, deren Verteilung auf viele Aktivitäten zur Abdeckung oder eine selektive Zuweisung basierend auf Fähigkeiten und Erfahrung die größten Erträge bringt.
3. Zerstörung von Hinweisen – Ein Neustart des Servers kann den Service wiederherstellen, aber er könnte genau die Informationen zerstören, die die IT zur Lösung des Problems benötigt. Oft gehen die Symptome und Kontextdaten darüber, was in der Umgebung vor sich ging, aktive Abhängigkeiten, verwendete Ressourcen, was der Anwender zu tun versuchte und wie das System beim Auftreten des Vorfalls funktionierte, verloren, wenn der Vorfall gelöst wird. Die Bereitstellung klarer Anweisungen zur Erfassung dieser Daten als Teil des Vorfallmanagements kann zukünftige Verzögerungen bei der Ermittlung der Grundursache des zugrunde liegenden Problems vermeiden.
4. Wiederauftreten & Auswirkungen – Incidents werden in der Regel unabhängig voneinander behandelt, jedoch muss das Problem Management das Risiko eines wiederholten Auftretens von Incidents berücksichtigen. Die Bewertung von Häufigkeit, Dauer und Auswirkungen des wiederholten Auftretens von Incidents kann den IT-Mitarbeitern und Entscheidungsträgern helfen, die Situation ganzheitlicher zu betrachten. Durch das „Verknüpfen der Einzelaspekte“ kann eine genauere Analyse dabei helfen, festzustellen, ob die Abmilderung der unmittelbaren Auswirkungen des Incidents Vorrang vor der Vermeidung eines erneuten Auftretens haben sollte.
5. Reproduzierbarkeit – Einige Probleme können nur durch Echtzeitanalyse der Systeme und Umgebung diagnostiziert werden, während Vorfälle auftreten – eine Reproduktion des Vorfalls zu einem späteren Zeitpunkt ist möglicherweise nicht möglich. Wenn vermutet wird, dass dies der Fall sein wird, ist es notwendig, die Aktivitäten des Problem- und Vorfallmanagements zu koordinieren, um eine Live-Diagnose während der Lösung des Vorfalls zu ermöglichen. Die Schlüssel dazu sind: klare Entscheidungsbefugnis, effektive Kommunikation und Koordination der Aktivitäten.
6. Verschiebung der Auswirkungen auf einen späteren Zeitpunkt – Eine der schwierigsten Entscheidungen im Vorfallmanagement ist die Bewertung der Auswirkungen einer Verlängerung des aktuellen Vorfalls zur Diagnose des zugrunde liegenden Problems gegenüber der Lösung der aktuellen Situation und der Erhöhung des Risikos eines erneuten Auftretens in der Zukunft, wenn die Auswirkungen unbekannt sind. Die meisten Unternehmen haben nichtlineare, aber vorhersehbare Zyklen von Geschäftsaktivitäten. Beispielsweise können die Auswirkungen mitten in der Nacht geringer oder in der letzten Woche des Quartals während des Endspurts zur Erreichung finanzieller Ziele höher sein. Ein klares Verständnis dieser Zyklen hilft IT-Mitarbeitern, Entscheidungen bei der Behandlung von Vorfällen stärker an den Geschäftsanforderungen auszurichten.
Die Problemlösungsmethodik Ihrer Organisation sollte Prozessschritte zur Erfassung diagnostischer Daten als Teil des Vorfallmanagements und klar definierte Entscheidungskriterien für die Untersuchung eines Problems umfassen. Es gibt oft keine eindeutig richtige Antwort darauf, wann nur der Service wiederhergestellt oder wann ein Problem dauerhaft gelöst werden sollte, aber die Berücksichtigung der 6 aufgeführten Faktoren wird helfen.
Manchmal muss man einfach sein Gift wählen.
Kepner-Tregoe ist ein Branchenführer in der Problemlösung – das Unternehmen unterstützt Firmen dabei, ihre ITSM-Prozesse mit den Werkzeugen, Techniken, Fähigkeiten und Prozessen zu verfeinern, um IT-Mitarbeitern zu ermöglichen, Anwender und Geschäftsprozesse besser zu unterstützen.