Zwischenfälle und Probleme - zwei Seiten einer Münze

Im IT-Service-Management sind Vorfälle und Probleme nicht unabhängig voneinander. Sie sind verschiedene Dimensionen desselben Problems - zwei Seiten derselben Münze. Bei Vorfällen handelt es sich um die unmittelbaren Auswirkungen des Problems auf den normalen Geschäftsbetrieb. Incident Manager sind gefordert, das Problem zu verstehen, die Auswirkungen zu mindern und den Service so schnell wie möglich wiederherzustellen.

Probleme sind die langfristigen Auswirkungen des Problems und die Risiken, die das Problem für die Aufrechterhaltung normaler, zukünftiger Geschäftsaktivitäten darstellt. Problem-Manager müssen die Ursache des Problems, die damit verbundenen Abhängigkeiten und Umweltfaktoren untersuchen, die zu einem erneuten Auftreten des Problems führen könnten. Diese Untersuchung hilft ihnen auch dabei festzustellen, wie hoch das Risiko (Auswirkungen und Wahrscheinlichkeit) ist, das mit dem Problem verbunden ist, wenn die Ursache nicht behoben wird, und ob es angemessen ist, eine Art von Korrekturmaßnahme (langfristige Lösung) zu ergreifen, anstatt das Risiko einfach anzuerkennen und zu akzeptieren.

Warum Incident- und Problemmanagement in den meisten Unternehmen getrennt sind

Wenn Incident- und Problemmanagement beide auf Leistungsprobleme abzielen, warum sind sie dann im Standard-ITSM-Paradigma getrennte Funktionen? Die Antwort liegt in den vermeintlich gegensätzlichen Prioritäten dieser beiden Funktionen. Das Incident Management konzentriert sich auf die unmittelbaren Auswirkungen und nicht auf das, was in der Zukunft passieren könnte. Ihr Unternehmen braucht Incident Manager, die diesen Fokus beibehalten, um längere Betriebsunterbrechungen und Ausfälle zu verhindern, die der Produktivität oder dem Ruf großen Schaden zufügen könnten.

Problemmanagement braucht in den meisten Fällen Zeit, um gründlich und korrekt zu arbeiten, vorausgesetzt, wir haben es mit einem Problem zu tun, dessen Ursache nicht bekannt ist. Sie wollen nicht, dass Problem-Manager voreilige Schlüsse ziehen und ein wichtiges Detail übersehen.

Gemeinsame Nutzung von Daten zwischen Incident- und Problemmanagement

Auch wenn Incident- und Problemmanagement in vielen IT-Organisationen getrennte Funktionen sind, ist es unerlässlich, dass sie Informationen und Erkenntnisse austauschen, um einen durchgängigen Informationsfluss zu schaffen. Incident Manager sind an vorderster Front, wenn das Problem auftritt. Sie sehen, was mit dem System oder der Anwendung passiert, das bzw. die nicht die gewünschte Leistung erbringt. Sie sehen, welche Auswirkungen das Problem auf das Unternehmen hat. Sie sehen auch andere Ereignisse in der Umgebung, während das Problem auftritt. Dieser letzte Punkt ist besonders wichtig. Die meisten Incidents (und Probleme) werden durch eine Änderung, eine Aktion oder ein anderes Ereignis in Verbindung mit einer Dienstkomponente oder Abhängigkeit verursacht.

Diese Faktoren sind oft schwer (wenn nicht gar unmöglich) zu erkennen, wenn der Dienst wiederhergestellt ist. Infolgedessen sind Incident Manager die "Augen und Ohren" der Problemmanagementfunktion - sie sammeln wertvolle Informationen, die für die Ursachenanalyse und Problemdiagnose benötigt werden. Anstatt Incident- und Problem-Management als zwei Funktionen zu betrachten, sollten wir sie als ein Kontinuum betrachten. Außerdem ist es ein Trugschluss zu glauben, dass es keine Situationen gibt, in denen Incident Manager (vor allem bei größeren Vorfällen) eine Art von Ursachenanalyse einleiten und manchmal sogar leiten müssen, wenn die bestehenden Wiederherstellungsoptionen unwirksam oder einfach zu riskant sind, um sie ohne Kenntnis der Ursache durchzuführen. Wenn man diese Aufgabe während eines laufenden Vorfalls an das Problemmanagement abgibt, kann das den Ausfall verlängern und zu einer Menge "Ping-Pong"-Verhalten führen.

Problem-Manager hingegen führen die "Liste der bekannten Probleme", auf die sich die Vorfallsmanager stützen, um Probleme zu diagnostizieren und mögliche kurzfristige Lösungen schnell zu finden. Selbst nachdem die Problem-Manager die Ursache eines Problems und die Schritte zur langfristigen Behebung ermittelt haben, wird oft viel Zeit benötigt, um die Korrekturmaßnahmen umzusetzen und das Problem vollständig zu beheben. Während dieser Zeit besteht für das Unternehmen die Gefahr, dass das Problem erneut auftritt und zu weiteren Betriebsstörungen führt. Es ist wichtig, dass die Problemmanager den Störungsmanagern klare Anweisungen geben, was zu tun ist, wenn das Problem erneut auftritt, um eine erneute Unterbrechung des Geschäftsbetriebs zu vermeiden. Wenn während eines erneuten Auftretens des Problems zusätzliche Datenerhebungen erforderlich sind, müssen die Vorfallmanager dies ebenfalls wissen, damit sie die erforderlichen Daten sammeln können, bevor sie Korrekturmaßnahmen einleiten, die möglicherweise die für das Problemmanagement erforderlichen Anhaltspunkte zerstören oder verfälschen könnten.

Incident- und Problem-Manager arbeiten als Team zusammen

Unternehmen, die ein hohes Maß an Service Excellence erreichen, wissen, dass Incident- und Problem-Manager im Rahmen eines End-to-End-Support-Prozesses als Team zusammenarbeiten müssen, um das gemeinsame Ziel der Minimierung von Geschäftsunterbrechungen und deren Auswirkungen zu erreichen.

Blog Bild 1
Hervorragender Service bedeutet, für Misserfolge zu planen
Blog Bild 1
Bei Service Excellence geht es um Kunden, nicht um Ihre Produkte
Blog Bild 1
Wie Cybersicherheit das Gesicht des Incident Management verändert
Blog Bild 1
Major Incident Management:
Warten Sie nicht mit der Planung Ihrer Reaktion auf Major Incidents

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!