Kontakt

Incident Management vs. Major Incident Management

Zwei junge Männer arbeiten zusammen im Büro

Warum Unternehmen einen unterschiedlichen und separaten Ansatz benötigen

Von Sascha Laufenberg, Kepner-Tregoe

Die meisten Unternehmen verfügen über Incident-Management-Prozesse zur Bewältigung alltäglicher kleiner bis mittlerer Störungen. Diese Prozesse basieren auf bewährten Kundenservice-Methoden und/oder auf Standardverfahren des IT-Service-Managements (wie z. B. ITIL). Incident-Management-Prozesse sind in der Regel effektiv bei der Bewältigung einer großen Anzahl von Incidents und Serviceanfragen mit relativ geringer Auswirkung. Major Incidents unterscheiden sich jedoch von ihren kleineren, alltäglichen Gegenstücken und erfordern einen separaten Ansatz.

Auswirkungen und Häufigkeit

Ein normaler Vorfall betrifft in der Regel nur einige wenige Benutzer. Hier sind Reaktions- und Lösungszeiten oft lang, um die Betriebskosten niedrig zu halten. Major Incidents oder Großstörungen hingegen sind solche, die große und erhebliche Auswirkungen auf das Unternehmen haben. Großstörungen treten (hoffentlich) nicht sehr oft auf, aber wenn sie auftreten, können ganze Geschäftsbereiche betroffen sein. Bei Großstörungen überwiegen die Kosten der Auswirkungen bei weitem die Kosten der Lösung, und die wichtigsten Erfolgsfaktoren sind die Reaktionszeit und die Qualität der Reaktion.

Fertigkeiten und Beteiligte

Service-Desk-Mitarbeiter mit begrenzter Ausbildung und technischen Kenntnissen sind oft diejenigen, die sich um den Großteil der Incidents kümmern müssen. Schwierigere Sachverhalte werden an Eskalationsteams der zweiten und dritten Ebene weitergeleitet. Diese verfügen in der Regel über technisches Fachwissen, aber das Ziel ist immer noch, die am wenigsten technischen (und kostengünstigsten) verfügbaren Ressourcen zur Lösung des Sachverhalts einzusetzen. Großstörungen erfordern einen anderen Ansatz. Das Ziel sollte hier sein, direkt die Mitarbeiter einzusetzen, die die Störung am schnellsten beheben und damit eine längere Beeinträchtigung des Geschäftsbetriebs vermeiden können. Bei diesen Ressourcen handelt es sich in der Regel um hochqualifizierte (und hochbezahlte) Fachexperten.

Prozesse

In den letzten Jahren ging der Trend bei den Incident-Management-Prozessen in Richtung Self-Service, Automatisierung und asynchrone Interaktion mit den Support-Mitarbeitern (z.B. E-Mail-Interaktionen mit Mitarbeitern in globalen Call-Centern). Dieser Ansatz zielt darauf ab, den Incident-Management-Prozess im Hinblick auf Skalierbarkeit zu optimieren und die menschliche Interaktion zu reduzieren. Dies geht jedoch auf Kosten der Zeit, die für die Lösung komplexerer Störungen benötigt wird. Die Prozesse für Großstörungen müssen daher genau umgekehrt optimiert werden, wobei die Effektivität der Lösung und die Zeit bis zur Lösung am wichtigsten sind und die Ressourcenkosten und die Automatisierung in den Hintergrund treten.

Kommunikation

Bei normalen Incidents wird die Benachrichtigung vom Management als Fehler wahrgenommen. Großstörungen sind insofern anders, als eine aktive und umfassende Kommunikation mit den Interessengruppen nicht nur für eine genaue Bewertung der Auswirkungen hilfreich ist, sondern auch dazu beiträgt, die Erwartungen zu steuern und den Interessengruppen das Vertrauen zu vermitteln, dass der Vorfall unter Kontrolle ist. Bei vielen Großstörungen spielt die durch die Kommunikation mit den Beteiligten erzeugte Wahrnehmung eine größere Rolle bei der Bestimmung der Gesamtauswirkungen als das technische Problem und die damit verbundenen Symptome. Eine wirksame Kommunikation bei Großstörungen muss sich an 4 verschiedene Stakeholder-Gruppen richten:

  • Die betroffene Nutzergemeinschaft, deren Aktivitäten von dem Vorfall direkt betroffen sind
  • Indirekt oder potenziell betroffene Interessengruppen, deren Vertrauen die Bewältigung der Störung wahrscheinlich beeinflusst
  • Interne Teams und KMUs, die an der Diagnose und Lösung von Vorfällen beteiligt werden müssen (dies kann auch Vendor umfassen)
  • Betreuung und IT-Management
Ein bunt gemischtes Team junger Mitarbeiter bei einem Treffen

Exekutive und Entscheidungen

Großstörungen erfordern fast immer die Beteiligung einer Führungskraft, die bei der Analyse der Auswirkungen und der Kommunikation hilft und wichtige Entscheidungen trifft, um Hindernisse aus dem Weg zu räumen. Die zur Behebung der Großstörung erforderlichen Aktivitäten erstrecken sich dabei oft über die Grenzen der Geschäftsbereiche hinaus, so dass sich Fragen der Entscheidungsbefugnis ergeben. Bei unklaren Richtlinien kann es schnell mal zu Überschneidungen von Befugnissen und zu Verwirrungen kommen. Ein Prozess für das Management von Großstörungen sollte funktionsübergreifende Richtlinien für die Entscheidungsfindung enthalten, um Verzögerungen und Verwirrungen zu vermeiden.

Symptome lindern vs. ein Wiederauftreten verhindern

Das Hauptziel während einer Großstörung besteht darin, die Auswirkungen zu mindern und Korrekturmaßnahmen zu ergreifen, um den normalen Geschäftsbetrieb wiederherzustellen. Das Verstehen der Grundursache und die Implementierung von Maßnahmen, die ein erneutes Auftreten des Problems verhindern sollen, fallen in den Aufgabenbereich vom Problem Management. Da eine Großstörung eine größere Auswirkung auf das Geschäft hat, ist es üblich, dass Führungskräfte aktiv nachfassen, um sicherzustellen, dass die Grundursache identifiziert und Präventivmaßnahmen zeitnah umgesetzt werden.

In dem Durcheinander, das bei der Bewältigung aktiver Großstörungen herrscht, gehen oft aber wichtige diagnostische Informationen verloren, was die Ermittlung der eigentlichen Ursache erschwert.

Um diese beiden Fallstricke zu vermeiden, ist ein hoch integrierter, umfassender Incident- und Problem-Management-Prozess erforderlich, bei dem kritische "Ursacheninformationen" aktiv gesichert und dokumentiert werden und der Service kontinuierlich verbessert wird. Nur so kann echte IT-Stabilität über einen längeren Zeitraum hinweg erreicht werden.

Warten Sie nicht, bis es zu spät ist!

Die Unternehmensleitung kann nicht kontrollieren, wann sich Großstörungen ereignen, aber sie kann kontrollieren, wie das Unternehmen mit Großstörungen umgeht und wie es darauf reagiert. Ein exzellenter Gesamtservice, zu dem auch ein wirksamer und gut verstandener Prozess für das Management von Großstörungen gehört, ist der Schlüssel zu einer schnellen Reaktion, zur Behebung der unmittelbaren Auswirkungen, zur Wahrung des Rufs des Unternehmens und zur Minderung des Betriebs- und Kundenrisikos.

Als branchenführendes Problemlösungsunternehmen arbeitet Kepner-Tregoe seit mehr als 60 Jahren mit Kunden zusammen, um deren Fähigkeiten zur Bewältigung von Großstörungen im Betrieb und in der IT zu verbessern und Sie bei der Erreichung von Service Excellence zu unterstützen.

 

Werfen Sie doch einen Blick auf unsere Workshopseite oder treten Sie mit uns direkt in Kontakt.

Mehr lesen

Blog Bild 1
Zwischenfälle und Probleme - zwei Seiten einer Münze
Blog Bild 1
Major Incident Management:
Warten Sie nicht mit der Planung Ihrer Reaktion auf Major Incidents

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!