Störungsbehebung oder Problemlösung - wählen Sie Ihr Gift

Das Ziel von IT-Organisationen ist es, die bestmöglichen Dienste und Systeme zur Unterstützung ihrer Benutzer und Geschäftsprozesse bereitzustellen. Leider sind Systeme (wie Menschen) nicht perfekt und gehen manchmal kaputt. Wenn das passiert, tun wohlmeinende IT-Mitarbeiter alles, was sie können, um das Problem schnell zu beheben und das System wieder in den Normalzustand zu versetzen, damit die Benutzer, die sich darauf verlassen, ihre Arbeit weiter erledigen können. Die Gewährleistung der Geschäftskontinuität ist für die IT-Funktion von entscheidender Bedeutung, aber genauso wichtig ist es, Probleme vorherzusehen und zu verhindern, dass sie wieder auftreten.

Die Herausforderung entsteht, wenn diese beiden voneinander abhängigen ITSM-Prozesse miteinander in Konflikt geraten (was häufig vorkommt). In diesem Fall müssen sich die IT-Mitarbeiter oft entscheiden, ob sie den Dienst schnell wiederherstellen oder das Problem dauerhaft beheben wollen. Die Entwicklung einer Reihe von Richtlinien für den Umgang mit diesem Konflikt kann den Mitarbeitern helfen, effektiver zu arbeiten und das richtige Gleichgewicht für Ihre Organisation zu finden. Im Folgenden finden Sie 6 Faktoren, die Sie bei der Entflechtung Ihrer Vorfall- und Problemmanagementprozesse berücksichtigen sollten.

1. Auswirkungen auf das Geschäft - Jeder Vorfall und jedes Problem ist anders, und eine fundierte Entscheidung darüber, wo die Priorität zu setzen ist, hängt weitgehend davon ab, ob es ein objektives Mittel zur Messung und Klassifizierung der aktuellen und künftigen Auswirkungen auf das Geschäft gibt. Die Anzahl der betroffenen Personen, die Kritikalität der betroffenen Geschäftsprozesse, die Dauer der Beeinträchtigung des Systems/Dienstes und immaterielle Auswirkungen wie die Kundenwahrnehmung sollten berücksichtigt werden.

2. Nutzung der Ressourcen - Oft werden dieselben IT-Mitarbeiter und technischen Ressourcen eingesetzt, um aktive Vorfälle zu beheben und Probleme zu verhindern. Ziel ist es, mit den Aktivitäten, an denen Ihre Ressourcen arbeiten, einen möglichst großen Gesamtnutzen für das Unternehmen zu erzielen. Die Anwendung von Portfoliomanagementtechniken auf diese begrenzten Ressourcen kann dabei helfen, festzustellen, ob die Konzentration der Ressourcen auf einige wenige Aktivitäten mit hoher Priorität, die Verteilung auf viele Aktivitäten zur Abdeckung oder die selektive Zuweisung auf der Grundlage von Fähigkeiten und Erfahrung den größten Nutzen bringt.

3. Zerstörung von Brotkrumen - Ein Neustart des Servers kann zwar den Dienst wiederherstellen, zerstört aber möglicherweise genau die Informationen, die die IT-Abteilung zur Behebung des Problems benötigt. Oft gehen die Symptome und Kontextdaten darüber, was in der Umgebung vor sich ging, aktive Abhängigkeiten, genutzte Ressourcen, was der Benutzer zu tun versuchte und wie das System funktionierte, als der Vorfall auftrat, verloren, wenn der Vorfall behoben ist. Die Bereitstellung klarer Anweisungen für die Erfassung dieser Daten als Teil der Verwaltung des Vorfalls kann zukünftige Verzögerungen bei der Suche nach der Ursache des zugrunde liegenden Problems vermeiden.

4. Wiederholung und Auswirkungen - Vorfälle werden in der Regel unabhängig voneinander behandelt, doch muss beim Problemmanagement das Risiko berücksichtigt werden, dass Vorfälle wiederholt auftreten. Die Bewertung von Häufigkeit, Dauer und Auswirkungen wiederholter Vorfälle kann den IT-Mitarbeitern und Entscheidungsträgern helfen, die Situation ganzheitlich zu betrachten. Durch eine genauere Analyse kann festgestellt werden, ob die Milderung der unmittelbaren Auswirkungen des Vorfalls Vorrang vor der Verhinderung eines erneuten Vorfalls haben sollte.

5. Reproduzierbarkeit - Einige Probleme können nur durch eine Echtzeit-Analyse der Systeme und der Umgebung diagnostiziert werden, während der Vorfall auftritt - eine Reproduktion des Vorfalls zu einem späteren Zeitpunkt ist möglicherweise nicht möglich. Wenn dies vermutet wird, ist es notwendig, die Aktivitäten des Problem- und Störungsmanagements zu koordinieren, um eine Live-Diagnose zu ermöglichen, während die Störung behoben wird. Klare Entscheidungsbefugnisse, wirksame Kommunikation und Koordinierung der Aktivitäten sind die Schlüssel zu einer effektiven Vorgehensweise.

6. Verschiebung der Auswirkungen auf einen späteren Zeitpunkt - Eine der schwierigsten Entscheidungen im Rahmen des Störungsmanagements ist die Abwägung, ob es sinnvoller ist, die aktuelle Störung zu verlängern, um das zugrundeliegende Problem zu diagnostizieren, oder die aktuelle Situation zu beheben und damit das Risiko eines erneuten Auftretens in der Zukunft zu erhöhen, wenn die Auswirkungen unbekannt sind. Die meisten Unternehmen haben nichtlineare, aber vorhersehbare Zyklen von Geschäftsaktivitäten. So können die Auswirkungen beispielsweise mitten in der Nacht geringer sein oder in der letzten Woche des Quartals, wenn es darum geht, die Finanzziele zu erreichen, größer sein. Ein klares Verständnis dieser Zyklen hilft den IT-Mitarbeitern, bei der Behandlung von Vorfällen Entscheidungen zu treffen, die besser mit den Geschäftsanforderungen übereinstimmen.

Die Problemlösungsmethodik Ihres Unternehmens sollte Prozessschritte für die Erfassung von Diagnosedaten als Teil des Störungsmanagements und klar definierte Entscheidungskriterien für die Untersuchung eines Problems umfassen. Es gibt oft keine eindeutige Antwort auf die Frage, wann der Betrieb wiederhergestellt oder ein Problem dauerhaft behoben werden sollte, aber die Berücksichtigung der 6 aufgeführten Faktoren ist hilfreich.

Manchmal muss man einfach sein Gift nehmen.

Kepner-Tregoe ist branchenführend bei der Problemlösung und hilft Unternehmen bei der Verfeinerung ihrer ITSM-Prozesse mit den Tools, Techniken, Fähigkeiten und Prozessen, die IT-Mitarbeiter in die Lage versetzen, Benutzer und Geschäftsprozesse besser zu unterstützen.

Verwandte Blogs

Blog Bild 1
Zwischenfälle und Probleme - zwei Seiten einer Münze
Blog Bild 1
Bewährte Praktiken bei der Nachbereitung von Zwischenfällen verbessern die Reaktion auf Zwischenfälle dramatisch
Blog Bild 1
Wie man ein Superstar im Störungs- und Problemmanagement wird
Blog Bild 1
Grundlegendes zu schweren Unfällen: Kommunikation und wirksame Maßnahmen. Hilfe! Was sollen wir jetzt tun?

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!