Warum Cloud-Dienste das Problem-Management schwieriger und vielleicht auch ein wenig einfacher machen

Unternehmen und Behörden auf der ganzen Welt haben entdeckt, dass Cloud-Dienste ihre Organisationen schneller, skalierbarer und flexibler machen, wenn es darum geht, auf geschäftliche Veränderungen zu reagieren. Mit dynamischen Infrastrukturumgebungen wie Infrastructure as a Service (IaaS) und Platform as a Service (PaaS) und einer Vielzahl von SaaS-Software und Drittanbieterangeboten, die in der Cloud verteilt und betrieben werden, scheint es keine Grenzen zu geben, was Unternehmen tun können und wie schnell sie es tun können. Während Geschwindigkeit und technische Flexibilität für Geschäftsfunktionen, die schnell arbeiten müssen, sehr vorteilhaft sind, können sie für Problem-Manager, die herausfinden sollen, "was passiert ist" und "warum es passiert ist", wenn ein Problem den Geschäftsbetrieb stört, ernsthafte Probleme verursachen.

Die Werkzeuge und Techniken der Vergangenheit sind für die Geschwindigkeit der Cloud unzureichend

Problem-Manager verlassen sich seit langem auf zwei Kernsätze von Betriebsdaten, die ihnen bei der Diagnose der Problemursache helfen: Abhängigkeitsdaten und Änderungsdaten. Mit Cloud-Diensten benötigen Problem-Manager immer noch Abhängigkeits- und Änderungsdaten, aber jetzt müssen diese Betriebsdaten aktuell, vollständig und genau sein - und zwar jederzeit. Außerdem müssen sich die Betriebsdaten weiterentwickeln und mit jeder Änderung an Ihrer IT-Umgebung synchron bleiben. Wenn also ein Cloud-Service eine neue Instanz startet oder die Abhängigkeiten von Komponenten neu konfiguriert, müssen Sie das wissen, wenn es passiert.

In einer früheren Welt der lokalen Infrastruktur und der installierten Softwarepakete wurden Änderungen relativ selten vorgenommen (täglich, wöchentlich, monatlich), so dass sich die Abhängigkeits- und Änderungsdaten nicht sehr oft änderten. Bei Cloud-Diensten werden ständig Änderungen vorgenommen, und Abhängigkeiten bestehen möglicherweise nur für wenige Sekunden, bevor sie im Rahmen der normalen Cloud-Optimierung neu konfiguriert werden. Kommt es zu einem Zwischenfall, der zu einem Ausfall führt, existiert der "Schnappschuss" der Umgebung zum Zeitpunkt des Zwischenfalls möglicherweise nur für den Bruchteil einer Sekunde. Herkömmliche Ansätze zur Pflege von Änderungs- und Abhängigkeitsaufzeichnungen können nicht so schnell skaliert werden, dass sie eine sich so schnell ändernde Umgebung erfassen.

Cloud-Admin-Tools als Problem-Management-Toolset

Die einzigen Systeme, die in der Lage sind, die Änderungen in Cloud-Diensten zu erfassen, sind die in die Cloud-Dienste selbst eingebauten Verwaltungstools, die die Änderungen initiieren. Herkömmliche Configuration Management Databases (CMDBs) und Change-Record-Repositories in IT Service Management (ITSM)-Systemen können bei der Integration und bei übergreifenden Fragen helfen, aber die Cloud-Administrations-Tools verfügen über die Details, die für ein modernes Problemmanagement erforderlich sind. Problem-Manager müssen verstehen, dass Cloud-Services in einem völlig anderen Tempo arbeiten als herkömmliche IT-Umgebungen und dass die Diagnose der Grundursache von Problemen in diesen Umgebungen die Interaktion mit einem neuen Satz von Tools und Daten erfordert.

Eine hilfreiche Analogie ist der Unterschied zwischen einer Standbildfotografie und einer bewegten Bildsequenz. Problem-Manager sind es gewohnt, auf ein Standbild zu starren und nach verborgenen Details zu suchen, aber sie sind nicht an die Komplexität von Bildern in Bewegung gewöhnt. CMDB und Änderungsdatensätze geben dem Problemmanager Hinweise auf den allgemeinen Bereich in der Sequenz, aber für die Isolierung einzelner Frames und Objekte ist ein anderes Toolset erforderlich, um ein echtes Verständnis der Vorgänge zu entwickeln. Cloud-Admin-Tools tun im Wesentlichen das Gleiche. Sobald der Problem-Manager in der Lage ist, den Zeitpunkt des Vorfalls zu bestimmen, kann er sich darauf konzentrieren, was in dieser Zeit passiert ist und welche Aktionen/Aktivitäten bestimmte Ereignisse ausgelöst haben.

Moderne Möglichkeiten machen einige Problemmanagement-Aktivitäten überflüssig

Eine vielversprechende Entwicklung im Bereich der Cloud-Dienste ist die Reifung der Selbstheilungsfähigkeiten. Wenn Cloud-Verwaltungstools feststellen, dass ein Problem aufgetreten ist, sind sie zunehmend in der Lage, Daten zu sammeln und die Dienste neu zu konfigurieren, um die Kontinuität aufrechtzuerhalten und eine Unterbrechung für die Nutzer zu vermeiden. Diese erhöhte Service-Resilienz hat viele ITSM-Praktiker dazu veranlasst, sich zu fragen, ob es immer notwendig ist, die Ursache eines Problems zu verstehen, das sich von selbst gelöst hat.

Mit der Erweiterung der ITSM-Funktionen eines Unternehmens um maschinelles Lernen und künstliche Intelligenz werden sich viele der traditionellen Analyseprozesse, wie z. B. das Problemmanagement, in den nächsten Jahren wahrscheinlich erheblich verändern. Es ist unwahrscheinlich, dass diese Technologien das Problemmanagement als menschenbasierten Prozess abschaffen werden. Vielmehr werden maschinelles Lernen (ML) und künstliche Intelligenz (KI) ein verbessertes, robusteres Toolset und neue Informationen bereitstellen, die es den Problemmanagern ermöglichen, effektiver und effizienter zu arbeiten, vorausgesetzt, sie sind in der Lage, die Daten zu interpretieren und Rohdaten in verwertbare Informationen für ihre Fehlerbehebungen und Untersuchungen umzuwandeln. Cloud-Dienste können das Problemmanagement erschweren, aber andere Technologien werden die Auswirkungen ausgleichen und es ein wenig einfacher machen.

Über Kepner-Tregoe

Kepner-Tregoe ist seit mehr als 60 Jahren branchenführend bei Problemlösungs- und Service-Excellence-Prozessen. Die Experten von KT haben Unternehmen durch Tools, Schulungen und Beratung dabei geholfen, ihr Leistungsniveau im Vorfall- und Problemmanagement zu erhöhen - was zu hocheffektiven Service-Management-Teams geführt hat, die bereit sind, auf die kritischsten Probleme Ihres Unternehmens zu reagieren.

Blog Bild 1
Problemmanagement und IoT in der industriellen Umgebung
Blog Bild 1
Problem-Management. Wann soll man anfangen?
Blog Bild 1
Wie man ein Superstar im Störungs- und Problemmanagement wird
Blog Bild 1
Messung der Problem-Management-Qualität in einer ITIL-Umgebung, Teil 1

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!