Automatisierung findet statt – daran besteht kein Zweifel. Für die IT-Abteilungen von Unternehmen bedeutet Automatisierung, Technologie-Ressourcen schnell und effizient bereitzustellen (und erneut bereitzustellen), um die Auslastung zu optimieren und Betriebskosten zu senken. Das sind gute Dinge … aber nicht ohne Herausforderungen. Dieselben Automatisierungsfähigkeiten, die Geschwindigkeit und geschäftliche Agilität ermöglichen, machen es IT-Organisationen zunehmend schwer, Probleme zu lösen, wenn sie in der Technologieumgebung auftreten.
Die erste Herausforderung besteht darin, dass sich durch Automatisierung ermöglichte Technologieumgebungen schneller weiterentwickeln als die IT-Prozesse, mit denen sie verwaltet werden. Es ist großartig, wenn Ihr Auto schnell fahren kann – aber wenn Sie bei hoher Geschwindigkeit nicht lenken können, haben Sie ein Problem. Die meisten IT-Problemlösungsprozesse umfassen Diagnosemethoden, die versuchen, das ursprüngliche Problem zu reproduzieren, indem Umgebungsfaktoren zusammengeführt und bekannte Ereignisabfolgen wiederholt werden. Automatisierungsfähigkeiten waren bislang vor allem darauf ausgerichtet, Veränderungen (und geschäftliche Agilität) zu beschleunigen – nicht darauf, die Wiederholbarkeit zu ermöglichen, die nötig ist, um zu verstehen, was passiert ist und warum. Wenn IT-Mitarbeitende versuchen, einen Fehler zu reproduzieren, hat sich die Umgebung wahrscheinlich bereits verändert, und ihnen fehlen die Werkzeuge, um sie so nachzustellen, wie sie zum Zeitpunkt des Vorfalls war.
Cross-Platform-/Anbieter-Umgebungen verschärfen dieses Problem zusätzlich, indem sie zentrale Teile des Technologie-Gesamtbilds außerhalb der direkten Kontrolle des Unternehmens verlagern – und eine Koordination über Anbieter hinweg erfordern, die miteinander konkurrieren und Informationen nicht wirklich offen teilen möchten. Anbieterübergreifende Umgebungen bieten Möglichkeiten zur Kostenarbitrage (für eine bestimmte Aktivität die günstigsten Optionen nutzen), lassen der IT jedoch häufig die Transparenz über das Gesamtbild fehlen, weil die Diagnosewerkzeuge der einzelnen Anbieter jeweils einzigartig sind und die meisten nicht interoperabel sind. Service-Management- und Operations-Management-Tools von Drittanbietern haben versucht, diese Lücke zu schließen, bleiben jedoch in den meisten Fällen hinter dem zurück, was nötig wäre, um der IT das vollständige Set an Problemlösungswerkzeugen zu geben, das sie benötigt, um in einer hochdynamischen, automatisierten Technologieumgebung erfolgreich zwischen Anbietern zu vermitteln.
Geschwindigkeit und Komplexität der Umgebung sind nicht die einzigen Herausforderungen (viele Dinge sind komplex, entwickeln sich schnell weiter und sind dennoch beherrschbar). Problematisch wird vor allem der kontinuierliche Wandel, weil die meisten IT-Prozesse nach dem Muster „anhalten, herausfinden, was passiert ist, beheben und dann wieder weitermachen“ aufgebaut sind (statt das Flugzeug zu reparieren, während es fliegt). Wenn ein Ereignis oder Incident eintritt, ist es oft zu spät, die Aktionen und Umgebungsfaktoren zu erfassen, die ihn verursacht haben (die Brotkrumenspur ist verschwunden). Die dynamische Neukonfiguration der Infrastruktur (ermöglicht durch Automatisierung) erschwert die Diagnose von Umgebungsproblemen, da es möglicherweise keine Möglichkeit gibt zu wissen, ob dieselben Umgebungs-Konfigurationen in Zukunft erneut auftreten werden. Die Analyse von Ursache-Wirkungs-Mustern kann helfen, damit IT-Mitarbeitende ableiten, was das Problem verursacht haben könnte – doch oft fehlt ihren Hypothesen das erforderliche Maß an Sicherheit, um präventive Maßnahmen zu ermöglichen.
Mit der Zeit entwickeln sich Automatisierungsregeln weiter und verstärken sich gegenseitig – sie werden zunehmend komplex, bis sie einen Kipppunkt erreichen, an dem Maschinen sie zwar ausführen können, Menschen die Regeln jedoch nicht mehr interpretieren können. Übrigens passiert das auch, wenn die Personen, die die Regeln erstellt haben, ihre Rollen wechseln. Ein mangelndes Verständnis dafür, warum etwas auf eine bestimmte Weise implementiert wurde, verhindert nicht nur eine wirksame Problemdiagnose, sondern hemmt auch die Fähigkeit der IT, Änderungen vorzunehmen, um zu verhindern, dass dasselbe Umgebungs-/Ereignisszenario in Zukunft erneut auftritt. Um diese Situation zu adressieren, benötigen IT-Mitarbeitende im Problemmanagement die Fähigkeit, sowohl zu bestimmen, was in der Technologieumgebung zum Zeitpunkt des Ereignisses vor sich ging, als auch warum die Automatisierungsregeln die Konfiguration auf diese Weise umgesetzt haben – etwas, womit die IT heute zu kämpfen hat.
Moderne IT-Umgebungen entwickeln sich schnell weiter, und IT-Mitarbeitende haben nur ein begrenztes Zeitfenster, um Probleme zu reproduzieren und zu lösen, wenn sie auftreten. Um bei der Diagnose von Problemen in der Automatisierung erfolgreich zu sein, benötigen die IT-Mitarbeitenden Ihres Unternehmens eine robuste und gut strukturierte Methodik, die ihnen hilft, die Umgebung schnell zu überblicken, das Wesentliche zu erkennen und Maßnahmen einzuleiten.
Mit über 60 Jahren Erfahrung in der Zusammenarbeit mit Unternehmen bei der Implementierung von Problemmanagement-Prozessen und Best Practices wissen die Expertinnen und Experten von Kepner-Tregoe, was es braucht, damit Organisationen sich an technologische Veränderungen anpassen. Der Einsatz der KT-Methodiken kann Ihren Mitarbeitenden helfen, Folgendes zu erreichen:
- Ein klares Verständnis der aktuellen Situation gewinnen, indem klärende Fragen gestellt werden
- Daten über Logs sammeln, um ein Verständnis der Situation und der Umstände zum Zeitpunkt des Auftretens des Problems zu entwickeln – in einer hochautomatisierten Umgebung ist dies die nächstbeste Alternative zur Replikation
- Einen prozessorientierten Ansatz anwenden, um anhand der Daten die Ursache des Problems zu finden, unter Berücksichtigung der Herausforderungen von Cross-Platform-/Anbieter-Umgebungen
- Einen rationalen Prozess nutzen, um die benötigten Daten herauszufiltern und nicht von der großen Menge an Daten-„Rauschen“ überwältigt zu werden, die traditionelle Big-Data-Analysen erzeugen
Automatisierung findet statt, und sie lässt sich nicht aufhalten.