ger

5 Tipps für die Ursachenanalyse in der Cloud

Cloud-Dienste haben in den letzten Jahren die IT-Funktionen zur Unterstützung der verschiedenen Geschäftsanforderungen von Unternehmen erheblich erweitert. Eigene Software wird durch SaaS ersetzt und unternehmenseigene Rechenzentren werden durch IaaS- und PaaS-Angebote ersetzt. Die Verlagerung in die Cloud bringt zwar erhebliche Vorteile in Bezug auf die Geschäftsfunktionalität, die Skalierbarkeit und die Senkung der Kapitalkosten mit sich, doch kann die Verwaltung dieser Umgebungen zur Gewährleistung der Dienste für die Benutzer eine Herausforderung darstellen.

Einer der Bereiche, mit denen IT-Service-Management-Teams (ITSM) oft zu kämpfen haben, ist die effektive Diagnose von Problemen und deren Ursachen, wenn die Symptome, Daten und Auswirkungen über die Grenzen des Unternehmens hinausreichen. Die Durchführung einer Ursachenanalyse (RCA) in der Cloud erfordert eine andere Sichtweise auf die IT-Umgebung, eine stärkere Abhängigkeit von Daten als Hilfsmittel für die Analyse und das Wissen, wann man Partner zur Unterstützung hinzuziehen sollte. Im Folgenden finden Sie 5 Tipps für die Durchführung von Ursachenanalysen in der Cloud, die Ihnen helfen, diese besser zu verstehen.

1. Die Automatisierung annehmen

Bei Cloud-Diensten haben Sie in der Regel keinen Zugang zum Quellcode, um Software zu debuggen, und Sie können die meisten Geräte in der Umgebung auch nicht physisch berühren. Für die Überwachung und Diagnose von Cloud-Umgebungen müssen Sie ein erfahrener Nutzer der Automatisierung werden, der Ihnen als "Augen und Ohren" dient. Die meisten Cloud-Dienste verfügen über eigene Verwaltungstools, die Ihnen helfen können, zu verstehen, was innerhalb des Dienstes selbst vor sich geht. Für die Überwachung der Verfügbarkeit und Leistung von Diensten für Endnutzer können jedoch externe Überwachungs- und Diagnosefunktionen erforderlich sein.

Ein Beispiel für die Verwendung von Überwachungsinstrumenten für Ermittlungen ist:

Die Benutzer sind von einer extremen Langsamkeit in einer Kernanwendung betroffen. Über das Wochenende wurden Änderungen vorgenommen, was die Störungsmanager natürlich als mögliche Ursache in Betracht ziehen.

Ein Blick auf die Ladezeit in Citrix zeigt jedoch, dass sich die übermäßige Latenz auf Roaming-Benutzer beschränkt. Es besteht also keine Notwendigkeit, die Änderungen an der Anwendung zu untersuchen!

2. Hebelwirkung auf Partner

Wenn Sie Cloud-Dienste nutzen, machen Sie sich nicht nur von der Technologie abhängig, sondern beziehen auch die Anbieterorganisationen, die die Dienste bereitstellen und verwalten, in Ihren Dienstbetrieb ein. Wenn ein Problem auftritt, das eine Diagnose und Fehlerbehebung erfordert, sollte der Cloud-Anbieter zur Stelle sein, um zu helfen. Wenn Sie diese Ressourcen nutzen wollen, müssen Sie einige Dinge anders machen als bisher. Die erste (und für die meisten Unternehmen schwierigste) ist die Erkenntnis, dass die Fehlerbehebung keine individuelle Tätigkeit mehr ist, sondern vielmehr eine Teamleistung. Sie müssen verstehen, wer zum Team gehört und wie Sie mit ihm zusammenarbeiten können. Zweitens müssen Sie Ihre Service Level Agreements (die formellen Verträge mit den Lieferanten) verstehen, um sicherzustellen, dass diese bereit sind, die Reaktionsfähigkeit und die Ressourcen bereitzustellen, die Ihr Unternehmen benötigt.

Partner haben ein Interesse daran, Ihnen zu helfen: Ein lang andauernder Vorfall ist nicht nur ein Ärgernis für Ihre Nutzer, sondern kostet Ihren Partner auch Zeit bei der Diagnose des Fehlers. Je effektiver das gesamte Partner-Ökosystem zusammenarbeitet, desto besser für alle.

Manchmal bedarf es dazu eines kleinen vertraglichen Anstoßes: Verlangen Sie von Ihren Dienstleistern, dass sie für jeden größeren Ausfall eine Ursache angeben, anstatt sich nur auf die Verfügbarkeit und numerische Messwerte zu konzentrieren. Das Wissen, dass sie eine detaillierte, glaubwürdige Erklärung liefern müssen, wird die Art und Weise, wie sie Vorfalluntersuchungen behandeln, positiv beeinflussen.

3. Verwalten von Service-Schnittstellen

Cloud-Dienste sollen als "Black Boxes" behandelt werden, bei denen die Einzelheiten der Leistungserbringung nur den Dienstanbietern zur Verfügung stehen (und damit für Sie nicht sichtbar sind). Das kann eine gute Sache sein, da es Ihre IT-Umgebung viel weniger komplex macht. Für manche IT-Mitarbeiter kann es frustrierend sein, nicht zu sehen, wie die Dinge funktionieren. Der Schlüssel liegt darin, zu lernen, sich auf die Verwaltung des Umfangs und der Schnittstellen für den Dienst zu konzentrieren - zu verstehen, was in die Box hineingeht und was aus ihr herauskommt, zusammen mit den Funktionen, die innerhalb des Dienstes ausgeführt werden sollen. Die Verwaltung von Serviceschnittstellen kann einige Änderungen an den Vorstellungen Ihres Unternehmens darüber erfordern, welche Konfigurationselemente in Ihrer CMDB enthalten sind, was überwacht werden muss und wie SLAs strukturiert sein sollten.

4. Verstehen, woraus Dienstleistungen bestehen

Nur weil Sie das Zusammenspiel eines Cloud-Dienstes nicht im Detail sehen können, müssen Sie trotzdem ein grundlegendes Verständnis dafür haben, woraus die von Ihnen genutzten Dienste bestehen. Die meisten Cloud-Dienste sind von der zugrundeliegenden Technologie, der Konnektivität von externen Dienstanbietern und anderen Cloud-Diensten (wie Hosting oder Datenspeicherung) abhängig. Es ist wichtig, diese Abhängigkeiten (auf hohem Niveau) zu verstehen, auch wenn Sie sie nicht direkt verwalten. Sie stellen dennoch eine potenzielle Fehlerursache dar, die bei der Ursachenanalyse berücksichtigt werden muss.

5. Vergessen Sie die Konnektivität nicht

Bei der Nutzung von Cloud-Diensten müssen Sie besonders auf die Verbindungskomponenten achten, die Nutzern und Administratoren den Zugang zu den Diensten ermöglichen. Es ist schön, wenn der Dienst funktioniert, aber wenn man nicht darauf zugreifen kann, hat man ein Problem. Der gleiche Tipp gilt für Überwachungs- und Diagnosetools. Wenn die einzigen Tools, die Ihnen zur Verfügung stehen, vom Dienstanbieter gehostet werden, können Sie im Falle eines Konnektivitätsproblems möglicherweise nicht darauf zugreifen.

Cloud-Dienste sind einer der größten Fortschritte in der IT-Branche in den letzten fünf Jahren und bieten Unternehmen, die sie nutzen, ein enormes Produktivitäts- und Kosteneinsparungspotenzial. Allerdings müssen die Mitarbeiter des IT-Servicemanagements anders darüber denken, wie sie Probleme verwalten, überwachen und beheben, wenn sie auftreten.

Kepner-Tregoe ist seit über 60 Jahren branchenführend bei Problemlösungs- und Ursachenanalyseverfahren und -techniken und hilft Unternehmen, Service Excellence zu erreichen.

Blog Bild 1
Strukturierung Ihrer Sitzungen zur Ursachenanalyse für den Erfolg
Blog Bild 1
5 häufige Missverständnisse über die Ursachenanalyse
Blog Bild 1
Warum es besser sein kann, die Ursache eines Problems NICHT anzugehen
Blog Bild 1
Die 5 wichtigsten Gründe, warum Unternehmen die Ursachenanalyse ignorieren

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!