ger

Wie ein internationales Architektur- und Ingenieurbüro einen großen IT-Ausfall vermieden und bis zu $750.000 pro Tag gespart hat

IT & Kommunikation

Der Albtraum beginnt. Ein für das Wochenende geplantes IT-Upgrade drohte am Montagmorgen plötzlich zu einem Totalausfall des IT-Systems zu werden. Jeder IT-Ausfall, der den Geschäftsbetrieb zum Erliegen zu bringen droht, ist ein potenzieller Alptraum, der IT-Manager nachts wach hält, aber jetzt war es tatsächlich passiert.

Das IT-Team eines internationalen Architektur- und Ingenieurbüros hatte das ganze Jahr über das geplante Upgrade geplant. Der Plan umfasste ein komplettes Upgrade des Kernnetzes ("rip and replace"), die Wartung der Server und ein Software-Upgrade, das den Wechsel zu einem neuen Anbieter beinhaltete. Die IT-Infrastruktur des Unternehmens wird von der Zentrale aus verwaltet und unterstützt Mitarbeiter in Niederlassungen in den USA, Europa und der Karibik.

Der IT-Direktor überwachte das Projekt, das von zwei IT-Mitarbeitern seiner Firma und dem Lieferanten durchgeführt wurde, aus der Ferne. Als die Arbeiten jedoch nicht wie erwartet vorankamen und sich die Probleme häuften, machte sich der IT-Direktor auf den Weg, um sich dem Team anzuschließen, da er befürchtete, dass die Systeme bis zum Arbeitsbeginn am Montag nicht wiederhergestellt sein würden.

Der Direktor wusste, dass ein Totalausfall des IT-Systems das Unternehmen zwischen $500.000 und $750.000 pro Tag kosten könnte.

Die IT ist das Herzstück der Arbeitsabläufe des Unternehmens. Die verschiedenen Standorte sind auf Computeranwendungen angewiesen, die von den Architektur-, Ingenieur- und Bauteams genutzt werden. Die Arbeiten an der Aufrüstung hatten am Freitag begonnen und sollten bis Samstagnachmittag abgeschlossen sein. Als der IT-Direktor am Samstag eintraf, war das Team auf mehrere Probleme gestoßen, und die Server konnten keine Verbindung zum Speicher herstellen. Obwohl das Netzwerk größtenteils stabil war, konnte der primäre Server-Stack keine Verbindung zum Daten-Array herstellen, das für die Mitarbeiter des Unternehmens am Montagmorgen eine absolut wichtige Ressource darstellte.

Es war sofort klar, dass der neue Anbieter nicht systematisch an die Probleme herangegangen war und das Team in die falsche Richtung geführt hatte. Der IT-Direktor und sein leitender Architekt hatten bereits einige Erfahrung mit Kepner-Tregoe Problem Solving and Decision Making (PSDM) und hatten eine PSDM-Schulung absolviert. Sie beschlossen, den KT-Ansatz zu verwenden, um die Kontrolle wiederzuerlangen und den besten Weg nach vorn zu finden. Sie richteten einen War-Room ein und banden mithilfe von KT-PSDM-Arbeitsblättern IT-Teammitglieder an entfernten Standorten ein, damit sie Einblicke geben konnten. Aufgrund seiner KT PSDM-Schulung und -Erfahrung wusste der IT-Direktor, dass sein Team und der Anbieter jedes Problem methodisch identifizieren mussten, um es klar zu verstehen, anstatt auf die Probleme zu reagieren.

Im Rahmen der anfänglichen Situationsbeurteilung wurde deutlich, dass der neue Anbieter sich zu sehr auf ein Problem konzentrierte, das nur in der Zentrale zu existieren schien und an anderen Standorten nicht auftrat. Die KT-Methode ermöglichte es ihnen, dieses Problem als Ausreißer zu identifizieren.

Tatsächlich erfuhren sie schließlich, dass das Glasfasernetz der Region an diesem Wochenende einen größeren Ausfall erlitten hatte, der nichts mit den bestehenden IT-Problemen zu tun hatte. Das Team nahm das Problem zur Kenntnis, ging aber dazu über, die drohende Gefahr eines totalen IT-Ausfalls zu beheben. Die Konzentration auf das Problem des lokalen Ausfalls führte zu unnötiger Komplexität und lenkte das Team von der wichtigeren Aufgabe ab, die zahlreichen aufgetretenen Systemprobleme zu beheben. Am Montag hatte das Team die meisten Probleme gelöst, der Netzwerkkern und die Server waren stabilisiert und das System war wieder online.

Die meisten IT-Mitarbeiter des Unternehmens sind jetzt in einem KT-PSDM-Programm zertifiziert, das vom IT-Direktor unterrichtet wird, der ein zertifizierter KT-Programmleiter geworden ist. Die meisten der geschulten Mitarbeiter gehören zu den Support-Mitarbeitern, die Standard-Helpdesk-Anrufe beantworten und an den US-Standorten des Unternehmens arbeiten. Da ihre Fähigkeiten gewachsen sind, waren sie in der Lage, das wachsende Unternehmen ohne zusätzliches IT-Support-Personal zu betreuen, was zu Einsparungen sowohl bei den gelösten Problemen als auch bei den Personalkosten führte.

Der IT-Direktor ist begeistert vom "Train-the-Trainer"-Ansatz von KT, der es ihm ermöglicht, das gesamte IT-Personal und auch Nicht-IT-Mitarbeiter zu schulen und bei größeren Problemen als Vermittler zu fungieren. Die KT-Prozesse sind jetzt in das Ticketingsystem integriert, was den Problemlösern hilft, eine Problemstellung zu erstellen und die Eskalation zu verbessern. Nach der Einführung des integrierten Systems wurden die Problemeskalationen aufgrund der besseren Kommunikation und der systematisch organisierten Informationen und Daten, die zur Problemlösung beitragen, drastisch reduziert.

KT PSDM gab mir die Grundlage, um ein erfolgreicher Problemlöser zu sein... Ich bin ein großer Befürworter von KT, weil ich gesehen habe, dass es so oft und in vielen Situationen funktioniert.
-Leiter der Abteilung Informationstechnologie

Der Wert von KT PSDM während des gefährdeten System-Upgrades wird die Art und Weise, wie IT-Projekte in Zukunft durchgeführt werden, verbessern. Die KT-Methode half nicht nur bei der Identifizierung und Lösung der Probleme während des Upgrades, sondern wird nun auch bei der Planung zukünftiger IT-Projekte eingesetzt. Das IT-Team konnte nicht nur einen Totalausfall und die damit verbundenen erheblichen Kosten vermeiden, sondern ist auch zuversichtlich, dass es in der Lage ist, mehrere komplexe Probleme zu bewältigen und zukünftige Ausfälle zu vermeiden.

 

Wir sind Experten in:

Kontaktieren Sie uns

für Anfragen, Details oder ein Angebot!