Der Albtraum beginnt. Ein geplantes IT-Upgrade am Wochenende drohte plötzlich, bis Montagmorgen zu einem vollständigen IT-Systemausfall zu werden. Jeder IT-Ausfall, der den Geschäftsbetrieb zu stoppen droht, ist die Art von potenziellem Albtraum, die IT-Manager nachts wach hält, doch nun wurde er Realität.
Das IT-Team eines internationalen Architektur- und Ingenieurbüros hatte das geplante Upgrade das ganze Jahr über geplant. Der Plan umfasste ein komplettes Upgrade des Kernnetzwerks („Rip and Replace“), Serverwartung und ein Software-Upgrade, das den Wechsel zu einem neuen Anbieter beinhaltete. Die IT-Infrastruktur des Unternehmens befindet sich im Hauptsitz, wird dort verwaltet und unterstützt Mitarbeiter in Büros in den USA, Europa und der Karibik.
Der IT-Direktor überwachte das Projekt, das von zwei IT-Mitarbeitern seines Unternehmens und dem Anbieter durchgeführt wurde, aus der Ferne. Als die Arbeiten jedoch nicht wie erwartet vorangingen und sich Probleme häuften, begab sich der IT-Direktor zum Team, besorgt darüber, dass die Systeme bis Montagmorgen nicht wiederhergestellt sein würden.
Der Direktor wusste, dass ein vollständiger IT-Systemausfall das Unternehmen zwischen 500.000 $ und 750.000 $ pro Tag kosten könnte.
IT ist das Herzstück des Unternehmens-Workflows. Die verschiedenen Standorte sind auf Computeranwendungen angewiesen, die von den Architektur-, Ingenieur- und Bauteams genutzt werden. Die Arbeiten am Upgrade hatten am Freitag begonnen und sollten bis Samstagnachmittag abgeschlossen sein. Als der IT-Direktor am Samstag eintraf, war das Team auf mehrere Probleme gestoßen, und die Server konnten keine Verbindung zum Speicher herstellen. Obwohl das Netzwerk größtenteils stabil war, stellte der primäre Server-Stack keine Verbindung zum Daten-Array her, einer absolut wichtigen Ressource für das Unternehmenspersonal am Montagmorgen.

Es war sofort offensichtlich, dass der neue Anbieter die Probleme nicht systematisch anging und das Team in die falsche Richtung geführt hatte. Der IT-Direktor und sein leitender Architekt hatten Erfahrung mit Kepner-Tregoe Problem Solving and Decision Making (PSDM) und hatten eine PSDM-Schulung absolviert. Sie beschlossen, den KT-Ansatz zu nutzen, um die Kontrolle zurückzugewinnen und den besten Weg nach vorne zu finden. Sie richteten einen „War Room“ ein und bezogen mithilfe von KT PSDM-Arbeitsblättern IT-Teammitglieder an entfernten Standorten ein, damit diese ihre Erkenntnisse einbringen konnten. Gestützt auf seine KT PSDM-Schulung und Erfahrung wusste der IT-Direktor, dass sein Team und der Anbieter, anstatt auf die Probleme zu reagieren, jedes Problem methodisch identifizieren mussten, um sie klar zu verstehen.
Im Rahmen der anfänglichen Situationsanalyse wurde deutlich, dass der neue Anbieter sich übermäßig auf ein Problem konzentrierte, das anscheinend ausschließlich am Hauptsitz existierte und an anderen Standorten keine Probleme verursachte. Die KT-Methodik ermöglichte es ihnen, dieses separate Problem als Ausreißer zu identifizieren.
Tatsächlich erfuhren sie schließlich, dass das Glasfasernetzwerk der Region an diesem Wochenende einen größeren Ausfall erlebt hatte, der völlig unabhängig von ihren bestehenden IT-Problemen war. Das Team nahm das Problem zur Kenntnis, konzentrierte sich aber auf die Lösung der drohenden Gefahr eines vollständigen IT-Ausfalls. Die Konzentration auf das Ausreißerproblem des lokalen Ausfalls führte zu unnötiger Komplexität und lenkte das Team von seiner größeren, wichtigeren Aufgabe ab, die aufgetretenen vielfältigen Systemprobleme zu lösen. Bis Montag hatte das Team die meisten Probleme bearbeitet und gelöst, der Netzwerkkern und die Server waren stabilisiert und das System war wieder online.
Die Mehrheit der IT-Mitarbeiter des Unternehmens ist nun in einem KT PSDM-Programm zertifiziert, das vom IT-Direktor unterrichtet wird, der selbst ein zertifizierter KT-Programmleiter geworden ist. Die meisten der Geschulten stammen aus dem Support-Personal, das Standard-Helpdesk-Anrufe beantwortet und in den US-Standorten des Unternehmens arbeitet. Da ihre Fähigkeiten gewachsen sind, konnten sie das wachsende Unternehmen ohne zusätzlichen IT-Support-Mitarbeiter bedienen, was sowohl bei der Lösung von Problemen als auch bei der Kontrolle der Mitarbeiterkosten zu Einsparungen führte.
Der IT-Direktor ist begeistert vom „Train-the-Trainer“-Ansatz von KT, der es ihm ermöglicht, das gesamte IT-Personal sowie Nicht-IT-Mitarbeiter zu schulen und als Moderator für größere Probleme zu fungieren. KT-Prozesse sind nun in ihr Ticketsystem integriert, was Problemlösern hilft, eine Problembeschreibung zu erstellen und Eskalationen zu verbessern. Als das integrierte System eingeführt wurde, wurden Problemeskalationen aufgrund besserer Kommunikation und der systematisch organisierten Informationen und Daten, die die Lösung vorantreiben, drastisch reduziert.
KT PSDM gab mir eine Grundlage, um ein erfolgreicher Problemlöser zu sein… Ich bin ein großer Befürworter von KT, weil ich gesehen habe, wie es so oft und in vielen Situationen funktioniert.
– Direktor für Informationstechnologie
Der Wert von KT PSDM während des drohenden System-Upgrades wird die Art und Weise verbessern, wie IT-Projekte in Zukunft durchgeführt werden. Die KT-Methodik half nicht nur bei der Identifizierung und Lösung der Probleme während des Upgrades, sondern wird nun auch bei der Planung zukünftiger IT-Projekte eingesetzt. Neben der Vermeidung eines vollständigen Ausfalls und der erheblichen Kosten einer solchen Störung ist das IT-Team zuversichtlich in seine Fähigkeit, multiple, komplexe Probleme zu bewältigen und zukünftige Ausfälle zu vermeiden.