fra

Comment un cabinet international d'architecture et d'ingénierie a évité une panne informatique majeure, économisant jusqu'à $750 000 par jour.

Informatique et communication

Le cauchemar commence. Une mise à niveau informatique programmée pendant le week-end menace soudain de se transformer en un arrêt total du système informatique le lundi matin. Toute panne informatique qui menace d'interrompre les activités de l'entreprise est le genre de cauchemar potentiel qui empêche les responsables informatiques de dormir, mais là, c'est vraiment le cas.

L'équipe informatique d'un cabinet international d'architecture et d'ingénierie avait planifié la mise à niveau prévue tout au long de l'année. Le plan comprenait une mise à niveau complète du réseau central ("rip and replace"), la maintenance des serveurs et une mise à niveau logicielle impliquant le passage à un nouveau fournisseur. L'infrastructure informatique du cabinet réside et est gérée au siège social et soutient les employés des bureaux aux États-Unis, en Europe et dans les Caraïbes.

Le directeur informatique surveillait à distance le projet, qui était exécuté par deux employés de son entreprise et par le fournisseur. Mais lorsque le travail ne s'est pas déroulé comme prévu et que les problèmes se sont accumulés, le directeur informatique s'est rendu sur place pour rejoindre l'équipe, craignant que les systèmes ne soient pas rétablis avant le début de la journée du lundi.

Le directeur savait qu'un arrêt total du système informatique pouvait coûter à l'entreprise entre $500 000 et $750 000 par jour.

L'informatique est au cœur du flux de travail de l'entreprise. Les multiples sites dépendent des applications informatiques utilisées par les équipes d'architecture, d'ingénierie et de construction. Les travaux de mise à niveau avaient commencé le vendredi et devaient être terminés le samedi après-midi. Lorsque le directeur informatique est arrivé le samedi, l'équipe avait rencontré de multiples problèmes et les serveurs étaient incapables de se connecter au stockage. Bien que le réseau soit en grande partie stable, la pile de serveurs primaires ne se connectait pas à la matrice de données, une ressource absolument vitale pour le personnel de l'entreprise le lundi matin.

Il est immédiatement apparu que le nouveau fournisseur n'abordait pas les problèmes de manière systématique et avait conduit l'équipe dans la mauvaise direction. Le directeur informatique et son architecte principal avaient une certaine expérience de la résolution de problèmes et de la prise de décision Kepner-Tregoe (PSDM) et avaient suivi une formation PSDM. Ils ont décidé d'utiliser l'approche KT pour reprendre le contrôle et trouver la meilleure façon d'avancer. Ils ont mis en place une salle de crise et, à l'aide des feuilles de travail PSDM KT, ont fait appel à des membres de l'équipe informatique situés à distance afin qu'ils puissent apporter leur point de vue. S'appuyant sur sa formation et son expérience en matière de KT PSDM, le directeur informatique savait qu'au lieu de réagir aux problèmes, son équipe et le fournisseur devaient identifier chaque problème de manière méthodique afin de pouvoir les comprendre clairement.

Dans le cadre de l'évaluation initiale de la situation, il était évident que le nouveau fournisseur se concentrait trop sur un problème qui semblait n'exister qu'au siège social, sans qu'il y ait de problèmes sur d'autres sites. La méthodologie d'AC a permis d'identifier ce problème distinct comme étant aberrant.

En effet, ils ont fini par apprendre que le réseau de fibres optiques de la région avait subi une panne majeure ce week-end-là, sans aucun rapport avec les problèmes informatiques existants. L'équipe a pris note de ce problème, mais est passée à la résolution de la menace imminente d'un arrêt total de l'informatique. Le fait de se concentrer sur la question aberrante de la panne locale ajoutait une complexité inutile et avait détourné l'équipe de sa tâche plus importante, qui était de résoudre les multiples problèmes de système qui étaient apparus. Lundi, l'équipe avait résolu la plupart des problèmes, le cœur du réseau et les serveurs étaient stabilisés et le système était de nouveau en ligne.

La majorité du personnel informatique de l'entreprise est maintenant certifiée dans le cadre d'un programme KT PSDM enseigné par le directeur informatique qui est devenu un chef de programme KT certifié. La plupart des personnes formées font partie du personnel de soutien qui répond aux appels du service d'assistance standard et qui travaille dans les bureaux de l'entreprise aux États-Unis. Au fur et à mesure que leurs capacités se sont accrues, ils ont été en mesure de servir l'entreprise en pleine croissance sans avoir besoin de personnel de soutien informatique supplémentaire, ce qui a permis de réaliser des économies tant au niveau des problèmes résolus que des coûts salariaux contrôlés.

Le directeur informatique est enthousiasmé par l'approche "former le formateur" de KT, qui lui permet de former l'ensemble du personnel informatique ainsi que les employés non informatiques, et de servir de facilitateur pour les problèmes majeurs. Les processus de KT sont désormais intégrés à leur système de billetterie, ce qui aide les personnes chargées de résoudre les problèmes à créer une déclaration de problème et améliore les remontées. Lorsque le système intégré a été lancé, les escalades de problèmes ont été considérablement réduites grâce à une meilleure communication et à l'organisation systématique des informations et des données qui permettent de résoudre les problèmes.

Le KT PSDM m'a donné les bases nécessaires pour résoudre les problèmes avec succès... Je suis un grand défenseur du KT parce que je l'ai vu fonctionner tant de fois et dans de nombreuses situations.
-Directeur des technologies de l'information

La valeur de l'AC PSDM pendant la mise à niveau du système menacé améliorera la façon dont les projets informatiques seront réalisés à l'avenir. Non seulement la méthodologie KT a permis d'identifier et de résoudre les problèmes lors de la mise à niveau, mais elle est maintenant utilisée dans la planification des futurs projets informatiques. En plus d'éviter une panne totale et les coûts importants d'une telle perturbation, l'équipe informatique est confiante dans sa capacité à gérer des problèmes multiples et complexes et à éviter de futures pannes.

 

Nous sommes experts en :

Nous contacter

Pour tout renseignement, information complémentaire ou un devis