La plupart des entreprises ont mis en place des processus de gestion des incidents pour faire face aux perturbations quotidiennes de petite ou moyenne ampleur. Ces processus sont généralement basés sur des méthodologies éprouvées de service à la clientèle et/ou sur des pratiques standard de gestion des services informatiques, telles que l'ITIL. S'ils sont généralement efficaces pour gérer de gros volumes d'incidents et de demandes de service à faible impact, ces processus sont insuffisants lorsqu'il s'agit de gérer des incidents majeurs, qui relèvent d'une toute autre catégorie. Les incidents majeurs nécessitent une approche unique et distincte.
Impact et fréquence
Un incident standard n'affecte généralement que quelques utilisateurs, ce qui permet des temps de réponse et de résolution généralement plus longs et contribue à maintenir les coûts opérationnels à un niveau bas. Les incidents majeurs, en revanche, ont des répercussions importantes sur l'ensemble de l'entreprise. Bien qu'heureusement rares, les incidents majeurs peuvent perturber des unités commerciales entières. Dans ces situations, l'impact financier de l'incident dépasse de loin le coût de sa résolution, ce qui fait de la rapidité et de la qualité de la réponse les facteurs clés du succès.
Compétences et rôles impliqués
En général, le personnel du service d'assistance ayant une formation et une expertise technique limitées traite la plupart des incidents. Les problèmes complexes sont transmis à des équipes d'assistance de deuxième ou troisième niveau disposant de connaissances plus spécialisées. Toutefois, l'objectif reste de résoudre les problèmes en utilisant les ressources disponibles les moins qualifiées sur le plan technique (et les moins coûteuses). Les incidents majeurs requièrent une toute autre stratégie. Dans ce cas, l'accent doit être mis sur l'engagement des personnes qui peuvent résoudre la perturbation le plus rapidement, minimisant ainsi l'impact sur l'activité de l'entreprise. En règle générale, ces ressources sont des experts en la matière hautement qualifiés (et donc très coûteux).
Processus
Ces dernières années, les processus de gestion des incidents ont évolué vers le libre-service, l'automatisation et les interactions d'assistance asynchrones (par exemple, les interactions basées sur le courrier électronique avec les équipes des centres d'appel internationaux). Cette approche est conçue pour optimiser l'évolutivité des processus de gestion des incidents tout en réduisant l'interaction humaine. Cependant, l'accent mis sur l'évolutivité se fait souvent au détriment du temps nécessaire pour résoudre des perturbations plus complexes. Les processus de gestion des incidents majeurs doivent donc être optimisés dans le sens inverse, en privilégiant l'efficacité des solutions et la rapidité de résolution par rapport au coût des ressources et à l'automatisation.
Communication
Dans les scénarios d'incidents typiques, la direction pourrait percevoir le besoin de communication comme un échec. Les incidents majeurs sont différents en ce sens qu'une communication active et large avec les parties prenantes est non seulement utile pour évaluer avec précision l'impact, mais aussi essentielle pour gérer les attentes et assurer aux parties prenantes que la situation est sous contrôle. Dans de nombreux incidents majeurs, la perception créée par la communication joue un rôle plus important dans la détermination de l'impact global que le problème technique et ses symptômes associés. Une communication efficace lors d'un incident majeur doit s'adresser à quatre groupes distincts de parties prenantes :
- La communauté des utilisateurs concernés dont les activités sont directement affectées par l'incident
- Les parties prenantes indirectement ou potentiellement concernées, dont la confiance est cruciale pour la gestion de l'incident.
- les équipes internes et les experts en la matière qui participent au diagnostic et à la résolution des incidents (y compris les fournisseurs)
- Support et gestion informatique
Participation de l'exécutif et prise de décision
Les incidents majeurs nécessitent presque toujours l'intervention d'un cadre pour aider à évaluer les impacts, faciliter la communication et prendre des décisions clés pour éliminer les obstacles. Souvent, les actions nécessaires à la résolution d'un incident majeur s'étendent à différentes unités opérationnelles, ce qui soulève des questions quant à l'autorité décisionnelle. En l'absence de lignes directrices claires, cette situation peut rapidement entraîner des chevauchements d'autorité et de la confusion. Un processus de gestion des incidents majeurs devrait inclure des lignes directrices interfonctionnelles pour la prise de décision afin d'éviter les retards et les malentendus.
Atténuer les symptômes ou prévenir les récidives
Lors d'un incident majeur, l'objectif principal est d'atténuer les impacts et de prendre des mesures correctives pour rétablir le fonctionnement normal de l'entreprise. Comprendre la cause profonde et mettre en œuvre des mesures pour éviter que l'incident ne se reproduise relève de la gestion des problèmes. Étant donné qu'un incident majeur a un impact considérable sur l'entreprise, il est courant que les dirigeants assurent un suivi actif, en veillant à ce que la cause profonde soit identifiée et que des mesures préventives soient mises en œuvre rapidement.
Cependant, dans le chaos de la gestion d'un incident majeur, des informations diagnostiques cruciales sont souvent perdues, ce qui complique les efforts visant à identifier la cause sous-jacente.
Pour éviter ces deux écueils, il est essentiel de mettre en place un processus de gestion des incidents et des problèmes hautement intégré et complet. Ce processus doit activement capturer et documenter les "informations sur les causes" critiques afin d'assurer l'amélioration continue du service. Ce n'est qu'ainsi qu'une véritable stabilité informatique pourra être atteinte à long terme.
N'attendez pas qu'il soit trop tard
Si les dirigeants ne peuvent pas contrôler le moment où les incidents majeurs se produisent, ils peuvent contrôler la manière dont l'entreprise y répond et les gère. Un excellent service global, y compris un processus de gestion des incidents majeurs efficace et bien compris, est essentiel pour réagir rapidement, traiter les impacts immédiats, protéger la réputation de l'entreprise et réduire les risques opérationnels et les risques pour les clients.
En tant que leader dans la résolution de problèmes, Kepner-Tregoe travaille avec ses clients depuis plus de 60 ans pour améliorer leur capacité à gérer les incidents majeurs dans les opérations et les technologies de l'information, les aidant ainsi à atteindre l'excellence en matière de service.
Jetez un coup d'œil à notre page de formation ou contactez-nous pour en savoir plus.