Ceux qui connaissent les processus de résolution de problèmes Kepner-Tregoe les considèrent souvent en relation avec la fabrication, les opérations ou la gestion des problèmes dans l'informatique. Étonnamment, beaucoup de gens négligent la valeur que les processus KT apportent à la gestion des incidents. Le service desk et les différentes organisations de support de votre fonction informatique sont responsables de la résolution de centaines, voire de milliers, d'incidents chaque jour. Avec un tel volume, il peut sembler qu'un ensemble rigoureux de processus comme l'AC de résolution de problèmes ne soit pas approprié, mais vous vous trompez. Les processus de résolution de problèmes KT sont une solution idéale pour vos équipes de gestion des incidents informatiques. Ils fournissent un ensemble d'activités, de flux de travail et d'outils faciles à comprendre pour déterminer la nature d'un incident, prendre des décisions et mettre en œuvre une solution efficace pour rétablir rapidement le service.
Comment cela fonctionnerait-il ?
Un agent du service d'assistance reçoit un appel d'un utilisateur qui signale une interruption de service. L'agent doit poser les bonnes questions à l'utilisateur pour clarifier le problème et comprendre son impact. S'il s'agit d'une erreur commune connue, l'agent peut résoudre le problème directement avec le client et fournir une solution de rechange standard. Une fois que le problème a dépassé ce niveau de complexité, c'est là que le plaisir commence vraiment.
À partir de là, l'agent doit déterminer qui doit être impliqué, tout en enregistrant l'incident dans un ticket de support et en l'acheminant vers le bon utilisateur ou groupe. L'agent évalue toutes les dépendances qui pourraient contribuer à la situation et évalue l'impact sur l'entreprise (gravité).
La transmission ultérieure des informations de manière claire, cohérente et concise est essentielle pour la rapidité et la qualité. Le destinataire doit prendre en charge le processus de dépannage. L'AC peut réduire le temps nécessaire à la compréhension de l'incident, en évitant les ré-explications qui se produiraient normalement à ce stade, ce qui lui permet de se mettre au diapason et d'être le quarterback du processus de restauration. Une fois la ou les raisons de la panne identifiées, l'agent doit exploiter les ressources de connaissances - telles que les notes des incidents précédents, la CMDB et les consultations avec les experts en la matière - afin d'identifier des alternatives pour résoudre le problème avec une solution à court terme ou une solution de contournement. Sur la base de ces alternatives, de leur efficacité attendue, du coût/temps de mise en œuvre et du risque, un agent agit ou recommande un plan d'action au demandeur.
Des processus cohérents améliorent les performances
Ce scénario n'est que légèrement différent de l'approche de gestion des problèmes que le personnel d'exploitation et les gestionnaires de problèmes informatiques utilisent pour traiter les risques à long terme. Les principales différences sont les suivantes :
- Les incidents se produisent dans un laps de temps très court, plusieurs fois par jour.
- L'objectif est de restaurer le service plutôt que de s'attaquer à la cause profonde (réparer le symptôme).
- Les principales compétences utilisées par l'agent sont la prise de décision plutôt que l'investigation analytique.
En exploitant les processus de résolution de problèmes de l'AC pour la gestion des incidents, l'objectif n'est pas d'ajouter des frais généraux et une rigueur inutile au processus de gestion des incidents. Il s'agit plutôt de fournir une approche simple et cohérente permettant aux agents d'assistance et aux gestionnaires d'incidents de traiter les problèmes des utilisateurs plus rapidement, en identifiant les problèmes sous-jacents dès la première fois et en sélectionnant la solution correcte en fonction des informations disponibles et du profil de risque du problème, afin de rétablir rapidement le service.
Des processus cohérents de gestion des incidents peuvent contribuer à améliorer l'efficacité du service desk et de l'équipe de support informatique de plus de 20%, tout en réduisant la variance entre les agents de plus de 40%. Cela peut se traduire soit par une capacité accrue à résoudre davantage d'incidents, soit par une réduction potentielle des coûts. Il n'est pas rare de voir cette approche réduire non seulement le temps nécessaire pour résoudre les problèmes, mais aussi le nombre de personnes qu'il faut mobiliser. La participation aux appels Bridge est souvent réduite de plusieurs dizaines de participants à quelques personnes ciblées.
Si l'on considère l'ensemble d'une grande organisation d'assistance, les avantages peuvent augmenter rapidement. La valeur réelle d'une performance accrue de la gestion des incidents est un temps plus court pour résoudre les problèmes des utilisateurs. Chaque incident représente une perturbation du déroulement normal de votre activité. L'incident peut avoir un impact sur un seul utilisateur (au téléphone avec le service d'assistance) ou il peut nuire aux performances de l'ensemble des fonctions de l'entreprise. Plus vite vous résolvez l'incident, plus vite vos employés peuvent reprendre leurs activités normales.
En outre, l'approche cohérente et structurée de la saisie des données et de la documentation est un catalyseur de l'efficacité en aval, en ce qui concerne la gestion des problèmes, les mesures correctives et la gestion du changement.
Les entreprises, grandes et petites, utilisent chaque jour les processus de résolution de problèmes de Kepner-Tregoe pour aider leurs employés à résoudre toutes sortes de problèmes - des petites demandes de service tactiques aux incidents majeurs à grande échelle. Les entreprises qui utilisent le processus d'AC comprennent que son objectif premier est d'aider vos employés à faire leur travail de manière aussi efficace et efficiente que possible. Lorsque le processus fonctionne, votre personnel peut se concentrer sur les problèmes à résoudre.
En savoir plus sur l'approche de Kepner-Tregoe en matière de gestion des incidents
Lire plus de blogs sur la gestion des incidents informatiques
Atteindre l'excellence du service, c'est prévoir l'échec
Gestion des incidents majeurs - Être prêt lorsqu'un changement tourne mal