fra

Mettez fin à la lutte contre les incendies grâce à la gestion proactive des problèmes.

Par Tim Roberts, Christoph Goldenstern

Dans toute organisation, qu'il s'agisse de prestation de services ou d'opérations, il existe généralement un système de révision des incidents majeurs après leur traitement initial. Il peut s'agir d'un examen après incident (PIR) ou d'un examen après action (un terme souvent utilisé dans le secteur de la fabrication). L'organisation peut utiliser plus d'une approche et différents silos organisationnels peuvent avoir des méthodologies différentes.

La gestion des problèmes peut être réactive ou proactive

La gestion réactive des problèmes vise à trouver et à éliminer la cause des incidents connus. La gestion proactive des problèmes, qui adopte une vision plus globale, va au-delà de l'incident pour identifier et prévenir de futurs incidents en identifiant et en éliminant les causes profondes (systémiques) qui continuent à provoquer des types d'incidents similaires.

La gestion proactive des problèmes tient compte de l'incident et de la ou des causes qui l'ont déclenché, ainsi que des conditions générales qui ont rendu l'incident possible, ce qui permet d'analyser plus en profondeur tous les facteurs contributifs. Une fois cette analyse terminée, une étape cruciale consiste à mettre en place des actions préventives destinées à atténuer les incidents spécifiques connus pour avoir un impact négatif important.

Si vous passez en revue les problèmes qui exaspèrent le plus votre organisation, vous constaterez probablement qu'il s'agit d'incidents récurrents qui sont généralement traités à court terme au moyen d'une solution de contournement ou d'un "patch", mais qui ne sont jamais entièrement résolus. L'équipe ne s'attaque jamais aux "causes structurelles" et ne met donc pas en place de mesures pour atténuer la situation à long terme.

Un avantage de la gestion proactive des problèmes est la possibilité de se concentrer sur l'élimination de ces incidents systémiques et récurrents. Cette méthodologie est généralement appliquée :

  • Lors d'un examen post-mortem des pannes/incidents majeurs
  • Lors d'une animation en direct portant sur des incidents majeurs
  • En tant que composante d'un programme d'amélioration continue du service

Les organisations qui adoptent une approche active de l'amélioration continue des services constateront que ce processus permet d'identifier plusieurs possibilités d'amélioration des processus opérationnels et de la technologie. Après un incident majeur ou une panne, il est fortement recommandé de procéder à un examen post-mortem impliquant les principales parties prenantes.

Qu'est-ce que la cartographie des incidents ?

Chez Kepner-Tregoe, la gestion proactive des problèmes s'articule autour d'un outil central que nous appelons "cartographie des incidents" - un moyen de visualiser l'incident et de cartographier "l'événement".

La partie gauche de la figure 1 donne un aperçu d'un document typique de revue d'incident utilisé pour faciliter une réunion en direct afin de comprendre un incident majeur. Il n'est pas rare que ce document compte jusqu'à cinq ou six pages de texte serré, consignant les observations, les actions et les communications sur toute la durée de l'incident. Le résultat est un enchevêtrement d'informations détaillées qui rend difficile la distinction entre ce qui est pertinent et ce qui ne l'est pas, entre ce qui est important et ce qui ne l'est pas.

Sur le côté droit de la figure 1, l'ensemble du récit de cinq pages décrivant l'incident est représenté dans un organigramme visuel communément appelé carte d'incident.

Il devrait être évident que la carte est beaucoup plus simple et plus pratique pour les personnes qui gèrent l'incident. C'est également un moyen bien supérieur de rapporter l'incident à la direction, qui a rarement le temps ou la tolérance pour une documentation dense et détaillée.

Lorsqu'elle est réalisée efficacement, cette visualisation est le produit d'un processus qui décrit systématiquement l'incident en termes de :

  • Le site principal problème et son impact
  • Tous chaîne(s) de cause à effet qui l'a déclenché
  • Le site circonstances contribuer à l'effet de l'incident - décrire pourquoi l'impact a été ou n'a pas été aussi grave qu'il aurait pu l'être.
  • Barrières qui ont été enfreintes - les mesures qui auraient pu interrompre la relation de cause à effet, et pourquoi elles n'ont pas fonctionné.
  • Actions qui ont été prises
  • Actions qui sont proposés, choisis ou mis en œuvre pour éviter que le problème ne se reproduise.
  • Actions pour atténuer les risques des modifications suggérées (afin de ne pas provoquer de nouveaux incidents distincts !)

La figure 2 présente une visualisation du processus de cartographie des incidents. Il s'agit d'un processus par étapes qui commence par une description de l'incident primaire, l'identification de la chaîne de causalité, pour aboutir à l'élaboration et à la protection de recommandations visant à prévenir la récurrence. La préparation est une étape cruciale de ce processus (représentée par l'étape 0). Un élément clé de cette étape est de s'assurer que les personnes ayant l'expertise appropriée en la matière sont disponibles pour contribuer.

La séquence d'étapes peut être reliée aux outils qui seront familiers aux personnes qui ont travaillé avec Kepner-Tregoe (identifié à droite) ou qui ont lu sur ses méthodologies. La cartographie des incidents est avant tout une forme d'évaluation très visuelle de la situation. Si nécessaire, d'autres outils de résolution de problèmes et de prise de décision peuvent être utilisés dans le contexte de cette méthodologie/ce cadre.

Comment la cartographie des incidents est-elle réalisée ?

Cette technique d'analyse (cartographie des incidents) est largement utilisée dans les départements informatiques et opérationnels d'un large éventail d'industries. Elle présente de nombreux avantages, notamment un examen post-incident (PIR) plus rapide, plus clair et plus productif, dont les résultats ont un impact plus important sur l'organisation. Un PIR peut impliquer 10 à 12 personnes assises autour d'une table, généralement pendant une heure ou deux. Il est probable qu'elles aient toutes été impliquées d'une manière ou d'une autre dans l'incident initial et qu'elles examinent ce qui s'est passé, pourquoi cela s'est produit, quelles mesures ont été prises et ce qui peut être fait pour éviter que cela ne se reproduise.

La documentation existante doit être examinée avant cet examen. Elle doit inclure toutes les actions ou restaurations qui ont eu lieu pendant l'incident lui-même. Ces données sont généralement enregistrées par une personne au sein de l'organisation de support, souvent un gestionnaire d'incidents majeurs ou un gestionnaire de problèmes qui a été impliqué dans l'incident.

La version traditionnelle de la revue d'incident, riche en texte, tend à être un récit chronologique de l'évolution du problème. L'animateur doit faire parcourir au groupe ce document ligne par ligne, afin d'obtenir un accord sur la chronologie et la description. Une carte d'incident, en revanche, offre une manière dynamique de mener la session, en décomposant les informations comme suit :

  • Identifier une liste de chaînes de causalité
  • Définir un ensemble d'éléments qui auraient dû empêcher l'incident
  • Montrer les circonstances qui ont influencé la sévérité
  • Identifier clairement les propriétaires de toutes les actions futures

Beaucoup trouvent le processus de cartographie illustré à la figure 3 plus concis qu'une représentation textuelle, car il montre le cheminement de l'incident en positionnant une série de formes et de couleurs représentant des détails et des événements avec des flèches qui montrent les relations entre eux. Cette présentation est une visualisation étape par étape qui tend à susciter un consensus plus rapide que celui qui peut être obtenu par des descriptions textuelles.

En utilisant cette carte, l'équipe peut partir de l'événement primaire - l'événement qui a fait prendre conscience à l'équipe de support qu'un incident s'était produit - pour arriver aux causes sous-jacentes, puis à l'identification des barrières, des systèmes ou des mesures conçus pour briser les liens entre ces conditions. À partir de là, l'équipe passe à des analyses plus approfondies ou à la prise de décision pour rechercher une cause inconnue ou choisir certaines actions.

Les problèmes qui causent le plus d'aggravation sont les incidents récurrents qui sont généralement traités avec une solution de contournement mais jamais complètement résolus.

Les organisations ont commencé à intégrer la gestion proactive des problèmes et la cartographie des incidents dans leurs examens après incident ou après action et, dans certains cas, dans la gestion de leurs incidents en cours. Par exemple, dans une grande agence gouvernementale complexe du Royaume-Uni, les responsables de programme certifiés KT, qui enseignent et facilitent la résolution de problèmes au sein de l'organisation des services informatiques, créent une carte visuelle sur un tableau blanc pour documenter leur analyse d'un incident et attribuer des actions de suivi. Les individus sont toujours responsables de la transformation des actions choisies en actions réalisées. Cette carte d'incident simple sert de base à la communication de la direction et constitue désormais le format que la direction s'attend à voir lorsqu'un incident est représenté.

De plus en plus, cette méthodologie de cartographie est utilisée dans l'analyse "Pre-Mortem", un type de gestion proactive des problèmes qui a lieu avant un incident. Lorsqu'un changement majeur est envisagé, les parties prenantes se demandent : "Si nous effectuons ce changement, qu'est-ce qui pourrait mal tourner ?" Les cartes d'incidents pré-mortem impliquent beaucoup de créativité et de réflexion hors des sentiers battus. Ce type de brainstorming peut produire des cartes assez volumineuses, mais la mise en forme fournit une structure pour une analyse qui peut être utilisée pour prévenir ou atténuer les incidents potentiels.

Une technique de transition

Une carte d'incident est un moyen bien supérieur de signaler l'incident à la haute direction, qui a rarement le temps ou la tolérance pour une documentation dense et détaillée.

La carte d'incident sert d'enregistrement permanent d'un incident. Si elle est créée pendant la gestion d'un incident réel, la carte de l'incident enregistre les actions prises à ce moment-là et peut être mise à jour plusieurs fois au fur et à mesure que des actions supplémentaires sont prises et que des barrières sont mises en place. Cela peut aller jusqu'à la conclusion d'un examen post-incident. La carte de l'incident sert d'audit de la pensée des personnes, de sorte que tout le monde peut comprendre le chemin parcouru par l'équipe de gestion de l'incident pour parvenir à une cause profonde et à une résolution.

L'utilisation des formes et des couleurs ne doit pas nécessairement suivre une convention spécifique, tant que tout le monde dans la pièce s'accorde sur ce que chaque forme représente. La méthodologie ne dépend pas d'une technologie spécifique, bien que l'utilisation d'un logiciel conçu pour faciliter la cartographie des incidents puisse ajouter une valeur considérable à la méthodologie.

le processus. Parmi les exemples, citons les outils d'organigramme comme Visio® de Microsoft et CauselinkTM, un outil logiciel aligné sur la méthodologie d'AC présentée ci-dessous à la figure 4.

L'utilisation d'un outil logiciel dynamique peut aider à faire passer la cartographie des causes au niveau supérieur :

  • Aider à mener des facilitations en temps réel
  • Construire et exploiter une base de connaissances, capable de relier des éléments de données tels que des preuves, des notes, des tâches et des solutions à chaque cause.
  • Permettre la création de rapports, le suivi des actions, le suivi des flux de travail et la recherche.

Cela peut être particulièrement pertinent pour les industries et les fonctions qui sont fortement axées sur la conformité et qui ont l'obligation permanente de fournir des documents et des pistes d'audit pour les enquêtes.

La carte des incidents permet à l'utilisateur de réduire un incident à des éléments clés qui peuvent être facilement assimilés par d'autres personnes, qu'elles aient été impliquées dans l'incident ou non. Elle fournit un vocabulaire efficace et un ensemble de conventions permettant de donner du sens aux événements en les visualisant dans une chaîne causale.

Une fois maîtrisée, la cartographie des incidents peut être une technique de transition efficace pour faire passer l'organisation d'une gestion réactive des problèmes à un état d'esprit d'amélioration continue.

 

Tim Roberts, consultant principal, Kepner-Tregoe
Tim a dirigé des projets internationaux qui soutiennent l'amélioration continue par le biais des processus d'entreprise d'installation, y compris l'analyse des causes profondes, la cartographie des incidents et la gestion de projet. Il a facilité le développement d'une nouvelle stratégie à l'échelle mondiale au niveau du conseil d'administration, puis a conçu et coordonné une mise en œuvre mondiale avec la direction générale. Tim se concentre sur le secteur des services informatiques, en particulier sur les clients des secteurs privé et public pour lesquels le support informatique est une fonction essentielle.

Christoph Goldenstern, VP Innovation & Service Excellence, Kepner-Tregoe

Christoph est un leader du conseil avec plus de 20 ans d'expérience dans l'aide aux organisations dans les domaines de la stratégie, de l'amélioration des opérations et des services. En tant que membre de l'équipe de direction de KT et vice-président mondial de la stratégie et de l'excellence des services, il est responsable de la stratégie commerciale de KT ainsi que de ses solutions de gestion des services informatiques et de support technique.

Tim Roberts (troberts@kepner-tregoe.com) est situé au Royaume-Uni, tandis que Christoph Goldenstern (cgoldenstern@kepner-tregoe.com) se trouve dans les bureaux de KT aux États-Unis. Contactez-les pour en savoir plus sur la façon dont ces processus pourraient convenir à votre équipe.

Related

Mesurer la qualité de la gestion des problèmes dans un environnement ITIL

Sur le fil du rasoir et sous contrôle

Nous contacter

Pour des demandes de renseignements, des détails ou une proposition !