fra

Régler les incidents ou résoudre les problèmes - choisissez votre poison

L'objectif des organisations informatiques est de fournir des services et des systèmes de la meilleure qualité possible pour soutenir leurs utilisateurs et leurs processus métier. Malheureusement, les systèmes (comme les personnes) ne sont pas parfaits et il arrive qu'ils se brisent. Lorsque cela se produit, le personnel informatique bien intentionné fait tout ce qu'il peut pour résoudre rapidement le problème et remettre le système en état afin que les utilisateurs qui en dépendent puissent continuer à faire leur travail. Assurer la continuité des activités est essentiel pour la fonction informatique, mais anticiper et empêcher les problèmes de se reproduire est tout aussi important.

Le problème se pose lorsque ces deux processus ITSM interdépendants entrent en conflit (ce qui est fréquent). Dans ce cas, le personnel informatique doit souvent choisir son poison : rétablir le service rapidement ou résoudre le problème de façon permanente. L'élaboration d'un ensemble de lignes directrices pour gérer ce conflit peut aider le personnel à être plus efficace et à garantir un bon équilibre pour votre organisation. Voici 6 facteurs à prendre en compte pour déconfondre vos processus de gestion des incidents et des problèmes.

1. Impact sur l'entreprise - Chaque incident et chaque problème est différent et prendre une décision éclairée sur la priorité à accorder dépend en grande partie de l'existence d'un moyen objectif de mesurer et de classer l'impact commercial actuel et futur. Il convient de prendre en compte le nombre de personnes touchées, la criticité des processus opérationnels touchés, la durée de l'impact sur le système/service et les impacts intangibles tels que la perception du client.

2. Utilisation des ressources - Le même personnel informatique et les mêmes ressources techniques sont souvent utilisés pour résoudre les incidents actifs ainsi que pour prévenir les problèmes. L'objectif est d'obtenir le plus grand bénéfice global possible pour l'organisation à partir des activités sur lesquelles vos ressources travaillent. L'application des techniques de gestion de portefeuille à ces ressources limitées peut aider à déterminer si le fait de concentrer les ressources sur quelques activités hautement prioritaires, de les répartir sur un grand nombre d'activités pour les couvrir ou de les allouer de manière sélective en fonction des compétences et de l'expérience produira les meilleurs résultats.

3. Destruction de la chapelure - Le redémarrage du serveur peut rétablir le service, mais il peut détruire les informations dont le service informatique a besoin pour résoudre le problème. Souvent, les symptômes et les données contextuelles sur ce qui se passait dans l'environnement, les dépendances actives, les ressources utilisées, ce que l'utilisateur essayait de faire et les performances du système au moment de l'incident sont perdus lorsque l'incident est résolu. Fournir des instructions claires pour capturer ces données dans le cadre de la gestion de l'incident peut éviter des retards futurs dans la recherche de la cause profonde du problème sous-jacent.

4. Récurrence et impact - Les incidents sont généralement traités de manière indépendante, mais la gestion des problèmes doit tenir compte du risque de répétition des incidents. L'évaluation de la fréquence, de la durée et de l'impact de la récurrence des incidents peut aider le personnel informatique et les décideurs à considérer la situation de manière plus globale. En " reliant les points ", une analyse plus approfondie peut aider à déterminer si l'atténuation de l'impact immédiat de l'incident doit être prioritaire par rapport à la prévention de sa répétition.

5. Reproductibilité - Certains problèmes ne peuvent être diagnostiqués que par une analyse en temps réel des systèmes et de l'environnement au moment où les incidents se produisent - reproduire l'incident ultérieurement n'est pas toujours possible. Lorsque l'on soupçonne que ce sera le cas, il est nécessaire de coordonner les activités de gestion des problèmes et des incidents pour permettre un diagnostic en direct pendant la résolution de l'incident. Les clés pour y parvenir efficacement sont : une autorité décisionnelle claire, une communication efficace et une coordination des activités.

6. Report de l'impact à un moment ultérieur - L'une des décisions les plus difficiles de la gestion des incidents est d'évaluer l'impact de la prolongation de l'incident en cours pour diagnostiquer le problème sous-jacent par rapport à la résolution de la situation actuelle et l'augmentation du risque de récurrence dans le futur lorsque l'impact est inconnu. La plupart des entreprises ont des cycles d'activités non linéaires, mais prévisibles. Par exemple, l'impact peut être plus faible au milieu de la nuit ou plus élevé la dernière semaine du trimestre, lors de l'effort final pour atteindre les objectifs financiers. Une bonne compréhension de ces cycles aide le personnel informatique à prendre des décisions plus conformes aux besoins de l'entreprise lors du traitement des incidents.

La méthodologie de résolution des problèmes de votre organisation doit inclure des étapes de processus pour la capture des données de diagnostic dans le cadre de la gestion des incidents et des critères de décision clairement définis pour l'investigation d'un problème. Il n'y a souvent pas de réponse correcte et claire pour savoir quand il faut simplement rétablir le service ou quand il faut résoudre définitivement un problème, mais la prise en compte des 6 facteurs énumérés vous aidera.

Parfois, il faut juste choisir son poison.

Kepner-Tregoe est un leader du secteur en matière de résolution de problèmes - il aide les entreprises à affiner leurs processus ITSM grâce à des outils, des techniques, des compétences et des processus permettant au personnel informatique de mieux soutenir les utilisateurs et les processus métier.

À voir aussi

Image du blog 1
Incidents et problèmes - les deux faces d'une même médaille
Image du blog 1
Les meilleures pratiques en matière d'examen après incident améliorent considérablement la réponse aux incidents
Image du blog 1
Comment devenir une superstar de la gestion des incidents et des problèmes ?
Image du blog 1
Principes essentiels en cas d'incident majeur : Communication et action efficace. Aidez-nous ! Que faisons-nous maintenant ?

Nous sommes experts en :

Nous contacter

Pour tout renseignement, information complémentaire ou un devis