nld

Maak een einde aan brandjes blussen met Proactief Probleembeheer

Door Tim Roberts, Christoph Goldenstern

In elke organisatie, of het nu gaat om dienstverlening of bedrijfsvoering, bestaat er een systeem om belangrijke incidenten te evalueren nadat het incident in eerste instantie is afgehandeld. Dit kan een Post Incident Review (PIR) worden genoemd of een After-Action-Review (een term die vaak wordt gebruikt in de productieomgeving). De organisatie kan meer dan één aanpak gebruiken en verschillende organisatorische silo's kunnen verschillende methodologieën hanteren.

Probleembeheer kan reactief of proactief zijn

Reactief probleembeheer is erop gericht de oorzaak van bekende incidenten te vinden en weg te nemen. Proactief probleembeheer, met een meer holistische visie, kijkt verder dan het incident om toekomstige incidenten te identificeren en te voorkomen door (systemische) hoofdoorzaken te identificeren en te elimineren die soortgelijke soorten incidenten blijven veroorzaken.

Proactief probleembeheer houdt rekening met het incident en de oorzaak(en) die het heeft veroorzaakt, en met de bredere omstandigheden die het incident mogelijk hebben gemaakt, zodat alle factoren die tot het incident hebben bijgedragen, diepgaander kunnen worden geanalyseerd. Een cruciale stap na deze analyse is het zorgvuldig plaatsen van preventieve acties die zijn ontworpen om specifieke incidenten te beperken waarvan bekend is dat ze een aanzienlijke negatieve impact hebben.

Als u de problemen bekijkt die uw organisatie de meeste ergernis bezorgen, zult u waarschijnlijk merken dat het terugkerende incidenten zijn die meestal op korte termijn worden aangepakt met een workaround of "patch", maar nooit volledig worden opgelost. Het team komt nooit tot de "structurele oorzaken" en stelt dus nooit maatregelen in om de situatie op lange termijn te beperken.

Een voordeel van proactief probleembeheer is de mogelijkheid om zich te concentreren op het elimineren van deze systemische, steeds terugkerende incidenten. Deze methodologie wordt typisch toegepast:

  • Tijdens een postmortem review van grote uitval/incidenten
  • Tijdens het live begeleiden van grote incidenten
  • Als onderdeel van een programma voor voortdurende verbetering van de dienstverlening

Organisaties die Continuous Service Improvement actief benaderen, zullen merken dat dit proces verschillende mogelijkheden kan identificeren om zowel bedrijfsprocessen als technologie te verbeteren. Na een groot incident of uitval is het sterk aan te bevelen een post-mortem evaluatie uit te voeren waarbij de belangrijkste stakeholders worden betrokken.

Wat is Incident Mapping?

Bij Kepner-Tregoe is Proactive Problem Management opgebouwd rond een kerninstrument dat we "Incident Mapping" noemen - een middel om het incident te visualiseren en "de gebeurtenis" in kaart te brengen.

De linkerkant van figuur 1 geeft een momentopname van typische incident review documentatie die gebruikt wordt om een live vergadering te faciliteren om een groot incident te begrijpen. Het is niet ongebruikelijk dat dit document uitgroeit tot vijf of zes pagina's dicht opeengepakte tekst, waarin observaties, acties en communicatie over het gehele tijdsbestek van het incident worden vastgelegd. Het resultaat is een wirwar van gedetailleerde informatie die het moeilijk maakt om relevant van irrelevant, belangrijk van onbelangrijk te scheiden.

Aan de rechterkant van figuur 1 wordt het volledige verhaal van vijf bladzijden met een beschrijving van het incident weergegeven in een visueel stroomdiagram dat bekend staat als een Incident Map.

Het moet duidelijk zijn dat de kaart veel eenvoudiger en praktischer is voor de personen die het incident beheren. Het is ook een veel betere manier om het incident te melden aan het hogere management, dat zelden de tijd of de tolerantie heeft voor uitvoerige, gedetailleerde documentatie.

Wanneer dit effectief gebeurt, is deze visualisatie het resultaat van een proces dat het incident systematisch beschrijft in termen van:

  • De belangrijkste probleem en de gevolgen ervan
  • Alle oorzaak-gevolg keten(s) die het in gang zette
  • De omstandigheden bijdragen aan het effect van het incident - beschrijven waarom de gevolgen wel of niet zo erg waren als ze hadden kunnen zijn
  • Belemmeringen die zijn geschonden- maatregelen die de oorzaak-gevolg causaliteit hadden kunnen onderbreken, en waarom ze niet werkten
  • Acties die werden genomen
  • Acties die worden voorgesteld, gekozen of uitgevoerd om te voorkomen dat het probleem zich herhaalt
  • Acties om risico's te beperken van voorgestelde wijzigingen (om geen nieuwe, afzonderlijke incidenten te veroorzaken!)

Figuur 2 geeft een visualisatie van het proces om incidenten in kaart te brengen. Het is een stapsgewijs proces dat begint met een beschrijving van het primaire incident, de identificatie van de causale keten, culminerend in de ontwikkeling en bescherming van aanbevelingen om herhaling te helpen voorkomen. Voorbereiding is een cruciale stap in dit proces (weergegeven als stap 0). Een belangrijk onderdeel van deze stap is ervoor te zorgen dat de personen met de juiste materiedeskundigheid beschikbaar zijn om een bijdrage te leveren.

De opeenvolging van stappen kan worden gekoppeld aan de instrumenten die vertrouwd zullen zijn bij personen die met Kepner-Tregoe hebben gewerkt (zie hiernaast) of over zijn methodologieën hebben gelezen. Incident mapping is in de eerste plaats een vorm van zeer visuele Situation Appraisal. Indien nodig kunnen andere instrumenten voor probleemoplossing en besluitvorming worden gebruikt binnen de context van deze methodologie/het raamwerk.

Hoe worden incidenten in kaart gebracht?

Deze analysetechniek (incident mapping) wordt op grote schaal gebruikt in IT- en operationele afdelingen in een breed scala van industrieën. Het heeft meerdere voordelen, waaronder een snellere, duidelijkere en productievere post-incident review (PIR), waarbij de output een grotere impact heeft op de organisatie. Bij een PIR kunnen 10 tot 12 mensen rond de tafel zitten, meestal gedurende een uur of twee. Waarschijnlijk waren ze allemaal op een of andere manier betrokken bij het oorspronkelijke incident, en bekijken ze wat er is gebeurd, waarom het is gebeurd, welke actie is ondernomen, en wat kan worden gedaan om herhaling te voorkomen.

Voorafgaand aan deze evaluatie moet de bestaande documentatie worden doorgenomen. Dit moet alle acties of herstelacties bevatten die tijdens het incident zelf hebben plaatsgevonden. Deze gegevens worden meestal vastgelegd door iemand binnen de ondersteunende organisatie, vaak een major incident manager of een problem manager die bij het incident betrokken was.

De traditionele versie van de incident review, die veel tekst bevat, is meestal een chronologisch verhaal van hoe het probleem zich ontvouwde. De facilitator moet de groep regel voor regel door dit document leiden, om overeenstemming te bereiken over de chronologie en de beschrijving. Een incident map daarentegen biedt een dynamische manier om de sessie te leiden, waarbij de informatie als volgt wordt opgedeeld:

  • Vaststellen van een lijst van causale ketens
  • Een reeks punten vaststellen die het incident hadden moeten voorkomen
  • Toon de omstandigheden die de ernst beïnvloedden
  • Duidelijke omschrijving van de eigenaars van alle toekomstige acties

Velen vinden het in kaart brengen van het proces in figuur 3 beknopter dan een tekstuele voorstelling, omdat het incidenttraject wordt weergegeven door een reeks vormen en kleuren te plaatsen die details en gebeurtenissen voorstellen, met pijlen die de onderlinge relaties aangeven. Deze presentatie is een stapsgewijze visualisatie die de neiging heeft sneller tot consensus te leiden dan met tekstuele beschrijvingen kan worden bereikt.

Met behulp van deze kaart kan het team zich een weg banen van de primaire gebeurtenis - de gebeurtenis die het supportteam bewust maakte van een incident - naar de onderliggende oorzaken, en vervolgens naar het identificeren van barrières, systemen of maatregelen om de verbanden tussen deze omstandigheden te verbreken. Van daaruit gaat het team over tot diepere analyses of besluitvorming om een onbekende oorzaak te onderzoeken, of bepaalde acties te selecteren.

De problemen die de meeste ergernis veroorzaken, zijn terugkerende incidenten die meestal worden aangepakt met een workaround, maar nooit volledig worden opgelost

Organisaties zijn begonnen met het integreren van proactief probleembeheer en het in kaart brengen van incidenten in hun post-incident of after-action reviews en, in sommige gevallen, in het beheer van hun lopende incidenten. Een voorbeeld is een grote en complexe overheidsinstelling in het Verenigd Koninkrijk waar KT gecertificeerde programmaleiders, die probleemoplossing onderwijzen en faciliteren binnen de IT service organisatie, een visuele kaart op een whiteboard maken om hun analyse van een incident te documenteren en vervolgacties toe te wijzen. Individuen zijn altijd verantwoordelijk voor het omzetten van gekozen acties in ondernomen acties. Deze eenvoudige incident map vormt de basis voor management communicatie en is nu het format dat het management verwacht te zien wanneer een incident wordt weergegeven.

Deze mapping-methodologie wordt steeds vaker gebruikt in "Pre-Mortem"-analyses, een vorm van proactief probleembeheer die plaatsvindt voorafgaand aan een incident. Als er een grote verandering wordt doorgevoerd, vragen belanghebbenden zich af: "Als we deze verandering doorvoeren, wat kan er dan fout gaan?" Pre-Mortem incident maps impliceren veel creatief, out-of-the-box denken. Dit soort brainstormen kan vrij grote kaarten opleveren, maar de opmaak biedt een structuur voor een analyse die kan worden gebruikt om potentiële incidenten te voorkomen of te beperken.

Een overbruggingstechniek

Een incidentenkaart is een veel betere manier om het incident te melden aan het hogere management, dat zelden tijd of geduld heeft voor uitvoerige, gedetailleerde documentatie.

De incidentkaart dient als een permanente registratie van een incident. Als de kaart wordt gemaakt tijdens het beheer van een live incident, worden de op dat moment ondernomen acties vastgelegd en kan de kaart verschillende keren worden bijgewerkt als aanvullende acties worden ondernomen en barrières worden opgeworpen. Dit kan gaan tot en met de afsluiting van een post-incident review. De incident map dient als een audit van het denken van mensen, zodat iedereen kan begrijpen welke weg het incident management team heeft afgelegd om tot een hoofdoorzaak en een oplossing te komen.

Het gebruik van vormen en kleuren hoeft niet volgens een bepaalde conventie te verlopen, zolang iedereen in de zaal het er maar over eens is wat elke vorm voorstelt. De methodologie is niet afhankelijk van een specifieke technologie, hoewel het gebruik van software die ontworpen is om incidenten in kaart te brengen, een aanzienlijke waarde kan toevoegen aan

het proces. Voorbeelden zijn stroomdiagrammen zoals Visio® van Microsoft en CauselinkTM, een softwarehulpmiddel dat is afgestemd op de KT-methodologie die hieronder in figuur 4 is afgebeeld.

Het gebruik van een dynamisch softwareprogramma kan helpen om het in kaart brengen van oorzaken naar een hoger niveau te tillen door:

  • Helpen bij het uitvoeren van facilitaties in real-time
  • Opbouwen en benutten van een kennisdatabank, in staat om gegevenselementen zoals bewijsmateriaal, notities, taken en oplossingen aan elke oorzaak te koppelen
  • Rapportage, actie-tracking, workflow-tracking en zoeken mogelijk maken

Dit kan met name van belang zijn voor sectoren en functies die sterk op naleving zijn gericht en voortdurend documentatie en controlesporen voor onderzoeken moeten aanleveren.

De incident map stelt de gebruiker in staat een incident te distilleren tot sleutelelementen die gemakkelijk kunnen worden verteerd door anderen, of ze nu betrokken waren bij het incident of niet. De kaart biedt een doeltreffend vocabulaire en een reeks conventies voor zingeving door gebeurtenissen in een causale keten visueel te zien.

Eenmaal onder de knie kan het in kaart brengen van incidenten een effectieve overbruggingstechniek zijn om de organisatie van een reactief probleembeheer naar een continue verbeteringsmentaliteit te brengen.

 

Tim Roberts, Senior Consultant, Kepner-Tregoe
Tim heeft internationale projecten geleid die continue verbetering ondersteunen via de installatie van bedrijfsprocessen waaronder Root Cause Analysis, Incident Mapping en van Project Management. Hij heeft wereldwijd de ontwikkeling van nieuwe strategieën op directieniveau gefaciliteerd en vervolgens samen met het senior management een wereldwijde implementatie ontworpen en gecoördineerd. Tim's focus ligt op de IT-dienstverlening, met name bij klanten in de private en publieke sector voor wie IT-ondersteuning een cruciale functie is.

Christoph Goldenstern, VP Innovatie & Service Excellence, Kepner-Tregoe

Christoph is een consulting leider met meer dan 20 jaar ervaring in het helpen van organisaties op het gebied van strategie, operationele en serviceverbetering. Als lid van KT's executive leadership team en global VP of Strategy and Service Excellence, is hij verantwoordelijk voor KT's business strategie en de oplossingen voor IT Service Management en Technical Support.

Tim Roberts (troberts@kepner-tregoe.com) is gevestigd in het Verenigd Koninkrijk, terwijl Christoph Goldenstern (cgoldenstern@kepner-tregoe.com) zich in het hoofdkantoor van KT in de VS bevindt. Neem contact met hen op om meer te weten te komen over hoe deze processen bij uw team zouden kunnen passen.

Gerelateerd

Het meten van de kwaliteit van Problem Management in een ITIL omgeving

Op het randje en in controle

Wij zijn experts in:

Neem contact met ons op

Voor vragen, details, of offertes!