Een verkort gebruik van Probleemanalyse.

Problemen aan boord van Apollo XIII

Overgenomen uit De nieuwe rationele manager, door Charles H. Kepner en Benjamin B. Tregoe

Princeton Research Press, NJ, 1991, 1997.

Het beste gebruik van Probleemanalyse is het gebruik dat het beste werkt. Er is geen bijzondere verdienste verbonden aan het slaafs volgen van elke stap in het hele proces als een kort, informeel gebruik van de ideeën de oorzaak van het probleem aan het licht kan brengen. In feite is het zo dat hoe langer mensen Probleemanalyse gebruiken, hoe bedrevener zij worden in het selecteren van fragmenten van het proces die van toepassing zijn op het soort problemen waarmee zij dagelijks te maken hebben. Wanneer mensen vragen beginnen te stellen als "Is er de laatste tijd iets veranderd in de timing van deze operatie?" of "In welke fase bevond dit proces zich vlak voordat u het probleem opmerkte?" hebben ze de overgang gemaakt tussen een academische waardering van Probleemanalyse-technieken en de internalisering van hun praktische rol bij het dagelijks oplossen van problemen.

De overgrote meerderheid van Probleemanalyses ziet nooit pen en papier.

Dit geldt met name voor de verkorte toepassing van het proces. De ernst van een probleem is niet noodzakelijk bepalend voor de lengte of de complexiteit van de analyse die nodig is om het op te lossen. Enkele zeer ernstige problemen zijn opgelost door een verkorte toepassing van het proces. De gegevens waren zo schaars dat het proces niet volledig kon worden toegepast. Men moest zich baseren op fragmenten van het proces en deze combineren met beredeneerde speculaties om tot een meest waarschijnlijke oorzaak te komen.

Apollo XIII was op weg naar de maan.

Vierenvijftig uur en tweeënvijftig minuten na de missie - 205.000 mijl van de aarde - en alles was goed. Toen meldde John L. Swigert, Jr., de toenmalige commandant: "Houston, we hebben een probleem hier .... We hebben een Main Buss B undervolt." Dit was een insidersmanier om te zeggen dat de elektrische spanning op het tweede van twee stroomopwekkingssystemen was gedaald en dat er een waarschuwingslampje was verschenen. Even later kwam de stroom weer op gang. Swigert rapporteerde: "De spanning ziet er goed uit. En we hadden een vrij grote knal in verband met de waarschuwing en de waarschuwing daar." Drie minuten later, toen de omvang van het probleem duidelijker werd, meldde hij: "Ja, we hebben ook een Main Buss A ondervolt. Hij geeft ongeveer 25½ aan. Main B geeft nu nul aan."

De Apollo XIII, die met ongelooflijke snelheid drie mensen naar de maan bracht, verloor snel aan kracht en zou spoedig een lijk kunnen worden. Er had zich een ramp voorgedaan in de ruimte en niemand wist zeker wat er gebeurd was.

NASA ingenieurs zetten Probleem Analyse aan het werk.

Op de grond in Houston gingen de NASA-ingenieurs onmiddellijk aan de slag met het stellen van vragen over de probleemanalyse. Zij begonnen een specificatie van de afwijking op te bouwen aan de hand van de informatie die zij kregen als antwoord op hun vragen en van de gegevens die werden weergegeven op hun controleapparatuur.

Er worden noodmaatregelen genomen.

Tegelijkertijd begonnen ze met een aantal noodmaatregelen om het gebruik van elektrische energie aan boord van de Apollo XIII te verminderen. Dertien minuten na het eerste rapport, rapporteerde Swigert: "Onze O2 Cryo Nummer Twee Tank geeft nul aan...en het lijkt me, als ik uit het luik kijk, dat we iets...de ruimte in blazen...het is een of ander gas."

Wat begon als een elektrisch probleem - verlies van spanning - werd een plotseling verlies van zuurstof in de tweede van twee tanks, met een meer geleidelijk verlies van zuurstof uit de eerste. Aangezien zuurstof werd gebruikt bij de opwekking van elektriciteit en rechtstreeks in levensinstandhoudingssystemen, kon de situatie nauwelijks ernstiger zijn.

Ingenieurs vinden de oorzaak en ondernemen actie.

Hoewel niemand in die tijd kon bedenken wat de oorzaak van het barsten van de tank kon zijn, zou "Rupture of the Number Two Cryogenic Oxygen Tank" het plotselinge verlies van spanning en het daaropvolgende verlies van druk verklaren.

Verdere maatregelen werden genomen om zowel zuurstof als elektriciteit te besparen. Een aantal "IS...KAN ZIJN maar IS NIET" vragen werden gesteld om verdere gegevens te verkrijgen, en een reeks systeemcontroles werd ondernomen om de oorzaak te verifiëren. Uiteindelijk werd vastgesteld dat de tank nummer twee was gebarsten en al zijn zuurstof, plus een groot deel van het gas uit de tank nummer één, via een beschadigde klep naar buiten in de ruimte had geblazen.

De drie mannen keerden met succes terug naar de aarde, maar slechts met een kleine marge. Als de oorzaak veel langer onbekend was gebleven, hadden ze niet genoeg zuurstof meer gehad om te overleven.

Dus, wat was de hoofdoorzaak?

Het duurde weken voordat de oorzaak van dit probleem door testen en experimenten op de grond was vastgesteld. Twee weken voor de lancering had een grondploeg vloeibare zuurstof in de tanks gepompt tijdens een aftel demonstratie. Na de test hadden ze problemen gehad om de zuurstof uit de tank van nummer twee te krijgen. Zij hadden een verwarmingselement in de tank geactiveerd om een deel van de vloeibare zuurstof te laten verdampen en zo druk uit te oefenen om het eruit te krijgen. Zij hadden het verwarmingselement acht uur lang aan laten staan, langer dan ooit tevoren was gebruikt. Hoewel er een veiligheidsschakelaar was om het verwarmingselement uit te schakelen voordat het te heet werd, was de schakelaar gesmolten in de ON positie omdat het grondpersoneel het had aangesloten op een 65-volt voeding in plaats van de 28-volt voeding gebruikt in de Apollo XIII. Later, tijdens de vlucht, zette de bemanning het verwarmingselement kort aan om een nauwkeurige hoeveelheidsmeting te krijgen. De gezekerde schakelaar veroorzaakte een boog die de zuurstof in de tank oververhitte, de interne druk enorm verhoogde en de koepel en een groot deel van de verbindingspijpen de ruimte in blies.

Er was geen tijd voor NASA Houston om een volledige lijst door te nemen van alle verschillen en veranderingen die ze zouden kunnen waarnemen. In plaats daarvan vroegen ze: "Welke traumatische verandering kan de plotselinge, totale uitval in de elektriciteitsopwekking veroorzaken?" Het afsluiten van de toevoer van zuurstof naar de brandstofcellen zou dat effect hebben. Ze wisten welke brandstofcellen buiten werking waren toen Swigert meldde dat de tank nummer twee nul aangaf.

Gebruik makend van wat bekend was om de oorzaak te testen.

Zij testten de oorzaak - dat de Nummer Twee Tank was gescheurd - en stelden vast dat dit de plotselingheid en de totaliteit zou verklaren zoals beschreven in de specificatie. Het zou ook de knal verklaren die werd gemeld op het moment van de eerste onderspanning indicatie, een beving van de Apollo XIII gevoeld door de bemanningsleden, en de ontluchting van "iets...de ruimte in." Het verklaarde zowel de IS gegevens die zij hadden verzameld als de IS NOT informatie die was gekomen van hun monitoring activiteiten. Belangrijker nog, het verklaarde een plotselinge, totale storing in het systeem.

Voor de ingenieurs van NASA Houston was deze zaak moeilijk te aanvaarden.

Ze hadden een grenzeloos vertrouwen in de Apollo uitrusting, wetende dat het de beste was die bedacht kon worden. Het idee van een openbarstende zuurstoftank in de diepte van de ruimte was niet geloofwaardig. Dit alles was gerechtvaardigd door hun ervaring. Zonder het geklungel dat zich twee weken voor de lancering op de grond had voorgedaan, zou de tank naar de maan en terug zijn gegaan precies zoals hij was ontworpen en gebouwd om dat te doen. De ingenieurs in Houston hielden echter ondanks hun ongeloof vast aan het Probleemanalyseproces, in de overtuiging dat de oorzaakproef die zij hadden uitgevoerd het juiste antwoord had gegeven. In feite bewezen zij deze oorzaak in recordtijd. Wat de dag redde was hun kennis van Apollo XIII's systemen en van wat precies het soort plotselinge storing kon veroorzaken dat zich had voorgedaan.

Een analytische benadering van bedrijfskritische problemen.

In een geval als dit wordt de probleemanalyse bemoeilijkt door twee factoren: secundaire effecten en paniek. Plotseling falen in een complex systeem veroorzaakt meestal andere afwijkingen die de oorspronkelijke afwijking kunnen verdoezelen. De schok van een plotselinge storing leidt vaak tot paniek, waardoor een zorgvuldig onderzoek en gebruik van de feiten nog moeilijker wordt. Een gedisciplineerd en systematisch onderzoek is hoe dan ook moeilijk, maar discipline wordt essentieel wanneer op topsnelheid naar de oorzaak wordt gezocht en het niet mogelijk is alle gegevens te verzamelen die voor het onderzoek optimaal zouden zijn.

In het NASA-incident stelde de aanwezigheid van een systematische aanpak een team van mensen in staat als één eenheid samen te werken, ook al waren zij van de afwijking gescheiden door bijna een kwart miljoen mijl. Voor de ingenieurs van NASA Houston was deze oorzaak moeilijk te aanvaarden.

Download de casestudy