問題分析(PA)の部分活用

アポロ13号でのトラブル

復刻版 からです。 新しい合理的なマネージャーチャールズ・H・ケプナー、ベンジャミン・B・トレゴー著

Pリンチェットn Re同様の顧客サポートのearch Pレス, Pリンストン, NJ, 1991,  1997.

結果が出る方法が問題分析(PA)の最善の使い方です。手軽で簡単な方法で問題の原因を明らかにできるのであれば、すべてのKTプロセスを遵守することにこだわる必要はありません。実際、問題分析(PA)を長く使っていると日々直面するいろいろな問題にPAプロセスを部分的に適用できるようになります。問題分析(PA)テクニックを理論的に理解し、日常的な問題解決に適用できるようになると「最近この業務の実施タイミングが何か変わりましたか?」とか「問題に気づく直前この処理のどの段階を実施していましたか?」のような質問ができるようになります。

問題分析の殆どにペンと紙はいらない

これは特に、プロセスの省略適用の場合に当てはまります。問題の深刻さは、それを解決するために必要な分析の長さや複雑さを必ずしも決定するものではありません。非常に深刻な問題でも、プロセスを省略して使用することで解決したことがあります。そのような問題はデータが不足しているため、完全に使用することができませんでした。プロセスの断片を頼りに、経験に基づいた推測と組み合わせて、最も可能性の高い原因にたどり着かなければなりませんでした。

アポロ13号は月に向かっていた

ミッション開始から54時間52分、地球から15,000マイル離れた場所で、すべてが順調に進んでいた。しかし、当時の司令官であるジョン・L・スウィガートJr.から報告があった。「ヒューストン、問題が発生した。....ヒューストン、ここで問題が発生した。メインバスBが不安定になっている」。 これは、2つある発電装置のうち、2つ目の発電装置の電圧が低下し、警告灯が点灯したことを内部の人間が伝えたものである。暫くすると、再び電源が入った。スウィガートはこう報告した。「電圧は問題ない。そして、注意と警告に伴ってかなり大きな音が出た」と報告した。その3分後、問題の大きさが明らかになってきたので、彼はこう報告した。「ああ、メインバスAの電圧が低下している....、約25½を示している。Main Bは今ZIPを示しています。

3人を乗せてすさまじい速度で月に向かうアポロ13号は、急速に電力を失いコントロール不能になるのも時間の問題でした。宇宙で事故が発生したが、この時点では何が起きたのか誰も判かりませんでした。

PA(問題分析)を適用したNASAの技術者たち

ヒューストンの現場では、すぐにNASAのエンジニアが問題分析(PA)の質問を始めました。彼らは、質問の答えから得た情報と監視画面に表示されるデータから「差異の明確化」をおこないました。

発生時対策の発動

それと同時に彼らはアポロ13号の電力消費を減らすためにいくつかの緊急措置を講じました。最初の報告から13分後、スワイガートは次のような報告をしてきました。「2番低温酸素タンクの残量がゼロです。宇宙船のハッチから覗くと何かガスのようなものが放出しているのが見えます」。

電圧降下という電気的な問題から始まり、2つの酸素タンクの2番目からは突然、1番目からは徐々に酸素が減少していたのです。酸素は発電だけでなく生命維持装置に使われるため事態は深刻でした。

技術者による原因究明と対応

タンクが破裂した原因はその時点で誰も判りませんでしたが「第2極低温酸素タンクの破裂」が急激な電圧の低下とそれに続く圧力低下をもたらしたに違いありませんでした。

さらに、酸素と電力を節約するための措置がとられた。さらなるデータを得るために "IS...COULD BE but IS NOT "という質問を何度も繰り返し、原因を確認するために一連のシステムチェックを行った。最終的には、2号タンクが破裂し、酸素と1号タンクのガスの大部分が、破損したバルブを通って宇宙空間に放出されたことが判明した。

このような経験をしながらも3人の宇宙飛行士たちはギリギリのところで無事地球に戻ることができました。原因究明に時間がかかっていた ら、酸素不足で生き残ることはできなかったでしょう。

事故の根本原因は?

この問題の根本的な原因が、現場でのテストや実験によって解明されるまでには数週間を要した。打ち上げの2週間前に、地上作業員がカウントダウンのデモンストレーションとして液体酸素をタンクに注入した。その結果、2番タンクから酸素が出てこなくなった。そこで、タンク内のヒーターを作動させ、液体酸素の一部を気化させ、圧力をかけて酸素を排出させた。ヒーターは8時間も作動させていた。ヒーターが熱くなりすぎる前にオフにするための保護スイッチが用意されていたが、地上クルーがアポロXIIIで使用した28ボルトの電源ではなく、65ボルトの電源に接続していたため、スイッチはONの状態でヒューズが入っていた。その後、飛行中にクルーは正確な量を測るためにヒーターを短時間オンにした。このスイッチがアークを発生させ、タンク内の酸素を過熱させ、内圧を大幅に上昇させ、ドームと接続配管の大部分を宇宙に吹き飛ばしてしまったのです。

ヒューストンのNASAスタッフには、すべての区別点と変化を一つ一つ調べる時間はありませんでした。そこで彼らは「発電機能を瞬時に落としうる外傷的な変化」について考えました。燃料電池への酸素の流れを遮断すれば発電機能は止まります。スワイガートが第2タンクの残量がゼロだと報告してきたとき、彼らはどの燃料電池が作動不能かを知っていました。

判っていることを使って想定原因を検証する

彼らは「第2タンクの破裂」という想定原因を検証し、この原因が調査書にある突然性や全体性を説明できることを確認しました。それはまた、最初の低電圧警告時に報告された爆発、宇宙飛行士が感じたアポロ13号の振動、そして「何かが宇宙空間に放出していた」などの状況も矛盾なく説明できました。そしてそれは、集めたIS情報(起きた事実)と監視活動で得られたIS NOT情報(起きそうなのに 起きてもよさそうなのに 起きなかった事実)の両方を説明できました。最も重要な点は、システム内の突然かつ全体的なシステムダウンが説明できた事です。

NASAの技術者にとって認めがたい原因

彼らは、アポロの装備が最高のものであると信じていた。宇宙空間で酸素タンクが破裂するなどということは考えられない。これらはすべて、彼らの経験から正当化されたものである。打ち上げの2週間前に地上で起きたトラブルがなければ、酸素タンクは設計どおりに月に行って帰ってくることができた。しかし、ヒューストンのエンジニアたちは、信じられない思いをしながらも、自分たちが行った原因究明のテストが正しい答えであると信じて、問題分析のプロセスを続けた。実際、彼らは記録的な速さでその原因を証明した。アポロXIIIのシステムを熟知していた彼らは、今回のような突然の故障を起こす可能性があることを知っていたからだ。

組織の重大な問題に対する分析的アプローチ

このようなケースでは、二次的影響とパニックという2つの要因によって問題分析が難しくなります。複雑なシステムにおける突然の故障は、通常、他の逸脱を引き起こし、元々の逸脱を曖昧にしてしまいます。突然の故障のショックでパニックに陥り、事実の慎重な検討と利用がさらに困難になることが多い。規律ある体系的な調査はどのような場合でも難しいが、トップスピードで原因究明が行われ、調査に最適なデータをすべて集めることができない場合には、規律が不可欠となる。

NASAの事件では、体系的なアプローチがあったおかげで33万キロ離れていてもチームは一つのユニットとして作業できました。 NASAヒューストンの技術者にとってこの原因は受け入れがたいものでしたが…。

ケーススタディのダウンロード