問題分析の簡略化

アポロ13号のトラブル

復刻版 からです。 新しい合理的なマネージャーチャールズ・H・ケプナー、ベンジャミン・B・トレゴー著

Pリンチェットn Re同様の顧客サポートのearch Pレス, Pリンストン, NJ, 1991,  1997.

KT問題分析を適切に使うことで、最良の結果が得られます。プロセスを簡単に使用することで問題の原因が明らかになるのであれば、プロセスのすべてのステップを忠実に行うことに、特別な美徳はありません。実際、問題分析に慣れれば慣れるほど、自分が日々直面している種々の問題に適用するプロセスの一部分を選び出すのが上手になります。「最近、この作業のタイミングで何か変わったことはありませんか」「トラブルに気づく直前、このプロセスはどの段階にありましたか」といった質問ができるようになると、問題分析を知識として理解していたレベルから、実践体得のレベルへ移行していることになります。

問題分析の大半は、ペンや紙を使うことはありません。

これは特に、プロセスの省略適用の場合に当てはまります。問題の深刻さは、それを解決するために必要な分析の長さや複雑さを必ずしも決定するものではありません。非常に深刻な問題でも、プロセスを省略して使用することで解決したことがあります。そのような問題はデータが不足しているため、完全に使用することができませんでした。プロセスの断片を頼りに、経験に基づいた推測と組み合わせて、最も可能性の高い原因にたどり着かなければなりませんでした。

アポロ13号は月に向かっていました。

ミッション開始から54時間52分、地球から15,000マイル離れた場所で、すべてが順調に進んでいた。しかし、当時の司令官であるジョン・L・スウィガートJr.から報告があった。「ヒューストン、問題が発生した。....ヒューストン、ここで問題が発生した。メインバスBが不安定になっている」。 これは、2つある発電装置のうち、2つ目の発電装置の電圧が低下し、警告灯が点灯したことを内部の人間が伝えたものである。暫くすると、再び電源が入った。スウィガートはこう報告した。「電圧は問題ない。そして、注意と警告に伴ってかなり大きな音が出た」と報告した。その3分後、問題の大きさが明らかになってきたので、彼はこう報告した。「ああ、メインバスAの電圧が低下している....、約25½を示している。Main Bは今ZIPを示しています。

驚異的なスピードで3人の人間を月へと運んでいたアポロ13号は、急速にパワーを失い、まもなく死に体となってしまいます。何が起こったのか誰にも分からない宇宙の大惨事。

NASAのエンジニアは、問題分析を仕事にしています。

Houstonの現場では、NASAのエンジニアが問題分析の質問をすぐに実行に移しました。質問に答える形で得られた情報と、監視装置に表示されるデータから、問題の明細化を始めたのです。

不測の事態に備えた措置がとられました。

同時に、アポロ13号に搭載されている電力の使用を減らすために、いくつかのコンティンジェンシー・アクションを開始しました。最初の報告から13分後、Swigertはこう報告しました。「ハッチの外を見ていると、何かを宇宙空間に放出しているように見えます。」

最初は電気的な問題(電圧の低下)だと思われましたが、2つあるタンクのうち2つ目のタンクで突然酸素が失われ、1つ目のタンクでは徐々に酸素が失われていきました。酸素は発電にも使われますし、生命維持装置にも直接使われるものですから、これほど深刻な事態はありません。

エンジニアは、原因を見つけて行動を起こしました。

当時、タンクが破裂した原因を誰も想定できませんでしたが、「極低温酸素タンク2号機の破裂について」を見れば、突然の電圧低下とそれに伴う圧力の低下が説明できます。

さらに、酸素と電力を節約するための措置がとられた。さらなるデータを得るために "IS...COULD BE but IS NOT "という質問を何度も繰り返し、原因を確認するために一連のシステムチェックを行った。最終的には、2号タンクが破裂し、酸素と1号タンクのガスの大部分が、破損したバルブを通って宇宙空間に放出されたことが判明した。

3人は無事に地球に戻ってこれましたが、それはほんのわずかな差でした。原因不明の状態が長引けば、酸素は枯渇していたでしょう。

では、根本的な原因は何だったのでしょうか。

この問題の根本的な原因が、現場でのテストや実験によって解明されるまでには数週間を要した。打ち上げの2週間前に、地上作業員がカウントダウンのデモンストレーションとして液体酸素をタンクに注入した。その結果、2番タンクから酸素が出てこなくなった。そこで、タンク内のヒーターを作動させ、液体酸素の一部を気化させ、圧力をかけて酸素を排出させた。ヒーターは8時間も作動させていた。ヒーターが熱くなりすぎる前にオフにするための保護スイッチが用意されていたが、地上クルーがアポロXIIIで使用した28ボルトの電源ではなく、65ボルトの電源に接続していたため、スイッチはONの状態でヒューズが入っていた。その後、飛行中にクルーは正確な量を測るためにヒーターを短時間オンにした。このスイッチがアークを発生させ、タンク内の酸素を過熱させ、内圧を大幅に上昇させ、ドームと接続配管の大部分を宇宙に吹き飛ばしてしまったのです。

NASAでは、観測されるであろうすべての違いや変化を完全にリストアップする時間はありませんでした。その代わりに、「どのような外傷的な変化が、突然の完全な発電停止を引き起こすのか?」燃料電池への酸素の供給を止めれば、その効果が得られます。Swigertが「2番タンクの数値がゼロになった」と報告したことで、どの燃料電池が機能していないかがわかりました。

原因をテストするために分かっていることを利用する。

2号タンクが破裂したという事象を検証したところ、仕様書に記載されているような突発性と全体性を説明できることがわかりました。また、最初の電圧低下表示の際に報告された「バン」という音、乗組員が感じたアポロ13号の揺れ、そして「何かが...宇宙に向かって」放出されたことも説明がつきます。それは、彼らが蓄積したISデータと、彼らの監視活動から得られたIS NOT情報の両方を説明するものでした。そして、何よりも重要なのは、システムが突然、完全に故障したということでした。

NASAのエンジニアたちにとって、この原因は受け入れがたいものでした。

彼らは、アポロの装備が最高のものであると信じていた。宇宙空間で酸素タンクが破裂するなどということは考えられない。これらはすべて、彼らの経験から正当化されたものである。打ち上げの2週間前に地上で起きたトラブルがなければ、酸素タンクは設計どおりに月に行って帰ってくることができた。しかし、ヒューストンのエンジニアたちは、信じられない思いをしながらも、自分たちが行った原因究明のテストが正しい答えであると信じて、問題分析のプロセスを続けた。実際、彼らは記録的な速さでその原因を証明した。アポロXIIIのシステムを熟知していた彼らは、今回のような突然の故障を起こす可能性があることを知っていたからだ。

重大な問題に対する分析的アプローチ。

このようなケースでは、二次的影響とパニックという2つの要因によって問題分析が難しくなります。複雑なシステムにおける突然の故障は、通常、他の逸脱を引き起こし、元々の逸脱を曖昧にしてしまいます。突然の故障のショックでパニックに陥り、事実の慎重な検討と利用がさらに困難になることが多い。規律ある体系的な調査はどのような場合でも難しいが、トップスピードで原因究明が行われ、調査に最適なデータをすべて集めることができない場合には、規律が不可欠となる。

NASA件では、システム化されたアプローチの存在により、ロケットと25万マイル近く離れていても、チームが一丸となって働くことができました。NASAのエンジニアたちにとって、この原因は受け入れがたいものでした。

ケーススタディのダウンロード