问题分析的简略使用

阿波罗十三号上的问题

重印 新的理性的管理者作者:查尔斯-H-凯普纳和本杰明-B-特雷戈

P凌霄阁n Research P芦苇, P林斯顿大学, NJ, 1991,  1997.

问题分析的最佳使用是最有效的使用。如果简短的、非正式的使用思路能够揭示出问题的原因,那么一味地坚持整个过程中的每一个步骤并没有什么特别的好处。事实上,人们使用问题分析的时间越长,他们就越善于挑选出适用于他们每天面临的各种问题的过程片段。当人们开始问一些问题,比如 "最近这个操作的时间有什么变化吗?"或者 "就在你注意到问题之前,这个过程处于什么阶段?"他们已经完成了对问题分析技术的学术欣赏和对其在日常问题解决中的实际作用的内部化之间的过渡。

绝大多数的问题分析都没有见过纸和笔。

这一点在程序的简略应用中尤为明显。一个问题的严重性并不一定决定解决该问题所需的分析的长度或复杂性。一些极其严重的问题已经通过简略地使用该过程得到了解决。这些问题的数据非常匮乏,以至于无法充分使用。必须依靠该过程的片段,并与有根据的推测相结合,以得出一个最可能的原因。

阿波罗十三号正在前往月球的路上。

任务进行了54小时又52分钟,距离地球25000英里,一切都很顺利。然后,当时的值班指挥官John L. Swigert, Jr.报告。"休斯顿,我们这里有一个问题....我们有一个主母线B的欠电压。" 这是一个内部人士的说法,即两个发电系统中的第二个系统的电压下降,出现了一个警告灯。一会儿后,电力又上来了。斯威格特报告说。"电压看起来不错。而且我们有一个相当大的爆炸,与那里的警戒和警告有关。"三分钟后,随着问题的规模变得更加清晰,他报告说。"是的,我们也得到了一个主母线A的欠电压....,它的读数约为25½。主母线B现在的读数是zip。"

阿波罗十三号载着三个人以难以置信的速度向月球飞去,正在迅速失去动力,不久就可能变成一具尸体。太空中发生了一场灾难,没有人确定发生了什么。

美国国家航空航天局(NASA)的工程师将问题分析法用于工作。

在休斯顿的地面上,美国宇航局的工程师们立即将问题分析提问投入工作。他们开始从回答他们问题的信息和监测设备上显示的数据中建立一个偏差的规范。

采取了应急行动。

同时,他们开始了一些应急行动,以减少阿波罗十三号上的电力使用。在第一次报告的13分钟后,斯威格特报告说。"我们的O2低温二号罐的读数为零......在我看来,从舱门向外看,我们正在向太空排放某种东西......是某种气体。"

起初是一个电气问题--失去电压--变成了两个水箱中的第二个水箱突然失去氧气,而第一个水箱中的氧气则逐渐失去。由于氧气被用于发电以及直接用于生命支持系统,这种情况再严重不过了。

工程师找到原因并采取行动。

尽管当时没有人能够想象到是什么原因导致了罐体的爆裂,但 "二号低温氧气罐破裂 "可以解释电压的突然丧失和随后的压力损失。

我们采取了进一步的行动来节约氧气和电力。为了获得更多的数据,我们提出了一些 "是......可能是但不是 "的问题,并进行了一系列的系统检查以核实原因。最后确定,二号罐爆裂并排放了所有的氧气,加上一号罐的大部分气体,通过一个损坏的阀门并排放到太空中。

这三个人成功地返回了地球,但只是以最微小的差距。如果原因不明的时间更长,他们将没有足够的氧气来生存。

那么,根本原因是什么呢?

几周后,通过现场测试和实验才确定了这个问题的根本原因。在发射前两个星期,地面人员在倒计时演示中把液态氧注入罐内。测试之后,他们很难将氧气从二号罐中取出。他们启动了罐内的一个加热器,使一些液态氧汽化,从而提供压力,迫使它出来。他们把加热器开了8个小时,比以前使用的时间还长。虽然提供了一个保护开关,在加热器变得太热之前将其关闭,但由于地面人员将其连接到65伏的电源上,而不是阿波罗十三号使用的28伏电源,所以开关在开启位置被熔断。后来,在飞行中,工作人员短暂地打开了加热器,以获得准确的数量读数。熔断的开关产生了一个电弧,使罐内的氧气过热,内部压力大大增加,并将穹顶和大部分连接管道吹到太空中。

美国宇航局休斯顿分局没有时间去完整地列出他们可能观察到的所有区别和变化。相反,他们问道:"什么创伤性变化会导致发电的突然、完全失败?"切断流向燃料电池的氧气会产生这种效果。当斯威格特报告说二号油箱的读数为零时,他们就知道哪些燃料电池不能工作了。

用已知的东西来测试原因。

他们测试了原因--二号油箱破裂,发现这可以解释说明书中描述的突然性和整体性。这也可以解释在第一次低电压指示时报告的爆炸声,飞行人员感觉到的阿波罗十三号的颤抖,以及 "有东西......流向太空 "的排放。这既说明了他们积累的IS数据,也说明了他们的监测活动中出现的IS NOT信息。更重要的是,它解释了系统内的一个突然的、完全的故障。

对于NASA休斯顿的工程师来说,这个原因是难以接受的。

他们对阿波罗设备有着无限的信心,知道这是可以设计出来的最好的设备。氧气罐在太空深处爆裂的想法是不可信的。所有这些都是他们的经验所证明的。如果没有发射前两周在地面上发生的混乱,氧气罐会像它的设计和建造那样,在月球上往返飞行。然而,休斯顿的工程师们尽管感到不可思议,但还是坚持问题分析过程,认为他们进行的原因测试提供了正确的答案。事实上,他们在创纪录的时间内证明了这个原因。挽救这一天的是他们对阿波罗十三号系统的了解,以及对什么能产生确切的突然故障发生的了解。

对企业关键问题的分析方法。

在这样的情况下,问题分析因两个因素而变得困难:次生效应和恐慌。在一个复杂的系统中,突然的故障通常会引起其他的偏差,这些偏差可能会掩盖原来的偏差。突发故障的冲击往往会引发恐慌,使仔细审查和利用事实变得更加困难。在任何情况下,有纪律和系统的调查都是困难的,但当以最高速度寻找原因时,纪律变得至关重要,而且不可能积累所有的数据,而这些数据在调查中是最佳的。

在美国宇航局的事件中,系统性方法的存在使一个团队能够作为一个整体一起工作,尽管他们与偏差相隔近25万英里。对于NASA休斯顿的工程师来说,这个原因是难以接受的。

下载案例研究