プロアクティブ・トラブル・マネジメントで消火活動に終止符を打つ

By Tim Roberts, Christoph Goldenstern

サービスを提供する組織であれ、オペレーションを行う組織であれ、重大なインシデントが最初に処理された後に、そのインシデントをレビューするシステムがあるのが一般的です。これは、ポスト・インシデント・レビュー(PIR)またはアフター・アクション・レビュー(製造環境でよく使われる用語)と呼ばれることがあります。組織は複数のアプローチを用いることができ、異なる組織はお互いに異なる方法論を使っているかもしれません。

トラブル・マネジメントには、リアクティブ(反応型)なものとプロアクティブ(積極型)なものがある

リアクティブなトラブル・マネジメントは、既知のインシデントの原因を発見し排除することを目的としています。それに対し、プロアクティブなトラブル・マネジメントは、より全体的な視点から、インシデントの先を見据え、同様のインシデントを引き起こし続ける(システム的な)根本原因を特定し排除することで、将来のインシデント発生を防止することを目的としています。

プロアクティブなトラブル・マネジメントは、インシデントとその引き金となった原因、そしてインシデントを可能にした幅広い状況を把握し、すべての要因についてより深く分析することができます。この分析が完了した後、重大な悪影響を与えることが分かっている特定のインシデントを軽減するための予防措置を慎重に配置することが重要になります。

あなたの組織を最も苦しめる問題を見直すと、それらは通常、回避策や「パッチ」で短期的に対処されるものの、完全に解決されることのない、繰り返されるインシデントであることが多いようです。この場合、チームは「構造的な原因」にまで踏み込むことはなく、したがって長期的に状況を軽減するための対策も講じられません。

プロアクティブなトラブル・マネジメントの利点は、このようなシステム的に繰り返されるインシデントを排除することに集中できることです。この方法論は、一般的に適用されます。

  • 重大な障害・インシデントの事後検証時
  • 重大インシデントの解決最中
  • 継続的サービス改善プログラムの一環として

継続的サービス改善に積極的に取り組んでいる企業は、このプロセスによって、ビジネス・プロセスとテクノロジーの両方を改善するためのいくつかの機会を見出すことができることに気づくでしょう。重大な障害・インシデントを経験した場合、主要な利害関係者が参加する事後評価を実施することを強くお勧めします。

インシデント・マッピングとは?

ケプナー・トリゴーでは、プロアクティブなトラブル・マネジメントは、「インシデント・マッピング」と呼ばれるコア・ツールを中心に構築されています。これは、インシデントを可視化し、「イベント」をマッピングする手段です。

図1の左側は、重大インシデントを理解するためのライブ・ミーティングを促進するために使用される典型的なインシデント・レビュー文書のスナップ・ショットです。この文書には、インシデントの全期間にわたる観察、行動、コミュニケーションを記録したテキストが5、6ページにわたってぎっしりと詰まっていることも珍しくありません。その結果、詳細な情報が錯綜し、関連するものと関連しないもの、重要なものと重要でないものを切り分けるのが難しくなります。

図1の右側には、インシデントを説明する5ページの物語全体が、一般にインシデント・マップと呼ばれるビジュアルなフローチャートで表現されています。

このマップは、インシデントを管理する側にとって、よりシンプルで実用的であることは容易に理解できるはずです。また、詳細な文書を作成する時間や余裕のない上級管理職に対して、インシデントを報告する方法としても、はるかに優れています。

効果的に行われた場合、この可視化は、インシデントを体系的に記述するプロセスの産物と言えましょう。

  • 主問題” とその影響
  • すべての ”因果関係の連鎖” (そのきっかけとなった)
  • 状況” (なぜその影響があったのか、あるいはそれほどひどくなかったのか説明)
  • ”破られた障” (因果関係を遮断できたかもしれない対策と、それがうまくいかなかった理由)
  • ”アクション” (これまでに実施された対策)
  • ”アクション” (問題の再発を防止するために提案、選択、実施される対策)
  • ”リスクを軽減するためのアクション” (提案された対策が新たに別のトラブルを起こさないようにするための対策)

図2は、インシデント・マッピングのプロセスを可視化したものです。インシデントの説明から始まり、因果関係の特定、再発防止に向けた提言の作成と保護に至るまで、段階的なプロセスとなっています。このプロセスでは、準備が重要なステップとなります(ステップ0として示されます)。このステップの重要な要素は、適切な主問題の専門知識を持つ個人が貢献できるようにすることです。

この一連の流れは、ケプナー・トリゴー(右図参照)と仕事をしたことがある人、あるいはその方法論について読んだことがある人には馴染みのあるツールと結びつけることができます。インシデント・マッピングは、何よりも、非常に視覚的な状況判断の一つの形態です。必要であれば、他の問題解決や意思決定のツールもこの方法論やフレームワークの文脈で使用することができます。

インシデント・マッッピングの進め方

この分析手法(インシデント・マッピング)は、様々な業界のIT部門や運用部門で広く活用されています。この分析手法には、より迅速かつ明確で生産性の高いポスト・インシデント・レビュー(PIR)を実現し、その結果、組織に大きなインパクトを与えることができるなど、さまざまな利点があります。PIRでは、10~12人がテーブルを囲み、通常1~2時間程度話し合います。彼らは皆、何らかの形で元のインシデントに関与している可能性があり、何が起こったのか、なぜそれが起こったのか、どのような対策がとられたのか、再発防止のために何ができるのかを検討します。

このレビューの前に、既存のドキュメントをレビューする必要があります。このドキュメントには、インシデントへの対策や修復記録が含まれています。このデータは通常、サポート組織内の誰かによって記録(多くの場合、インシデントに関与したインシデント・マネージャまたはトラブル・マネージャ)されています。

従来の文字が多いインシデント・レビューでは、問題がどのように展開したかを時系列で語ることになりがちでした。ファシリテーターは、この文書に一行ずつ目を通し、時系列と記述の一致を確認する必要があります。一方、インシデント・マッピングは、情報を以下のように分解し、セッションをダイナミックに進行する方法を提供します。

  • 因果関係
  • トラブルを未然に防ぐために必要な項目
  • 厳しさを左右する状況
  • 今後のすべてのアクションの責任者

図3に示すマッピング・プロセスは、詳細や事象を表す一連の図形と色、そして互いの関係を示す矢印を配置してインシデントの道筋を示すため、テキスト表現よりも簡潔であると多くの人が感じているようです。このプレゼンテーションは、ステップ・バイ・ステップのビジュアル化であり、文字で説明するよりも迅速なコンセンサスを得られる傾向があります。

このマップを使用することで、サポート・チームがインシデントの発生を認識するきっかけとなった「一次イベント」から、根本的な原因、そして、これらの状況のつながりを断ち切るための障壁、システム、対策までを特定することができます。そこからチームは、より深い分析や、未知の原因の究明、特定のアクションを選択するための意思決定に移行します。

最大の問題となるのは、回避策を講じても完全には解決しない、繰り返し発生する問題です。

組織は、積極的なトラブル・マネジメントとインシデント・マッピングを、インシデント発生後や事後レビュー、場合によっては進行中のインシデントの管理に取り入れ始めています。たとえば、イギリスのある大規模で複雑な政府機関では、ITサービス組織内で問題解決を指導・促進するKT認定プログラム・リーダーが、ホワイトボード上にビジュアルなマップを作成して、インシデントの分析を記録し、フォローアップ・アクションを割り振っています。個人は常に、選択した行動を実行に移す責任を負っています。このシンプルなインシデント・マップは、経営陣とのコミュニケーションの基礎となり、今ではインシデントを表す際に経営陣が期待する形式となっています。

このマッピング手法は、インシデントの前に行われるプロアクティブなトラブル・マネジメントの一種である「Pre-Mortem」分析で使用されることが多くなっています。大きな変更を行おうとしているとき、関係者は 「この変更を行うと、何がうまくいかなくなるのか?」と自問自答します。Pre-Mortemインシデント・マッピングは、既成概念にとらわれない創造的な思考を多く含みます。このようなブレーンストーミングでは、かなり大きなマップが作成されることもありますが、フォーマット化することで、潜在的なインシデントの防止や軽減に利用できる分析のための構造を提供することができます。

架け橋となる手法

インシデント・マッピングは、緻密で詳細な文書を作成する時間や許容範囲をほとんど持たない上級管理者に、インシデントを報告するための、はるかに優れた方法です。

インシデント・マッピングは、インシデントの永久的な記録として機能します。実際に発生したインシデントの管理中に作成された場合、その時点で取られた行動を記録し、追加の行動が取られ障壁が設置されるたびに数回更新されることがあります。これは、インシデント後のレビューの結論に至るまで続くことがあります。インシデント・マッピングは、インシデント・マネジメント・チームが根本原因と解決策に到達するまでにたどった道のりを誰でも理解できるように、人々の思考の監査として機能します。

形や色の使い方は、その場にいる全員が、それぞれの形が何を表しているのかに合意すれば、特定の慣習に従う必要はありません。この方法論は特定の技術に依存するものではありませんが、インシデント・マッピングを容易にするために設計されたソフトウェアを使用することで、次のような大きな付加価値を得ることができます。

例えば、マイクロソフト社の Visio® のようなフローチャート・ツールや、図 4 に示す ケプナー・トリゴーの方法論に沿ったソフトウェア・ツールである CauselinkTM があります。

ダイナミックなソフトウェア・ツールを使用することで、次のレベルの原因究明に役立てることができます。

  • リアルタイムにファシリテーションを行うための支援
  • エビデンス、メモ、タスク、ソリューションなどのデータ要素をそれぞれの原因に関連付けることができる知識データベースの構築と活用
  • レポーティング、アクション・トラッキング、ワークフロー・トラッキング、検索の機能追加

これは、コンプライアンスを重視し、調査のための文書や監査履歴を提供することが継続的に求められている業界や組織に特に重要です。

インシデント・マッピングは、インシデントに関わったかどうかにかかわらず、他の人が簡単に消化できるように、インシデントの重要な要素を抽出することを可能にします。因果関係の連鎖を視覚的に捉えることで、効果的な表現と意味づけのための一連の法則性を提供します。

インシデント・マッピングをマスターすれば、トラブルを事後的に管理することから、継続的に改善する考え方へと組織を移行させるための、効果的な橋渡し役になることができます。

 

ケプナー・トリゴー シニア・コンサルタント Tim Roberts
彼は、根本原因分析、インシデント・マッピング、プロジェクト・マネジメントなど、継続的改善を支援する国際的なプロジェクトを主導してきました。また、取締役会レベルでグローバルな新戦略の開発を促進し、上級管理職とともにグローバルな実装を設計・調整した経験もあります。特に、ITサポートが重要な役割を果たす民間企業や公的機関のクライアントを中心に、ITサービス分野に従事しています。

ケプナー・トリゴー VP イノベーション&サービス・エクセレンス Christoph Goldenstern

彼は、20年以上にわたり、戦略、業務、サービス改善の分野で組織を支援してきたコンサルティング・リーダーです。ケプナー・トリゴーのエグゼクティブ・リーダーシップ・チームのメンバーであり、戦略およびサービス・エクセレンスのグローバルVPとして、ケプナー・トリゴーのビジネス戦略およびITサービス・マネジメントとテクニカル・サポートのためのソリューションに責任を負っています。

Tim Roberts (troberts@kepner-tregoe.com) は英国に、Christoph Goldenstern (cgoldenstern@kepner-tregoe.com) は米国にあるケプナー・トリゴーの本社にいます。これらのプロセスがあなたのチームにどのように適合するか、もっと知るために、彼らに連絡を取ってみてください。

関連

ITIL環境におけるトラブル・マネジメントの質の測定

オンザエッジとインコントロール

私たちは以下の専門家です:

お問い合わせ

お問い合わせ、ご意見、詳細確認はこちらから