インシデントを解決するか、問題を解決するか。

IT組織の目標は、ユーザーとビジネスプロセスをサポートするために、最高品質のサービスとシステムを提供することです。しかし残念ながら、システムは(人間と同様に)完璧ではなく、時には故障することもあります。 このような事態が発生した場合、善意のITスタッフは、問題を迅速に解決してシステムを正常に戻し、そのシステムに依存しているユーザーが仕事を続けられるようにするために全力を尽くします。 ビジネスの継続性を確保することは、IT機能にとって非常に重要ですが、問題の再発を予測し、防止することも同様に重要です。

問題となるのは、この2つの依存関係にあるITSMプロセスが互いに衝突したときです(よくあることです)。このような場合、ITスタッフは、サービスを迅速に復旧させるか、問題を恒久的に解決するかのどちらかを選択しなければなりません。 この対立に対処するための一連のガイドラインを作成することで、スタッフの効果を高め、組織にとって適切なバランスを確保することができます。 ここでは、インシデント管理と問題管理のプロセスの矛盾を解消する際に考慮すべき6つの要素をご紹介します。

1.ビジネスインパクト - インシデントや問題はそれぞれ異なり、どこに優先順位を置くべきか、十分な情報に基づいた判断を下すには、現在および将来のビジネスへの影響を測定し、分類する客観的な手段を持つことが大きく影響します。 影響を受ける人の数、影響を受けるビジネスプロセスの重要性、システムやサービスが影響を受ける期間、顧客の認知度などの無形の影響をすべて考慮する必要があります。

2.リソースの利用 - 問題の予防だけでなく、アクティブなインシデントの解決にも、同じITスタッフや技術リソースが使われることが多い。 目標は、リソースが取り組んでいる活動から、組織にできるだけ多くの総合的な利益を得ることです。 このような制約のあるリソースにポートフォリオマネジメントの手法を適用することで、リソースを少数の優先度の高いアクティビティに集中させるか、多くのアクティビティに分散させてカバーするか、あるいはスキルや経験に基づいて選択的に配分することが最大の利益を生むかを判断することができます。

3.パン粉の破壊 - サーバーを再起動すればサービスは回復するかもしれませんが、IT部門が問題解決に必要とする情報が失われる可能性があります。 インシデントが発生したときに環境で何が起こっていたか、アクティブな依存関係、使用されているリソース、ユーザが何をしようとしていたか、システムがどのように動作していたかなど、症状やコンテキストデータがインシデントの解決時に失われてしまうことがよくあります。 インシデント管理の一環としてこれらのデータを収集するための明確な指示を提供することで、根本的な問題の根本原因を見つけるのが将来的に遅れるのを防ぐことができます。

4.再現性と影響 - インシデントは通常、独立して対処されますが、問題管理では、インシデントが繰り返し発生するリスクを考慮する必要があります。 インシデントの再発の頻度、期間、影響を評価することは、ITスタッフや意思決定者が状況をより総合的に見るのに役立ちます。点と点を結びつけて詳細に分析することで、インシデントの直接的な影響を軽減することが、インシデントの再発防止よりも優先されるべきかどうかを判断することができます。

5.再現性 - 問題によっては、インシデント発生時にシステムや環境をリアルタイムで分析しなければ診断できないものもあり、後からインシデントを再現することができない場合もあります。 このようなケースが疑われる場合には、問題管理とインシデント管理の活動を連携させ、インシデントが解決された時点でライブ診断ができるようにする必要があります。 これを効果的に行うには、明確な意思決定権、効果的なコミュニケーション、活動の調整が鍵となります。

6.影響を後回しにする - インシデントマネジメントの最も難しい判断の一つは、根本的な問題を診断するために現在のインシデントを長引かせることの影響を評価することと、現在の状況を解決しても、その影響が未知である将来に再発するリスクを高めることです。 ほとんどの企業では、事業活動のサイクルが非線形でありながら予測可能である。 例えば、真夜中には影響度が低く、四半期の最終週には財務目標達成のための最後の追い込みで影響度が高くなることがあります。 このようなサイクルを明確に理解することで、ITスタッフがインシデントを処理する際に、よりビジネスニーズに沿った判断を下すことができます。

組織の問題解決方法には、インシデント管理の一環として診断データを収集するためのプロセスステップと、問題を調査するための明確に定義された判断基準が含まれている必要があります。サービスを復旧させるべきか、問題を恒久的に解決すべきか、明確な正解はないことが多いですが、以下の6つの要素を考慮するとよいでしょう。

時には毒を選ばなければなりません。

Kepner-Tregoe社は、ITスタッフがユーザーとビジネスプロセスをよりよくサポートできるようにするためのツール、テクニック、スキル、プロセスを用いて、企業のITSMプロセスの洗練を支援する、問題解決の業界リーダーです。

関連

ブログ画像1
インシデントとトラブル、表裏一体の関係
ブログ画像1
ポストインシデントレビューのベストプラクティスがインシデントレスポンスを劇的に向上させる
ブログ画像1
インシデント&プロブレム・マネジメントのスーパースターになるには
ブログ画像1
重大インシデントの発生に備えて。コミュニケーションと効果的なアクション。助けて!どうすればいいの?

私たちは以下の専門家です:

お問い合わせ

お問い合わせ、ご意見、詳細確認はこちらから