プレッシャーの中で正しく考えること。トップに立つための4つのドライバー

この5分間で2回目となるブリッジコールでの技術的な議論を遮って、「いつサービスを再開するんだ!」と上級副社長が再び叫んだ。

「サービスの再起動には40分かかります」とSenior Technical Leadは答えます。

"10回で取り返さなければならない!"

圧迫されるサービスマネジメント

Service Management is always under pressure. During business damaging incidents, when critical systems go down and affect the minute-to-minute revenue streams — even briefly — financial losses can be huge.

このような大きな事件以外にも、他の部分でもプレッシャーがかかってきます。

  • 環境の複雑化
  • サービス対象となる製品の相互依存性
  • 良いデータと悪いデータの両方を入手できるようになった
  • 経済的プレッシャーの中で、より少ないことがより多くのことを意味します。
  • お客様の期待。100%のアップタイム - なぜそうしないのか?
  • 個人のモチベーション
  • ビジネスの競争力を高めるための一貫性と品質の必要性

There is a tendency to put more technology in place and/or have people attend as much technical product training as possible to keep up to date. The latter seems to be the key driver for certainty and confidence in a job and is often the first action that management reaches for — more technical training. Unfortunately, technical training is only valid for a certain domain and for a short period of time. Is it possible, any longer, to keep up with the speed of technology changes? It is absolutely and clearly understood that someone in a support function needs to understand the technology, and be on hand when there is an incident, but there are other things that are essential in order to maximise effectiveness.

これらの圧力にどう対応するか。

私たちは、分析と経験から、原因に飛びつき、既存のデータベースから情報を取り出し、修正プログラムを適用するという通常の初動対応が、多くの場合、正しい行動であることを知っています。技術者は、自分の知識と経験を頼りに単純な問題を解決します。しかし、これに失敗した場合、同じ行動をとること、つまり「速い思考」に固執することは、コストと評判を落とすことになります。そのような場合には、証拠を集めて冷静にデータを分析する「スローシンキング」が必要になります。

プレッシャーの下での良識と思慮深い対応を妨げる要因として、生物学と心理学という2つの重要な要素があります。

トップを目指すための4つのドライバー

外部からの圧力を考慮すると、Kepner-Tregoe社のコンサルタントが研究して定義した、効果的なパフォーマンスのための4つのキードライバーがあります。

4人のドライバー

Many people believe that coping with emergency situations is a matter of in-built character, somehow genetically determined. But when we look at firemen and emergency rescue teams, they consistently approach an incident with a rehearsed and well-defined strategy.

生物学的な圧力を取り除き、質の高い結果を得るために、落ち着いた劇場と職場を提供する4つの側面があります。

1.予測可能なパフォーマンス:脳のハードウェアを操作するために適切なソフトウェアをインストールする

危機に直面したとき、人は確実性を求めます。脳に保存されている内部データベースに頼り、直観に従う傾向があります。これは、慣れ親しんだ状況では推奨されますが、新しい問題やかなり新しい問題に直面したときには推奨されません[1]。私たちは、パターン認識と感情的なタギングに基づいて意思決定を行う傾向があります[2]。

パターン認識とは、新しい状況に直面したときに、それまでの経験や判断に基づいて仮定することです。つまり、結論を急ぐのです。

感情のタグ付けとは、記憶に保存された思考や経験に感情的な情報が付着するプロセスのことです。私たちは、何をすべきかについて、事実を年表化するのではなく、経験によって偏ってしまう可能性があります。

予測可能性は、使用するフレームワークによって異なります。サポート組織を改善し、エンジニアによるサポートの質と一貫性を高めるためには、個々のフレームワークを最適化する必要があります。一人一人が同じ「頭脳操作ソフト」を使い、同じ問題解決言語を話す必要があるのです。同じソフトウェアを使うことで、迅速な引き継ぎや効率的な現状把握が可能になります。また、同じフレームワークを使用することで、データ品質の信頼性が確立され、エンジニアが前のエンジニアの仕事をやり直すことを避けることができます。

予測可能なパフォーマンス

2.フィードバック質の高いインプットを確保するためのメンタリングシステムの導入

インシデントマネジメントのパフォーマンスの一つに、事後レビュー(メジャーインシデントレポートとも呼ばれる)から得られるフィードバックがあります。この報告書では、誰が誰に電話したかに焦点が当てられており、インシデントがどのように進行したか、質の高いデータが適切なタイミングで取得されたかについては十分に説明されていないことがよくあります。

すべてのインシデントには自然なプロセスがあり、試行錯誤してさらに危険な影響を与えるようなことがあってはなりません。最初のステップは常に、問題とその影響と結果を誰にでも見えるように記録し、調査と解決のための行動を記録することです。リアルタイムコーチングは、インシデントのライフサイクルにおけるトランジションポイント(上図の矢印)で、エンジニアにライブで瞬間ごとにコーチングを行います。データの品質について行われるインスタントレビューは、時間やスピードにはあまり注意を払わず、すべてのステップで品質を確認します。これにより、インシデント処理の次の段階では、質の高いデータが得られ、チームを正しい結論に導くことができます。

失敗したときに、その責任者を指差すことを「フィードバック」と呼ぶことがありますが、これは屈辱的でやる気を失わせるものです。リアルタイムにフィードバックすることで、エンジニアは仕事の「OS」を固めることができ、毎回、より効果的に新しい行動をとることができるようになります。プロセスの各ステップを理解することで、自信を持って迅速に行動できるようになります。"私には計画があり、問題解決プロセスの次の論理的ステップを知っていて、それを実行する方法も知っています!"

フィードバック

3.インフラストラクチャー。蓄積された情報を瞬時に取り出せるようにする

その解決策として、一般的なチケットシステムを考えるかもしれません。しかし、その多くは重要なポイントに対応しておらず、インシデントや問題の可視化とは異なり、文書化されたケースをどこに保存するか、あるいはお客様がサービスを契約しているかどうかに焦点を当てています。例えば、ほとんどのヘルプデスクソフトウェアソリューションには、"正確な時間 "を入力する欄がありません。"機器やサービスが正常に動作していることが最後にわかったのはいつですか?"システムに登録されている現在の日付は、チケットが発行された日付になっています。もし、正確な時間(その問題が最初に見られたと分かった時)をシステムに入れると、どんな影響があるでしょうか?

現在のほとんどのシステムでは、データの時系列的なカスケードを表示しており、何が起こっているのか、どの情報が不足しているのかを即座に理解することができません。プロセスを導入し、情報収集のための良質なテンプレートを使用することで、エンジニアリングチームはインシデントに関する可視性を向上させることができます[3]。彼らは、もはやクラウドの霧の中で仕事をしているわけではありません(クラウド対応ソフトウェアを使って仕事をしているかもしれませんが)。

4.チャネル戦略の確実性を示す

自分のシステムのために叫んでいる人は、答えを得る必要があります。しかし、その人は実際に何を求めているのでしょうか?1時間ごとに同じテキストで繰り返される標準的なテキストメッセージは、実行中のアクションについてビジネスに自信を与えません。もしサポート組織が主要なステークホルダーにトラブルシューティングプロセスのどこにいるのかという質の高い情報を提供できれば、彼らの感情状態ははるかにリラックスしたものになり、明確な思考が促進されます。エンジニアは合意されたフレームワークに頼ることができ、彼は戦略を持って仕事をすることができます。「もし解決策がわかっているのであれば、すぐに実行に移します。まず必要なのは、情報を集めて、チームが出した症状や観察結果を確認し、事実関係を把握することです」。

経営陣が期待しているのは、このテキストメッセージの雲の中にある、よく管理されたインシデントの可視性なのです。問題の説明に対する進捗状況はどうか?いくつの可能性のある原因を評価したか?繰り返しになりますが、フレームワークとステージゲートがあるからこそ、現在進行中の活動を報告することができます。

携帯電話会社のネットワークオペレーションでP1インシデントが発生したとき、KTは現場にいた。インシデントマネージャーが主導権を握っていたが、通話開始からわずか15分後、何もできない状態で観察された。"何が起きているんだ?""フレッドはP1を担当しています、彼は家にいます。""何が起こっているんだ?""わからない。終わったら教えてくれるだろう。"25分後、フレッドから電話があった。「見てみたけど、僕がサポートしているものとは絶対に関係ないよ」。 コントロール?ロスト。自信は?ありません。

この4つのドライバーによって、組織は問題を恒久的に解決するための落ち着いた劇場を作ることができます。この劇場では、期待値が設定され、明確な思考を導くためのフレームワークが用意され、必要に応じてサポートが用意されています。

決断力のある行動の前には、必ず明確な思考があります。

リファレンス

[1]カーネマン、D. 2011年「Thinking fast and slow」。ペンギングループ

[2] Campbell, A. Whitehead, J., Finkelstein, S. 2009."Why Good Leaders Make Bad Decisions."ハーバード・ビジネス・レビュー.2月

[3] Gawane, A. 2009, "The Checklist Manifesto, How To Get Things Right".メトロポリタンブックス

関連

すべてが複雑になりすぎている

プロセス・ナレッジとコンテンツ・ナレッジ。どちらがより重要か?

私たちは以下の専門家です:

お問い合わせ

お問い合わせ、ご意見、詳細確認はこちらから