联系我们

实现卓越服务意味着围绕故障展开计划

大多数现代公司对技术的依赖程度之高,导致了技术问题产生IT稳定性问题的巨大风险,并反过来挑战组织的功能能力。

确保快速有效的反应和拥有一个精心设计的重大事件管理程序是减轻这种风险的关键。

新闻中每周都会报道一些重大事件--黑客的安全漏洞、系统中断和客户数据的暴露。这些只是那些成为头条新闻的事件--每天都有无数的、更多的重大事件发生,这些事件影响到公司的内部运作、盈利能力以及商品和服务的流动,并使公司领导从他们推动公司议程的核心角色上转移注意力。

维度研究公司2016年对400多名商业和IT专业人士的调查发现,82%的受访者表示,商业应用停机对其公司的收入有重大影响。对大多数高管来说,风险暴露和对重大事件的反应是最重要的,因为他们看到他们的同行正在努力管理危机情况--知道他们的个人事业和公司的未来可能取决于他们在几个小时或几天内的表现。

成功地管理重大事件可以使公司迅速恢复正常运营,维护市场声誉并将财务影响降到最低。管理良好的事件甚至可以通过提供更深入的洞察力来提供持续改进的机会,并帮助公司继续加速实现其目标。如果一个事件没有得到成功的管理,那么持久的影响会导致公司的消亡。

重大事件的影响

大多数公司有足够的流程和资源在危机模式下短时间内(几小时到几天)运作。超过这个时期,员工的疲劳、问题的积压和关键控制机制的丧失会导致客户满意度迅速下降、合规性问题和调节方面的挑战,使完全恢复变得更加困难、昂贵和费时(如果完全恢复能够实现的话)。

除了直接的运营影响,对重大事件的管理会影响客户对公司及其产品的看法和长期信心。随着来自叛乱分子和新商业模式的竞争不断加剧,利润率不断缩小,获取新客户的成本不断增加,客户的保留和满意度对于确保收入的可持续性至关重要。客户了解技术问题的发生--他们也是技术消费者和用户,面临着与公司相同的风险。

与公司的内部运作一样,大多数客户在与企业互动过程中,以及在购买和使用产品和服务时,对短期中断有一定程度的容忍。然而,长时间的中断、沟通不畅以及未能及时恢复服务,会大大削弱客户的容忍度和商誉--可能会对关系和未来的业务机会造成永久性损害。

内部运营影响和客户声誉问题最终都会破坏公司当前和未来的财务业绩--随着事件的持续发生,附带损害也会增加。反复出现的问题也加剧了重大事件的影响--如果发生过一次,那么就可以原谅;如果再次发生,那么就可能会有麻烦了。高管们意识到了这一点,并开始花费越来越多的时间来发展他们对业务中技术依赖性的内在风险的理解,制定缓解策略,并为可能发生的影响业务的重大事件做好组织准备。

......如果发生一次,那么就可以原谅;如果再发生一次,那么就可能会有麻烦了。

事件管理与重大事件管理--为什么公司需要一个不同的、独立的方法

大多数公司都有事件管理流程,以解决日常的轻微到中等程度的干扰。这些流程是由久经考验的客户服务方法和/或基于标准的IT服务管理实践(如ITIL中的那些)建立的。事件管理流程通常可以有效地解决公司面临的与IT系统相关的大量相对低影响的事件和服务请求。然而,重大事件与较小的日常事件不同,需要一个不同的单独方法。

影响和频率

重大或高严重性事件(顾名思义)是指那些对组织有巨大和重大影响的事件。这些事件(希望)不会经常发生,但一旦发生,企业的整个功能都可能受到影响。一个典型的财富500强公司在一个季度内可能会遇到少数几个重大事件,而每天有数百个(或在某些情况下,数千个)正常事件。一个正常的事件通常只影响几个用户,响应和解决的服务水平协议往往被延长,作为保持低运营成本的手段。对于重大事件,影响的成本远远超过了解决的成本,关键的成功因素是响应时间和对问题的响应质量。

技能和参与人员

接受过有限培训和技术技能的服务台人员往往是那些必须处理日常事件管理职能的人--他们认识到大多数事件在性质上是常规和重复的,可以通过基本诊断、二元决策/知识树和脚本响应来有效解决。更困难的问题会被转到具有技术专长的第二和第三层升级团队,但目标仍然是应用技术含量最低(和最便宜)的资源来解决事件。重大事件需要一种不同的资源配置方法。时间是最重要的;因此,目标是应用能够最快解决事件的人力资源,从而避免长时间的业务影响。这些资源通常是训练有素(和高薪)的主题专家,具有丰富的经验和深厚的技术故障排除能力。

流程

过去几年的趋势是,事件管理流程转向自助服务、自动化和与支持人员的异步接触(即与全球呼叫中心的工作人员进行电子邮件互动)。这种 "偏转方法 "旨在优化事件管理流程的可扩展性,并减少人与人之间的互动,但其代价是增加解决更复杂事件的时间。重大事件流程必须以几乎完全相反的方式进行优化,解决方案的有效性和解决时间是最关键的,而不强调资源成本和自动化的考虑。这些流程必须如何优化,使得一个流程很难被认为是另一个流程的子集。除了流程混乱外,资源冲突和不同的优先级也会导致两个流程表现不佳。

为了使一个重要的事件管理过程有效,组织应该考虑3个主要的阶段,这些阶段必须在短期内反复管理,因为新的信息是可用的:分流、诊断和决策。分流有助于评估影响和收集所有可用的数据,以明确问题并了解解决所需的资源(在与其他50人一起跳上桥电话之前!)。诊断对于分析症状(和可能的原因,如有必要)以及填补信息空白以确定最有效的恢复行动至关重要。最后,决策与理解和评估选项有关,同时保持风险的持续可见性,当然,还要有效地执行。

通讯

事故管理沟通通常只关注报告问题的用户和解决问题的人员或团队之间的直接互动。升级,因此,让管理层了解事件被视为 "失败 "或初始过程的例外,并给企业增加不必要的成本。

重大事件的不同之处在于,积极而广泛的利益相关者沟通不仅有助于准确评估影响,而且有助于管理期望值,并向利益相关者灌输事件已得到控制的信心。在许多重大事件中,与技术问题和相关症状相比,利益相关者沟通所产生的看法在决定整体影响方面的作用更大。有效的重大事件沟通必须针对4个不同的利益相关者群体。

  1. 事件直接影响其活动的受影响用户群体
  2. 间接或潜在受影响的利益相关者,其信心可能会受到事件管理的影响
  3. 可能需要参与事件诊断和解决的内部团队和中小企业(这也可以包括供应商代表)
  4. 支持和IT管理

管理观念

重大事件往往会引起情绪反应和人群动态,可能包括各种影响因素,而正常事件通常只涉及一个或几个用户,他们的看法通常与事件本身直接相关。在重大事件中,不仅影响导致信息通过口耳相传迅速传播,而且闲置的员工将猜测、推断、对事件的不知所云的解释、偏见和对事件管理方式的旁敲侧击引入沟通组合中也是很常见的。

控制通信流和管理认知对重大事件管理至关重要。如果重大事件管理团队的官方信息不清晰、不及时,不能提供利益相关者所期望的信息,那么就有可能出现错误信息压倒官方信息的情况,导致更大的混乱和负面的客户体验。

行政人员的参与和决策

除了整体的技术和性能影响外,重大事件和解决它们所需的活动往往跨越业务职能的界限,导致决策权问题的出现。重大事件几乎总是需要某种行政人员的参与,以协助进行影响分析和沟通,并作出必要的关键决定,以消除路障,从而使问题得以解决。这是一个高风险的环境,管理层必须权衡某些行动的预期结果和其风险。这不仅需要明确的所有权,还需要明确的、可获得的数据,即关于当前事件的已知和未知的数据。一个重大事件的管理流程应该包括跨职能的决策指南,以避免在正在发生的重大事件中出现延误和混乱。

缓解症状可能是一个挑战;解决原因可能更加困难。

重大事件管理的挑战并没有因为服务的恢复而结束。与正常的事件管理流程一样,"现场 "重大事件的主要目标是减轻影响并采取纠正措施,使业务恢复正常运营。了解根本原因并实施行动以防止问题再次发生,属于问题管理流程的范畴。随着重大事件对业务影响的加剧,高管们通常会积极跟进,以确保查明根本原因并及时实施预防措施。

在许多情况下,行政人员对问题管理的期望是不现实的,挑战有两个方面。

  1. 摆脱事件的症状,确定真正的根源。在管理活跃的重大事件的混乱中,关键的诊断信息往往丢失或被破坏,阻碍了根本原因的识别。
  2. 确保对预防性行动的支持和优先次序,并在业务恢复正常运作后实施修复。当业务受到积极影响时,往往有一种 "做什么都要做 "的态度,一旦服务恢复,这种态度很快就会消失。

为了避免这两个陷阱,需要一个高度整合的、主要的事件和问题管理过程,在这个过程中,关键的 "原因信息 "被积极地保护和记录,服务的改进也在继续。只有这样,才能在较长的时间内实现真正的IT稳定性。

合规与减轻影响

对数据和技术的持续滥用,使全球各地的政府和监管机构对公司提出了一系列广泛的合规要求,以确保某些类型的技术和数据的安全、忠实和适当管理。为了保持和验证对这些法规的遵守,大多数公司已经实施了一系列的流程和系统控制,以确保个人的行为与公司的义务相一致。

在重大事件中,这些控制措施可能变得繁琐,并抑制了对情况的有效诊断和解决。

当这种情况发生时,公司领导和支持人员往往面临着 "在紧急情况下打破玻璃 "的选择--绕过控制机制并冒着不符合法规的风险,或者维持控制机制并延长事件的影响。

这就相当于急诊室医生在面临拯救病人和拯救肢体时必须做出的选择。

根据情况和被绕过的控制的性质,这一决定可能会产生监管后果,并影响公司的未来业绩。这就相当于急诊室医生在面临拯救病人和拯救肢体时必须做出的选择。一个公司的重大事件管理程序必须考虑到这一点,并提供一个明确的政策和例外程序,如果必须考虑绕过这些程序的话。在大多数情况下,监管机构会接受有据可查的例外情况,作为正常控制机制的充分替代,所以提前计划是至关重要的。

大多数重大事件都是暂时性的,公司将(希望)能够恢复正常运营,这包括合规的流程和系统控制。除了绕过合规控制的直接影响外,公司必须考虑在绕过控制机制一段时间后重新建立控制机制的挑战和影响。在事件解决后,这可能需要一些后续活动,而这些活动很可能是昂贵而耗时的。在做出 "打破玻璃 "的决定时,必须考虑这些问题。

不要等到为时已晚!

公司领导无法控制重大事件何时发生,但他们可以控制公司如何管理和应对重大事件。全面的卓越服务,包括一个有效的、被充分理解的重大事件管理流程,是快速响应事件、解决直接影响、维护公司声誉、降低运营和客户风险的关键。

重大事件流程应该与管理正常的日常事件的流程分开,除了周到和及时的利益相关者沟通之外,还应该对速度和有效解决进行优化。在活跃的事件中,支持人员和管理人员应该依靠重大事件管理来帮助他们控制端到端的流程,并指导他们的活动完成。

  • 了解事件和症状
  • 减轻影响和管理风险
  • 确保决策是可见的,并以数据为导向
  • 评估可能的原因(如有必要)。
  • 管理观念和期望
  • 恢复正常

对许多IT和支持主管来说,管理好重大事件可能不像新的变革举措那样引人注目,但管理不好肯定会造成灾难性后果。作为业界领先的问题解决公司,60多年来,Kepner-Tregoe一直与客户合作,提高他们管理运营和IT领域重大事件的能力,并帮助他们实现卓越服务。

关于 Christoph Goldenstern

战略与卓越服务副总裁

克里斯托夫是一位拥有20多年经验的咨询领导者,在战略、运营和服务改进领域帮助企业。作为KT执行领导团队的成员和全球战略和卓越服务副总裁,他负责KT的业务战略以及IT服务管理和技术支持的解决方案。

我们努力创造真正有用且独特的内容。

注册或登录您的帐户以阅读整篇文章。

相关的

过程知识和内容知识。哪个更重要?

左移?不,为服务支持的成功而“下移”

我们专注于:

联系我们

如需咨询、了解详情,或提出建议