| ITSM 化解四个难题
IT 服务管理( ITSM, IT Service Management )是一种以服务为中心、以流程为基础、以客户满意和服务品质为核心的管理体系,它以 IT 基础架构库( ITIL, IT Infrastructure Library )为基础,具有通用性、客观性和实用性的 IT 管理方法,能让 IT 资源发挥最大效能,并协助企业 IT 部门由传统的操作导向升级为服务导向。
伴随着用户信息化建设规模不断扩大, IT 系统日趋复杂, IT 对业务支撑的作用越来越大,也使得用户 IT 管理日趋复杂,系统维护要求越来越高。 IT 服务管理作为 IT 管理的新的理论、方法和工具,正在发挥着越来越重要的作用。
用户信息中心面临的运维挑战
信息中心是负责维护用户的网络和系统环境的部门, 需要为众多关系到核心应用系统提供安全 、稳定、可靠的运行环境。其维护管理工作涵盖了网络设备、服务器、线路、数据库、存储、安全等种类繁多、数量庞大、结构复杂的 IT 软硬件基础设施。这些基础设施来自于多年来大大小小的项目,资源信息分散、记录不完整,给运行维护工作带来了不便。
除了高可用性和高性能服务要求的挑战外,对人员和流程的管理也是一个主要难题。目前用户信息中心的维护人员和管理人员人数较少, 多数人员都是身兼数职, 如何在有限的资源配置情况下提高工作效率,完成工作目标是需要考虑的实际问题。
另外,信息中心面向的客户多数是内部的业务单位,传统的 IT 管理模式使他们在请求服务过程中习惯于 “ 找熟人,找领导 ” 解决问题,不能很好地遵循设定的 IT 服务流程,因此 IT 管理流程比较混乱无序。
面对用户信息中心的运维管理挑战,采用IT服务管理( ITSM )方法,不仅可以清晰地了解到这些结构复杂的 IT 软硬件基础设施的数量、相互关联关系,还可以在如何管理这些 IT 软硬件基础设施方面,提供标准的、高效的服务流程,从而提高信息中心的服务质量,使 IT 服务有效支持机关政务的开展,提高客户满意度。具体来说,重点解决了以下四个问题:
提升 IT 监控能力
对 IT 服务环境的监控,是 IT 服务管理的基础。为了保障服务的持续可用,系统维护人员必须及时获得 IT 服务环境的变化信息,以便在系统性能下降或故障发生时能够做出快速反应。
在信息中心原有的监控系统中,系统环境虽然已经被置于监控之下,但大量监控事件的报送常常使系统维护人员无所适从,每天疲于应付大量的无用信息,监控效率很低。而且重大事件如关键设备出现系统故障,却没有快速通告的渠道,往往在客户发现问题后,才能够对故障进行处理,给服务质量的保证带来了很大的困难。
根据对这些情况的分析,首先对原有监控系统进行了重新定制,在分析 IT 服务系统中各环节的重要性后,对监控事件定制了过滤策略和关联规则,取消了原有的 “ 所有系统消息全部报送系统操作员 ” 的策略,将系统事件消息进行充分过滤和有效关联,识别故障源头信息,在系统前台仅显示需要及时处理的少数重要消息。
同时对这些消息分组,将它们提供给不同的系统维护人员和管理人员。对于重大故障事件,还可以利用多功能报警机以短信、 E-mail 、 Windows Messager 等多种方式在第一时间通知相关人员。
深化监控系统为进一步的 IT 服务管理改进打下了良好的基础,在不断的知识积累和方法改进中,达到从被动响应到主动式管理的升华。
重视突发事件管理
对于信息中心来说,最需要的两个管理流程是突发事件( Incident Management )管理和配置管理( Configuration Management ),但实现这两个流程并非易事,主要问题在于:
·信息中心面对的客户多是内部用户,长期的工作习惯使他们在服务请求过程中习惯 “ 找熟人、找领导 ” 处理问题。
·虽然在角色划分上定义了一线 / 二线服务工程师,由于人员、管理体制等各方面的限制,沿用了以前的管理模式,角色职责主要还是集中在服务提供的技术处理上,缺乏过程管理的角色,如事件经理、配置经理。
·人员变动频繁,缺乏培训,使服务人员在流程的操作、记录过程中经常出现失误。
针对这些问题,在提供流程设计的同时,提供一系列的辅助管理方法,来减少甚至消除这些问题对服务带来的负面影响。
其中,实施难点主要还是在突发事件管理流程上,采用了以下方法来实现:
首先建立服务台,向客户提供统一的服务接口,公示信息中心的服务目录和客户服务呼叫流程,对于重点客户进行服务呼叫的推广培训,
其次,建立突发事件流程,流程主要面向故障处理、服务请求和信息咨询,流程设计中不仅考虑到服务事件的升级,还为多人协同工作时设计了相应的协作方法和过程。在实现主要服务流程外,还结合监控系统的消息通知,实现了服务流程的自动传递。
对于一些受行政或业务影响不能进入相应服务流程的事件,只能由特殊人员进行处理。由接收人到服务台注册,同时为客户进行业务处理,事件经理对该事件的处理进行实时监控(直属领导),既保证了业务的快速有效处理,又保证了服务满足特定的质量要求(如涉密、紧急等)。
统一资源管理
配置管理的目标是为 IT 服务管理提供精确的系统基础结构信息。
建议用户信息中心选用业界使用较为成熟的 IT 服务管理工具( HP OpenView ServiceDesk 、 IBM TIVOLI 、 CA Unicenter 、 BMC Remedy ) ,建立了完整的配置管理数据库,记录对象包括信息中心负责管辖的软硬件基础设施和机房环境设施( UPS 、机柜)等,重点突出设备信息之间,以及与管理信息之间的关联性,这些管理信息包括组织信息、人员信息,以及设备位置信息等。
通过建立集中的管理数据库和加强配置项间的关联,在需要查询资源信息时,不用再像以前那样,需要查找分散的文件资料,如技术手册,系统设计文档等,只需通过统一的资源管理页面,就可对需要的信息进行关联查询。
有了好的工具,还需要有一种好的制度来保证数据的准确性。为此,我们建立了配置管理流程,分配了配置管理职责,以流程和制度的方式保证了在操作过程中的授权、审计、跟踪、记录,以保持资产信息记录与实际环境的一致性。
量化 IT 服务质量
IT 服务管理的持续改进和不断完善,必须建立在对历史数据进行全面综合的统计和分析之上。信息中心在经过多年运维管理和知识积累后,记录了大量宝贵的系统数据和管理数据,通过手工的方式进行统计分析费时费力,而且在动态增长的数据环境中,很难得到及时的分析结果,大量的数据也使今后的统计分析工作显得力不从心。
而通过 IT 服务管理实现了数据的自动化统计和量化分析。其具体实现过程是:首先通过各种自动化监控工具把搜集到的监控信息,如对网络、主机、应用系统等的监控信息,汇总到集中监控平台上;然后在 IT 服务智能报表系统的基础上,结合用户业务特点,订制出合适的报表模式;最后,定期对搜集到的数据进行统计分析。
通过对系统信息的统计和分析,能够及时了解到指定时间段内 IT 服务系统环境的运行状况,存在问题及潜在问题,辅助用户对于服务环境的改造工作进行决策;另外,通过对服务管理信息的统计和分析,能够了解当前自身的服务能力,发现近阶段的服务质量趋势,同时对于个人服务数据(次数、处理质量等)的详细统计,能够提让部门领导准确了解到个人服务能力信息,进而可以通过培训、人员调配等方式,加强服务提供能力。
我公司重要合作伙伴:
HP、CA、IBM、BMC、日立、联盈数码、杰傲科技 |