itil运维管理体系

2024-08-22

itil运维管理体系(精选8篇)

itil运维管理体系 篇1

IT运维管理的由来

在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。

随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。

因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。ITIL与IT运维管理的关系 ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。ITIL标准的底层是对IT基础设施的管理,最上层是对业务系统的流程化管理。

那么,ITIL和IT运维管理到底有什么关系?

就像文章开始说到的一样,企业最初设定IT部门进行IT管理的目的,就是希望通过IT部门能够发现和解决各种来自底层基础设施的问题,从而为保障网络的正常运转,为企业提供优质的IT服务。但随着企业IT系统和业务的不断发展,企业用户发现,单纯的通过对底层IT基础设施管理无法解决底层网络与上层业务系统之间的脱节问题。这也就是ITIL标准当初遇到的问题,最初主要是用来对IT部门的人员进行流程化和规范化的管理的,但它忽视了对底层平台的管理及对业务系统的保障,脱离了用户实际需要的ITIL,就像是空中楼阁,高不可及。近年来,为了更加贴近IT运维管理部门的工作需要,ITIL开始与企业的业务系统保障结合起来,形成了所谓BSM的管理模式,目的是使得ITIL能够更好的为企业的IT运维管理提供服务。

但问题在于,无论从哪个角度来讲,ITIL标准仅仅是一套方法论,没有告诉我们具体的流程该怎么做。而实际上这个流程是建立在对日常IT管理过程中,如何发现问题,如何解决问题的经验积累的基础上。但企业要实现ITIL需要的是结果,不会过多的关注这个过程怎么样。因此,这就需要IT管理的供应商来解决这个问题。那么,怎么发现问题,又怎么解决问题,这就需要通过IT管理供应商提供的IT运维管理系统来解决。通过IT运维管理系统来发现和解决各种来自IT系统的问题,保证企业的网络和运行在网络上的业务系统正常运转。在这个过程中,进行不断的经验积累,然后才能在此基础上实现ITIL的流程化管理。IT运维管理是ITIL标准体系的底层基础。只有将这个底层基础搭建完善,才能真正实现在此基础上流程化管理。当前国内IT运维管理现状

从IT运维管理的由来和两者的关系不难看出,当前国内大多数IT服务厂商强调的IT运维管理概念,其实就是在网络管理基础之上的拓展,包涵的范围不仅限于网络管理,是对整个IT系统和业务所涉及到的范围进行运维管理。但各IT服务供应商的产品对这个概念的体现不尽相同。至少在目前,实际上它还是网络管理(或者称之为IT基础架构管理)外加部分应用服务管理和业务管理的含义,只是说法不同而已。

itil运维管理体系 篇2

近年来, 信息化建设不断深入, 中心为保障生产工作的顺利开展, 投入大量资金对现有系统进行升级改造, 并按照信息系统三级等级保护要求对系统进行安全防护建设, 信息系统已融入中心生产办公的各个部分, 成为中心生产环节不可缺少的组织部分。一方面, 生产业生产业务对信息系统依赖程度越来越大, 要求信息部门提供高质量、高效率的运维成果;另一方面, 信息化建设的高额投资能否取得同等回报, 很重要的一个因素在于如何开展信息运维。这两方面需求, 促使中心须尽快建设一套架构合理、标准规范的运维管理系统, 以科学有效的管理手段, 提高运维服务效率和质量。

2 中心信息运维现状

虽然中心的信息化水平逐年提升, 但多年来依然沿用传统的运维方式, 给运维工作带来一些问题。目前信息运维服务管理中存在的问题:

(1) 缺少系统的IT运维管理方法论的支撑, 缺少IT服务流程管理系统的支持, IT运维实践的处理无法对进度、结果进行跟踪, 运维质量难以保证, 对人要的主观能动性和自觉性依赖较高, 技术人员忙于应付突发事件和处理同类问题, 管理人员无法判断将要发生的故障, 甚至不能及时发现已经发生的故障, 无法对网络、主机等网管系统进行全面的性能统计分析。

(2) 缺少运维人员日常工作质量和数量的考核数据, 人员绩效难以考核。

(3) 内部编制较少, 运维主要依赖于服务商的驻场人员和外部服务商, 人员的变动较大, 知识的沉淀较少。

(4) 缺乏统一的资源管理, 缺乏整体规划, 各个不同厂商的管理工具或软件不能对资产和资源进行有效地管理, 对这些管理工具的整合也非常困难, 无法统一管理和调度资源, 难以有效地分析资产成本效益和资源使用情况。

因此, 迫切需要引入流程为导向, 以客户满意和服务品质为核心的ITIL理论来对系统和设备等进行全面、集中、有效的监控和管理, 以实现系统运维服务管理的规范化、标准化、流程化以及体系化。这样既满足了等级保护的相关标准要求, 也支撑了中心信息系统的正常、安全、稳定的运行。

3 基于ITIL的信息运维体系

3.1 ITIL框架概述

I T I L全称I n f o r m a t i o n Te c h n o l o g y Infrastructure Library, 可翻译为“信息技术基础架构库”或“IT基础架构库”。它是由英国政府20世纪80年代为提升政府IT运维管理水平和解决“IT服务质量不佳”问题, 总结各政府单位和先进企业IT运维管理的最佳实践而形成的。ITIL是IT运维 (服务) 管理全球的最佳实践, 它为政府单位和企业提供了一个客观、严谨、可量化的标准和规范, 由IT部门和最终业务用户根据自己的能力、需求定义以及所要求的不同服务水平, 来规划和制定其IT基础架构及服务管理, 从而确保IT运维管理能为业务管理及运作提供更好的支持。ITIL的主体框架由六大模块组成, 分别为基础设施管理、项目管理、业务视野、安全管理、应用管理以及IT服务管理, 而各个模块的具体关系如图1。

3.2 ITIL运维服务总体架构

考虑到中心现阶段信息系统的发展水平和运维人员配置, 重点对ITIL服务管理模块中的服务支持管理子模块流程进行设计。按照三级等级保护标准要求, 结合中心业务实际, 设计的ITIL运维服务管理架构如图2所示。

3.2.1 管理标准、规范

针对中心信息系统的运维工作, 严格遵循ITIL、ISO20000和ISO27001国际标准, 结合中心信息系统的实际情况, 形成可适用于中心IT运维服务总体管理框架的基础和目标。

3.2.2 管理支撑工具

在信息运维管理中, 通过IT运维服务支撑体系实现对网络、服务器、数据库、中间件、应用与业务系统、安全设备的整体监控, 包含性能监控、运行状态监控、故障报警信息管理的集中式管理和统一展现。

3.2.3 基于流程管理方法

在运维服务支撑体系基于ITIL标准服务管理 (服务台、事件管理、问题管理、配置管理、变更管理、发布管理等) 流程, 实现统一系统设备监控、统一流程管理, 统一运维服务展现和统一信息资产管理, 为汇聚信息系统相关人员以及运维人员提供了一个良好运维服务的沟通、交流和工作协作平台。

3.2.4 服务管理PDCA循环

同时结合成熟的运维服务体系在服务质量控制中始终贯穿服务管理的PDCA模型, 为中心信息系统运维提供良好的支持, 提高信息系统的运维水平。

4 ITIL运维管理体系实践

4.1 运维目标

以ITIL运维管理体系为核心, 以等级保护基本要求为指导, 建立中心的统一、规范、标准化的安全运维流程, 并将人员、运维流程、技术以及管理、监控和考核有机地结合起来。

形成中心日常运行管理的对外统一的服务窗口和内部技术支撑管理平台, 提升整个信息系统的运维管理水平。

通过一支专业化、规范化的富有经验的队伍为中心的提供安全运维服务, 提高对信息系统的运维能力。

4.2 运维具体内容

4.2.1 物理安全方面

定期对机房供配电、空调、温湿度控制等设施进行巡查, 并记录相关设备的告警显示、空调系统、UPS等实际状态, 保障机房正常运转。

4.2.2 网络维护方面

对网络、安全设备的运行状态进行实时监控, 检查各种设备的日志, 记录重点事件, 对安全事件的产生原因进行判断和解决, 及时发现问题, 防患于未然。

4.2.3 主机维护方面

定期对主机设备系统进行软件或硬件的升级, 完善现有主机设备系统, 消除现有系统中存在的漏洞。同时对服务器、终端进行日常巡检、运行状态监控、故障处理、操作系统维护、补丁升级等主机维护工作, 保障中心主机设备高效、稳定运行。

4.2.4 应用系统方面

由于应用系统繁多, 以日常巡检为基础, 结合故障诊断、安全监控、系统优化等维护手段, 从多方面保障这些应用系统的安全、稳定、连续的运行。

4.2.5 数据维护方面

根据中心对数据的保护要求, 制定一套较为合理的数据备份计划, 同时通过对数据备份结果进行定期检查, 对数据库进行合理优化, 有效地保障中心数据的可靠性和安全性。

4.2.6 运维管理方面

结合中心信息化现状, 对管理制度进行完善与修订, 初步形成安全运维体系, 大幅度提升中心运维工作的管理水平, 为日后运维工作的进一步发展提供有力支撑。

5 结束语

基于ITIL运维服务管理的设计, 只是推动运维管理规范化的第一步, 中心后续还需在规划的基础上制定切实可行的实施方案和推进步骤, 并根据实际情况需要不断地修改完善逐步达到ITIL服务管理设计的要求。同时, 还需要陆续制定严格配套的各项运维规范和制度予以保障, 确保各项措施落实到位。希望通过深入研究和分析, 能使中心信息系统运维管理从传统的单一、被动、低效和混乱的管理方式逐步转变为统一、主动、高效和规范的管理模式, 从而全面提升中心的运维管理水平。

摘要:随着信息化应用的不断普及和深入, 信息系统已成为支撑单位运作不可缺少的一部分, 系统的运行维护也显得越来越重要。文章简述了单位信息运维现状存在的问题, 依据单位实际设计了一套ITIL信息运维服务管理体系, 从而达到加强运维管理、提高运维效率、改善运维质量的目的, 充分发挥信息化对单位的支撑和推动作用。

关键词:ITIL,运维管理,信息化

参考文献

[1]周旻, 陈之华.基于ITIL运维服务管理体系的研究和设计[J].信息安全与技术, 2012 (05) :8-10.

[2]孟秀转, 于秀艳, 郝晓玲等.IT治理—标准、框架与案例分析[M].北京:清华大学出版社, 2012, 101-107.

itil运维管理体系 篇3

随着信息化的不断深入,上海公安信息化建设日臻完善,成为保障日常工作的重要支撑。加强对公安信息通信系统的维护,保证各套系统及关键设备安全、健康、稳定地运行,已经成为当前各级公安科技部门的工作重点。为厘清现状,发现问题,并为今后的发展提供决策依据,有必要对上海公安信息中心运维状况进行梳理、分析,并基于业界先进的ITIL理念和ISO20000标准进行顶层设计,规划公安信息中心运维服务管理体系框架。

何谓ITIL

ITIL(Information Technology Infrastructure Library“信息技术基础架构库”)是英国国家计算机和电信局开发出来的一套IT服务管理标准库,通过把英国各行业IT管理的最佳实践归纳起来变成规范,是被业界广为接受的IT服务管理方法。它以流程为导向、以客户为中心,通过整合IT服务与企业业务,提高IT资源的利用率和服务支持的质量与水平,让既有的IT应用产生更大效能。

对于公安信息化管理来说,ITIL提供了一个信息化建设和运维服务管理的系统理论框架,公安信息中心运维服务管理可以此为指导,运用ITIL所提供的一系列标准和模型来制定IT管理政策,控制IT风险,实施IT流程,对于提高公安信息化管理水平,创新管理机制,提高资源配置能力有极大指导意义和借鉴作用。

从整个运行过程来看,ITIL可以分为十个流程,即IT服务财务业务管理、能力管理、级别管理、可用性管理、IT服务持续性管理、事件管理、问题管理、变更管理、配置管理、发布管理。前五个流程属于服务提供流程,后五个流程加上服务台属于服务支持流程。

表1 ITIL服务交付和服务支持

服务交付:服务交付主要面向为服务付费的机构和个人客户(Customer)。它的任务是根据组织的业务需求,对服务能力、持续性、可用性等服务级别目标进行规划和设计,同时还必须考虑到实现这些服务目标所需要耗费的成本。也就是说,在进行服务提供流程设计时,必须在服务级别目标和服务成本之间进行合理权衡。由于这些管理流程必须解决“客户需要什么”、“为满足客户需求需要哪些资源”、“这些资源的成本是多少”、“如何在服务成本和服务效益(达到的服务级别)之间选择恰当的平衡点”等问题,因而服务交付所包括的这五个核心流程均属于战术层次的服务管理流程,它们之间的关系如图1所示。

图1 服务交付各流程间的关系

服务支持:服务支持主要面向用户(End-Users),用于确保用户得到适当的服务以支持组织的业务功能,确保IT服务提供方(Provider)所提供的服务质量符合服务级别协议的要求。服务级别协议(Service Level Agreement,简称SLA)规定了IT服务提供方应该给客户提供什么程度或者级别的服务,以及没有达到相应级别的服务时,如何进行补偿。服务支持各流程间的关系如图2所示。

图2 服务支持各流程间的关系

其中,服务台是IT部门和业务部门用户之间的单一联系点,其主要目标是协调业务部门和IT部门之间的联系,为IT服务运作提供支持,从而提高相关业务部门用户的满意度。

五大问题制约发展

总体来讲,公安信息中心运维服务管理工作近年来虽有发展,但与业界先进水平相比,运维服务管理工作的规范化、专业化程度仍存在较大差距。主要表现在以下几个方面:

工作分散,难以形成运维合力。整个运维工作按照系统分属不同的部门分别维护,导致同样类型的设备可能由多个部门分别管理,运维力量分散,运维效果难以得到持续保障,集约性不强。

建维不分,难以落实运维责任。按照传统运维方式,谁建设、谁维护,建设者即是运维主体,在很多时候往往会掩盖发生的问题,不利于故障和隐患的根本解决,运维责任难以落实。

团队发展受限,难以提高专业化水平。公安信息中心尤其是基层公安信息中心人员往往专业不对口,有些甚至无IT学业和从业经历,难以满足运维的专业化要求。

外部依赖性较强,难以实现独立处置。由于工作任务繁重,公安信息中心除运维工作外还要承担许多其他工作,运维工作往往依赖供应商,在发生故障和隐患时被动听从供应商处理,不能做到独立处置和应用的快速恢复。

理念落后,缺乏顶层设计指导。目前组织内缺乏成熟易行的IT运维管理流程,对日常维护、用户请求、变更管理、故障处理没有形成高效、系统的处理规程,与此同时还面临IT资产管理水平有待进一步提高以及IT运维效率和服务质量提升的挑战。由于长久以来的粗放式发展,运维服务管理理念较为陈旧,特别是缺乏总体框架体系的指导,往往是靠自己总结“土方法”来缓慢进步,运维效果不明显,难以产生质的飞跃。

基于ITIL理念的框架设计

为实现公安信息中心运维服务管理从粗放发展向集约发展,提高规范化和专业化水平,应通过对现状的梳理,结合对ITIL的深度解读,对公安信息中心运维服务管理体系框架进行设计。

设计目标

实现建维分离,实行集中运维,对共性软硬件统一维护、管理,优化运维管理流程,推进运维管理工作集约化和运维管理机制现代化,为信息化应用的推进提供基础保障。

实现两个转变,一是在运维上按条(系统)管理转变为分层(基础设施、网络、基础软硬件、应用系统)管理,推动专业化管理和专业化服务;二是人员分工从一人多角色转变为一人一角色(或少量角色),推动专业化分工。

设计思路

以信息系统生命周期为设计主线;将配套保障措施贯穿始终;重点对运维阶段的工作机制进行流程化设计;将集中运维对象划分为三个层次:基础设施(机房、电源、空调等),网络、硬件和基础软件(操作系统、中间件、虚拟化工具软件),应用软件;按照ISO20000标准和ITIL理念规划、实施集中运维工作。

框架设计

整个框架共分为三大部分、22项工作、39个基本制度规范,其中运营管理10项工作17个制度规范,应用管理5项工作11个制度规范,服务保障7项工作11个制度规范。

首先是运营管理。主要是规范日常运作机制和各项流程,确保各项日常工作和应急处置能够在规定的框架下运行,确保过程可控、行为规范。

服务台管理。主要是明确服务台所承担的日常监测、全局信息化服务申告接报处置的有关要求。涉及规范:服务台运作规范,服务台日常工作序列,服务台服务接报处置及服务委托受理规范。

基础设施管理。主要是明确各信息系统、通用软硬件、数据库、网络安全、基础设施的日常巡检和应急处置要求。涉及规范:日常巡检工作规范,故障应急处置规范,各系统巡检、应急恢复操作手册库。

服务级别管理。指对于服务台、日常巡检发现的故障、告警等事件,根据事件的性质,涉及到的应用系统重要程度,影响范围大小等因素而进行服务响应级别的定义和管理。涉及规范:事件分级处置规范,服务响应级别管理规范。

事件管理。根据服务级别明确各类事件的处置流程,明确各处置环节。用流程管理的手段促使在尽量短的时间内恢复应用。事件管理产生工单,服务台要跟踪工单流转全过程。涉及规范:信息中心事件管理规范。

配置管理。管理对象是配置资源库。主要是实现软硬件资源及设施的台账管理,要求对IT设施基础配置信息及变更情况进行记录,并梳理各配置项之间的关系,记录IT组件的当前状态等。配置管理数据库(CMDB)与变更管理结合,反映各种变更内容和当前的准确状态。涉及规范:信息中心资源配置管理规范。

变更管理。管理对象是配置项以及变更的流程。主要是掌控配置管理数据库(CMDB)中各类资源原有状态改变的过程。要能够对配置管理中的内容进行关联分析,梳理出各种配置的变更的影响范围和调整策略。变更管理产生工单,服务台要跟踪工单流转全过程。涉及规范:信息中心变更管理规范。

发布管理。管理对象是软件或服务的成功部署与发布这一过程,主要是确保被发布对象成功上线,确保只有经过测试和正确授权的软硬件版本才能提供给IT 正式运行环境(生产环境)。发布管理将被发布对象经过测试后通过正确的途径和流程引入生产环境,变更实施结果以发布管理形式执行,与配置管理、变更管理密切相关。发布管理由发布单位产生工单,服务台要跟踪工单流转全过程。涉及规范:信息系统部署、发布管理规范。

问题管理。问题是指多次发生的相同现象的事件。问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事故的影响降到最低。与事件管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。问题管理产生工单,服务台要跟踪工单流转全过程。涉及规范:信息中心问题管理规范,信息系统问题反馈与优化制度。

可用性管理。主要是对用户和业务方的可用性需求进行分析,定义出相应的正常参数、指标,以此来设计IT基础架构的可用性,从而确保用户的需求与IT基础架构及业务方所提供的可用性服务保持一致。同时,要从关键业务功能、安全性、可靠性、容错性、可维护性、容灾要求等角度,来进行监测和分析各种服务的可用性。涉及规范:信息通信资源监测标准,系统容灾备份标准。

知识库。知识库是指辅助运维事件判断、处置、解决等操作的一切知识文档、工具的总称,可以协助运维人员迅速发现和解决问题。知识库包括了用户操作手册、维护手册,故障处置预案、问题管理总结的诊断方法,可用性管理中的可用项诊断,事件管理中的事件处置办法等。涉及规范:运维知识库管理规范及使用手册。

其次是应用管理。主要是明确信息化项目生命周期全过程的规范操作要求及相关流程,确保整个过程在规定的框架下执行,利于后期运维和应用推广。

需求管理。需求包括项目业务需求、运维需求。需求管理内容主要包括需求调研、规划调整、需求编制及需求解读。涉及规范:应用调研工作制度,公安科技信息化规划编制管理规定,信息化项目需求编制规范。

项目管理。主要是明确对项目申报、建设、验收的过程要求。涉及规范:公安信息化项目建设管理规定,信息系统方案设计及技术开发规范,信息系统验收及文档管理规范。

发布和部署管理。主要是明确对全局新建或升级的信息系统正式入网之前的功能、性能测试、审核要求。涉及规范:新建及升级信息系统上线审核测试规范。

运维交付管理。主要是当项目完成运维验收后,由运维部门与项目组进行运维移交。包含技术档案管理、日常运维要求、重大故障处置方法、缺陷回退机制、程序和数据更新维护风险评估和控制。涉及规范:信息系统运维移交管理规范,信息系统升级审验管理规范,信息系统回退工作制度。

服务评价管理。包含应用推广与绩效评估管理及软件生命终止管理,主要工作为指导全局信息系统的应用及推广,负责指导项目组开展培训推广,收集应用情况及应用成效,组织开展应用评估并适时向规划部门反馈。涉及规范:信息系统应用推广及绩效评估管理规范。

最后是服务保障。主要是为运维机制的实施提供人、财、物保障和行政执行力支撑。

人力资源管理。为做好项目建设、运维、应用推广等目标和任务,需要正确选择、合理使用、科学考评和培训人员。通过人岗匹配,充分挖掘人员潜力。涉及规范:岗位设置规范,专业技术岗位绩效考评及聘任工作操作办法。

供应商管理。主要是正确处理与供应商及其合作人员的关系,使之成为信息化项目建设、运维正常运转的有力支撑。做好供应商管理有利于开展与运营商的协调沟通,推进项目建设、维护工作,保障运维机制的顺利开展。涉及规范:供应商及其人员管理规范。

财务管理。经费指信息化项目建设、维护管理的各项配套费用。财务管理是指合理规划各项经费支出,保障信息化项目建设、运维的正常运转。涉及规范:信息化项目建设及运维经费使用管理规定,信息化配套经费使用管理规范。

资产管理。主要是实现固定资产账目与资源掌控账目的有机统一,做到底数清、情况明并符合资产生命周期要求。涉及规范:固定资产管理规定,物料及仓储管理规定。

技术管理。指提供专业技能及工具,支持IT服务和IT基础架构管理,包括对各种运维工具的采购、移交、使用管理及维护,通过落实工具管理力争及时发现缺少的工具软件,最大化地发展各类工具软件的效用,推进日常运维工作的顺利开展。涉及规范:运维管理工具配置及使用管理规范。

值班管理。值班管理是指要求按照前期制定的办事规程或行动准则,在当值的班次里承担相应工作。值班制度的制定有利于开展日常运维的各项流程管理、突发事故的处理。涉及规范:值班管理规定,突发事件应急处置办法。

多部门协调管理。多部门协调管理是指涉及两个以上部门(项目组)的职责无法区分时,由第三方介入开展协调,以利推进工作开展的制度。多部门协调管理制度的制定,有利于快速处理各种牵涉多部门的“疑难杂症”。涉及规范:多部门协调及仲裁制度。

itil运维管理体系 篇4

1、ITSM与ITIL简介

1.1 IT服务管理(ITSM)的背景

IT服务管理(ITSM,是指IT基础设施的运营及维护的全面管理,在当前,随着信息技术的不断发展,各类组织(国家机构、企事业单位、公司等等)正日益依赖于IT来提升其工作效率、降低成本、实现业务目标,这种逐渐加强的对IT的依赖使得组织对获得高质量的IT服务的需求也越来越强烈,如何对IT服务进行有效的管理已逐渐成为IT部门关注的焦点。

—般来说,—个IT应用系统只有在满足以下两点时才会有助于高效的实现组织的业务目标:第一,该系统可以被用户充分利用;第二,当该系统产生故障或需要进行必要的修改时,可以得到维护和运营管理部门的有力支持。而在整个IT应用系统的生命周期中,运营维护阶段占了整个时间和成本的大约70%至80%,其余的时间和成本花费在产品开发(或采购)上面。通过实践,人们认识到ITSM对于各个组织可以提供诸多益处。

20世纪80年代,英国政府认为他们的IT服务质量不是很好,于是指定中央计算机与通信局CCTA(现为英国政府商务办公室OGC)开发一种方法以指导英国公共行政机构高效和经济地使用lT资源,其结果是促成了信息技术基础设施库(Information Technology

Infrastructure Library,即ITIL)的出现,其主要涉及为满足组织IT需求而定制的IT服务的交付和支持。ITIL对全球各IT服务管理部门的管理实践进行了归纳,总结出了IT服务管理的最佳实践,基本上,这些实践已经被定义为覆盖IT服务管理大部分活动的流程。各类组织可以通过使用ITIL为其自身设定改进目标,并得以成长和完善。

1.2ITIL的基本框架

基于IT基础设施,ITIL为IT部门的所有活动提供了一个通用框架。这些活动被划分为不同的流程,当这些流程协同动作时,可以提供一个有效的框架从而可以使得组织的IT服务管理更加成熟。这些流程中的每一个都包括了一项或多项IT部门的任务,如服务开发、基础设施管理、服务交付和支持等。

1.3 ITIL的简要流程

服务支持和服务交付被认为是整个ITIL框架的心脏,主要包括十个工作流程和服务台功能。

1.3.1服务交付

主要包括服务级别管理、IT服务财务管理、能力管理、可用性管理、IT服务持续性管理五个方面。

1.3.2服务支持

主要包括服务台、事件管理、问题管理、配置管理、变更管理、发布管理等六个方面。

2、初步实施以ITIL为基础的ITSM的基本思路

2.1以各纲信息中心组建为契机,加强组织与人员保障

各级信息中心的组建为全面实施以ITIL为基础的IT服务管理提供了坚实的组织和人员保障,我们应当以此契机,配齐技术人员,加强技术培训。同时,在信息中心内,针对不同应用系统划分不同管理角色,如系统管理员、应用系统管理员、配置管理员等等,进一步明确职责,理顺工作流程,确保IT 服务管理的有序进行。

2.2结合实际,选择性的实施部分ITIL管理流程

2.2.1以CMDB为核心,完善IT基础设施管理

在IT运维中,我们需要对不断变化的IT基础设施进行有效控制,识别基础设施内所有重要的组件,收集、记录和管理这些组件的信息,同时为其他工作提供有关这些组件的信息。因此,我们需要建立一个统一的配置管理数据库CMDB,该数据库内存储了IT系统所有组件信息及互相之间的关联情况。通过CMDB,可以实时了解掌握IT系统的整体情况,对于分析系统故障、进行系统升级等提供了基础资料。

2.2.2建立运维服务台,统一处理各类事件

运维服务台是业务部门与信息中心的单一联系点,其最大的任务就是记录、解决和监控IT服务运作过程中发生的问题。统一的服务台通过对事件及解决方案的记载,能够建立起详细的知识库,并为所有技术人员共享,从而提高技术人员技术水平,加快IT系统故障的判断和解决速度,提升IT系统运维保障能力。

作为IT服务管理流程的起点,通过网上报修、电话报修等手段,将所有故障统一汇总到服务台,并进行记录。对于简易的已经有了解决方案的故障,可由服务台技术人员第一时间向报修人员提出解决方法,加快故障处理时间,减少对于二线技术人员的干扰和时间的占用。对于服务台技术人员无法判断解决的故障,在规定时限内提交给二线支持技术人员进行故障处理,并实时跟踪处理过程,将解决方法进行记录,便于今后相同故障的快速解决。通过对服务台故障信息的记录以及分析,可以随时发现同一时间大批量出现的故障,从而判断事件的重要性与紧急性,为处理重大故障隐患提供了第一手资料。

2.2.3建立事件及问题管理流程,解决各类系统故障

事件管理的主要目标是在系统发生故障后发生后尽可能快地恢复系统服务,即使采取的是一些应急措施而不是永久性的解决方案,事件管理是一个被动性的任务,也就是减少或消除存在或可能存在于IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己的正常工作。事件管理流程可以由信息中心运维服务台负责管理,针对各个事件进行记录并分类,再分配给适当的专业人员来处理;之后监控事件的发展;并在事件得到解决之后将其终止。

当IT系统故障处理完毕,服务恢复正常,受影响用户恢复工作时,就停止对该事件的处理活动。但是这样做意味着事件发生的深层次根源并不一定都锯决了,因而事件还有可能再次发生。这时就应当启动问题管理流程,问题管理的主要目标是要查明事故发生的潜在原因并找到解决此事故的根本方法或防止其再次发生的措施。事件管理强调速度,而问题管理则强调质量,把速度放在第二位。

问题管理调查IT基础设施和所有可用信息,包括事件数据库,来分析引起事件发生的真正的潜在原因以及提供的服务中可能存在的故障,并采取相应措施解决问题。

2.2.4严格变更管理,杜绝系统维护的随意性

变更管理主要关注于对IT基础设施变更所进行的审批和控制。该流程的目标是通过对变更进行评估,从而确保能够在对IT服务产生最小负面影响的情况下实施这些变更,同时通过在组织内进行有效的协商和沟通,确保所有的变更都具有可追溯性。

在实际工作中,在对IT基础设施进行变更时,应当提出详细的变更请求(RFC),详细记录变更的目标、变更的步骤、有可能对其他IT设施产生影响以及恢复方法。RFC在经过相关人员(包括该系统以及与该系统有关IT基础设施的所有技术支持人员、业务部门管理人员)的统一审核并同意后,方可实施变更。

3、实施ITIL时需要注意的几点问题

3.1抓住精髓,不拘泥于形式

ITIL是理论性、框架性的最佳实践,是IT服务管理实践的合理抽象,它只是告诉了我们“要做什么”,而没有告诉“要如何做”。因此,重要的是要抓住ITIL的思想精髓,并按照这个思想精髓,结合本单位实际特点以及日常实践经验,制定适宜的流程以符合特定的业务需求。

3.2人员的观念转变非常重要

一般来说,IT技术人员或者相关的人员不会主动接受这个改变,而是继续采用原有的流程、做法,甚至会拒绝接受新的工作流程、方式。因此,为了保证实施效果的达成,需要把IT服务管理的实施结果及有益之处及时向技术及其他相关人员进行宣传,并在建设初期,就把涉及到的相关人员纳入整个过程,使他们能够充分理解IT服务管理的实施给他们带来的好处,了解怎么做才能达到IT服务管理的要求。

3.3争取业务部门人员的参与

在IT服务管理中,IT与业务部门的交互比比皆是,从IT服务台、事件管理、到变更管理等等,IT都在不断地挖掘业务的真实需求,提供畅通的渠道,满足业务工作对IT的需求。业务部门人员的参与,会极大的促进IT人员对IT本身,以及对业务的全面了解,不断提升IT价值,满足业务对IT的需求,实现业务目标。

3.4以渐进式的方式实施

itil运维管理体系 篇5

电子运维系统:运维管理体系的全面解决方案

一、背景

未来的电信市场竞争将日趋激烈,新的形势对中国电信的市场响应能力、服务保障能力、业务创新能力、运营管理能力提出了更高的要求。通信网络规模随着业务的需要在不断扩大,多种业务发展迅速。

新的技术、新的运营竞争环境使得电信运营商对运行维护效率、维护水平、维护成本控制提出了更高的要求,运行维护要从面向设备、网络转变为面向市场、业务。因此,必须依靠管理创新和技术进步走综合化、集约化维护之路。实现设备、人力、信息等各类资源的高效配置,使运行维护管理标准化、规范化,加强对市场和业务的支撑作用,建立以市场为导向,客户为中心,效益为目标的生产体系,实行对网络全专业的整合。

电子运维系统的出现为电信运营商的运维管理系统提供了全面的解决方案。所谓电子运维系统,就是通过电子化来确保运维过程的流程化、工单化、自动化和信息化,快速传递并反馈管控信息,实现快速故障定位和业务恢复,从而提高对市场业务的支撑力度,提高电信运营商的服务水平、服务质量。

二、系统设计原则

图1.电子运维系统——统一运维信息平台

进行电子运维管理系统设计中,要充分考虑整体OSS架构的演进规律与实施规划,把电子运维管理系统放在一个大的运维架构中进行整体设计与规划。另外,为体现电子运维管理系统作为一个指挥调度平台的核心作用,必须把信息发布、网络资料管理等功能综合起来,上升到“统一运维信息平台”的高度进行综合管理与规划。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

在此基础上,设计综合运维管理的整体功能架构与系统架构,然后把电子运维管理系统工程的各项需求纳入这个整体架构中进行统一规划与实施。这样,电子运维管理系统就可以很好地配合未来的OSS架构的升级扩展,并从系统底层预留了架构层面及功能层面的大量平台级的功能模块与扩展机制。

电子运维管理系统是一个长期不间断运行的、高可靠性、高处理能力、可扩展性强的环境下的业务支撑系统。因此,系统在应用系统设计和实施等方面应从先进性、稳定性、安全性、开放性和可扩展性等几方面进行综合考虑。

2.1 先进性

采用面向对象的、构件化的系统设计和实现方法进行应用软件的设计和程序开发。

2.2 统一性

采用统一的数据字典,统一的编码体系,统一的文件格式标准和统一的数据接口标准。

2.3 高度的可靠性和稳定性

系统具有很强的容错、容灾能力,完善的系统纠错恢复安全机制和自动诊断告警能力。

2.4 可扩充、扩展性

系统的应用软件设计方案充分考虑可扩展性,数据模型的设计充分考虑系统将来可能的扩展和业务的变动,以适应业务的迅速发展。

2.5 可伸缩性

系统在软件设计时应具有伸缩性很强的体系结构,以能够适应业务的不断发展和用户规模的扩大。

2.6 系统安全性

系统属于企业内部应用系统,从网络和应用系统自身均能确保系统和数据的安全性。

2.7 开放性

系统遵循行业的标准或建议,采用标准的、开放性的技术。

2.8 灵活性

系统能够适应业务的发展,灵活地设计、调整业务处理流程和组织结构,以适应未来的发展变化。

三、系统硬件结构

电子运维管理系统硬件由数据库服务器/WEB服务器、接口服务器、存储设备以及相关网络连接设备组成,系统的网络拓扑图如图2所示。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

图2.系统的网络拓扑图

四、系统软件体系结构

4.1 系统软件体系结构——三层B/W/S模型结构

电子运维管理系统体系架构采用了三层B/W/S模型结构,形成了数据层、业务管理层、业务呈现层,如图3所示。

数据采集层主要完成对电子运维管理系统原始数据动态的采集;业务管理层对数据进行映射、变形、汇总、分析等工作;业务呈现层主要是根据客户前端发出的请求对数据进行相应的处理并呈现。

系统采用程序处理逻辑与处理程序分离技术,每个逻辑层次都提供相应的基础功能模块,使系统条理清晰、性能优化,更具可扩展性,使得系统具有更好的扩展性和易维护性。

4.2 三层B/W/S结构的优势

采用了三层B/W/S模型结构使得在WEB访问下降低了数据库服务器的负担并提高了性能;同时由于在业务管理层实现了业务功能,使得对业务的变化只需调整业务管理层的相关构件,大大提高了系统的可管理性。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

在系统的安全性方面,三层B/W/S结构也较传统二层C/S结构有重大的提高,使得对权限的管理上升到业务功能级的控制而不是数据级的控制。

另外,三层B/W/S结构更适合在分布式广域网环境下运行,可以更有效地节约传输带宽。

五、系统软件功能模块介绍

电子运维管理系统由个人运维门户、作业计划管理、考核管理、大客户工单管理、工程管理、运维成本管理、综合接口平台等模块组成。

5.1 个人运维门户

个人运维门户相当于电子运行维护系统的“桌面”,主要是采用“以人为本”的理念进行设计,针对个人个性化的服务提供的一个网上工作平台,用户只要进入电子运行维护系统,所有最新的信息,包括待办事宜、已办事宜、公告通知、日程安排等等都一目了然,而且通过个人运维门户就可以办理所有未办的事情,极大地提高系统使用的方便性,所有与自己有关的相关工作通过该模块可以得到统一的处理,同时本模块也是进入其它功能模块的“快捷通道”。

在个人运维门户中,用户可以根据个人的喜好进行设定,如待办事宜、已处理事宜、日程安排、便签、个人信息管理、工作提示等等。

图3.电子运维管理系统软件体系结构

5.2 运维成本费管理

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

主要提供维护成本申请,运维成本相关配置管理,统计报表等功能。

5.3 工程项目管理(含大修理)

该模块主要实现工程项目的管理、流转、查询和统计等功能。包含以下子模块:项目管理、项目建立、项目查询、合同查询、项目统计、KPI和报表管理、维护成本管理和组织架构管理等。

5.4 工作计划管理

工作计划管理主要包括工作计划的制定、审批、分发确认、执行反馈、审核和归档等全过程,是对运维各部门在维护工作计划的制定和实施过程进行监控和管理,同时为考核提供依据。

5.5 大客户工单管理

随着通信市场竞争的日益激烈,对客户的服务水平及客户对运营商的响应速度的满意程度越来越成为拉动企业效益的重要因素。为留住对企业提供更多贡献的大客户,必须加快实现大客户故障处理的响应时限,以提高大客户服务工作的质量和水平。

5.6 考核指标管理

运维管理是对服务开通、服务质量管理等系统的数据进行采集,主要提供各类考核指标和报表的查询、统计功能。应提供灵活、全面的统计方式,满足工作量统计、工单统计等各种考核指标相关信息的统计。

主要提供工作量统计、工单完成情况统计、考核指标和报表等功能。

5.7 系统管理

电子运维管理系统本身是一个大的计算机网络系统,运行了多个功能模块和应用程序。为了保障系统的正常运行,需要确保组成系统的各个子系统、应用程序的性能,因此引入了系统管理功能对系统功能进行管理,同时系统管理功能也是电子运维管理系统中起支撑作用的重要功能。

5.8 系统接口管理

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

图4.电子运维管理系统功能模块

一个系统孤立存在是没有任何价值的,对电子运维管理系统而言,电子运维管理系统主要定位于生产运维的工作管理,作为重要的后台支撑系统之一,必须拥有强大丰富的接口功能,提供开放、标准、规范的接口,除了与当前已经存在的系统接口之外,还能够扩充以便将来与在建、未建的系统接口。

六、结束语

电子运维管理系统提供一个统一的IT基础架构,通过电子运维管理系统和各专业网管系统互联成为跨专业综合网络运行分析、网管系统互通的平台;成为与其他部门沟通联系和数据共享的平台。促进电信运营商基层网络维护人员实现面向运维工作流的生产作业任务的量化管理。可以使管理人员实时掌握网络的运行维护状况,及时指导、组织、协调和督促网络的运行维护工作,使运行维护的工作流程实现端到端的自动化闭环管理。

电子运维管理系统最终实现了运维管理扁平化、运维信息化、工作流程化的目标。

运维体系说明 篇6

我公司为用户提供免费技术服务热线,在接到用户请求后,根据请求情况协调公司资源,第一时间给用户反馈并解决问题。

运维组织架构

运维流程

用户接线员登记和查询应用软件系统工程师平台系统工程师项目组汇总解决售前技术支持工程师高级培训教师系统专家疑难问题 技术支持服务热线工作流程图

1、诊断故障并提交故障诊断报告

根据系统运行过程中出现的系统故障或其它异常情况,及时进行故障诊断,并提出故障诊断报告。故障诊断报告的主要内容包括:故障现场情况记录、故障的级别和紧急处理过程记录等。

2、制定系统维护和故障恢复的实施计划

根据提交的故障诊断报告,制定系统维护和故障恢复的实施计划。按照制定的计划实施系统维护工作。

3、管理、监督维护计划的实施

组成系统维护工程管理和监督工作组,全面负责管理和监督系统维护工作实施过程(应包含用户方与项目承包商双方)。并根据系统维护实施的各个阶段提交维护工作报告。

4、确认维护工作完成并提交维护报告

在系统维护工作完成后,由系统维护人员提交系统维护工作报告,由用户方项目组的技术人员对系统维护情况进行测试并予以确认。

5、提交成果

每次系统维护工作完成后,都应提交如下的报告、记录等文档等资料:

 故障诊断报告

 系统维护和故障恢复的实施计划  维护工作阶段报告  系统维护工作报告

说明:紧急情况下,以排除故障,满足用户需要为首要任务,可以进行紧急处理,但事后要补充相应文档与记录。

现场服务流程

众所周知,最优的售后服务是一个项目的承建商必须做出的承诺。但是,如何根据用户的实际情况(人员素质、计算机应用水平、系统的要求等),做出切合实际的项目售后服务计划书,才是用户关注的问题。优质的售后服务也一直是我们公司在经营活动中最基本的原则。公司的技术支撑部门担负着专业的服务工作,无论是在系统的安装调试过程中还是在系统投入运行之后,无论发生任何问题用户都可以得到最快的响应,售后服务流程如下图所示:

售后服务流程

社会保险的组织结构、计算机应用水平、系统对人员素质要求等情况的分析,我们认为:社会保险信息系统稳定运行是保证本项目建设成功的一项关键因素。

公司提供的服务内容包括:

 应用软件运行维护:应用软件自身缺陷的调整,为客户及时解决日常运行中出现的问题。

 根据政策和经办规程调整,及时响应需求变更(含与金保工程其他子系统和外部机构的接口),并在业主要求的时限内完成对应用系统的修改或调整。

 应用软件技术改造与升级服务:主动或应客户要求,将最新的技术成果和先进的管理模式升级到原有系统,使应用系统的永远保持先进性。

 数据库支持服务:公司提供专职工程师为客户提供长期的数据库优化及技术支持服务,以及异常数据修正、批量数据处理等数据维护工作。

 定期系统巡检:在系统维护期过后,按照签订的维护合同,定期等到现场对应用系统运行情况,主机运行情况,数据库系统情况进行检查和维护。

 客户新技术培训服务:为使客户技术人员能及时掌握最新技术,公司不定期组织客户进行技术学习。

 现场诊断与客户回访:公司选一批客户,由公司领导组团对客户进行回访和现场系统诊断,对诊断发现的问题跟踪解决。

 网络与硬件服务:虽然本次只是软件招标,但离不开网络及硬件系统的支持,公司愿凭自身的技术实力,为本项目提供硬件调试与网络技术支持服务。 客户端服务

(1)收集最终用户对系统的使用意见和建议;(2)对最终用户进行操作指导;(3)客户端故障判断和排除指导;

(4)单机版数据转入系统的操作指导和技术支持;(5)服务方式以提供远程服务为主。

服务内容

(1)协助检查数据库运行情况,及时处理数据库故障;(2)协助定期对数据库进行优化,提高数据库运行效率;

(3)协助检查应用软件中间件运行情况,及时优化并处理中间件故障;(4)接受软件维护申请,对应用软件进行完善性修改,处理应用软件存在的问题;

(5)配合系统硬件的维护,及时处理涉及数据库和应用软件相关工作;(6)配合完成日常的统计分析报表,完成特殊的查询统计需求;(7)历史数据迁移,信息管理系统接口支持。

客户服务质量文件

在客户服务中,公司通过以下文件来保证服务的规范和质量:  客户服务管理:

 《客户服务管理》,售后技术维护,客户问题管理  客户问题办理:

 《客户问题受理规范》,问题记录,问题分发、办理监督,问题回复,问题月报

 《故障诊断报告》,故障现场情况记录、故障的级别和紧急处理过程记录等

 《系统维护和故障恢复的实施计划》  《维护工作阶段报告》、《维护工作总结报告》  《系统维护验收测试计划》  《维护工作验收报告》  客户满意度测量:

 《客户满意度测量》,收集满意度,统计分析(月、季、半年、全年),提出改进措施

 客户培训的相关表格:(为把客户培训工作做得更好的辅助性表格)

 《客户培训申请表》  《客户培训费用确认表》  《客户培训邀请函》  《客户培训邀请函回执》  《客户培训计划》  《客户培训记录》  《客户培训调查表》  《客户培训评估表》  《客户培训总结》

根据以上的质量保证体系规定,公司执行一次较完整的系统维护过程的基本步骤如下:

1)根据项目运行过程中软硬件出现的系统故障或其它异常情况,双方合作及时进行故障诊断,并提出《故障诊断报告》;

2)根据提交的《故障诊断报告》,制定《系统维护和故障恢复的实施计划》,公司按照制定的计划实施维护工作;

3)双方共同组成系统维护工程管理和监督工作组,全面负责管理和监督系统维护工作实施过程;

4)公司根据系统维护实施的各个阶段具体情况提交《维护工作阶段报告》,在系统维护工作完成后,由系统维护人员提交《维护工作总结报告》;

5)最后根据《故障诊断报告》、《系统维护和故障恢复的实施计划》、《维护工作阶段报告》和《维护工作总结报告》,公司技术人员和用户方项目组的技术人员一起,讨论确定《系统维护验收测试计划》;并依此对系统进行测试验收,测试合格提交《维护工作验收报告》维护工作完成,否则继续整改。

几年来的实践证明,规范化质量管理为公司的发展创新、为客户提供更高质量的软件产品发挥着至关重要的作用。公司仍将充分利用规范化的客户服务体系,依靠多年来的成功经验,在项目的全过程中项目的建设提供最优良的服务。

应急流程

系统在运行过程中一旦出现紧急重大问题,导致新系统不能正常运行的情况下,就需要启动售后服务紧急预案,以保证业务经办的正常进行。

应急预案目标

在一旦出现紧急情况下,需要启动应急预案的情况下,应急预案必须以保证业务经办正常运行为目标。

应急预案具体措施

应急预案需要从业务系统、数据库、网络平台三个方面来考虑应急处理措施,在出现紧急重大问题的情况下,我公司会在最短时间内作出故障响应,第一时间由驻现场维护人员启动备份系统,同时将指派具有解决故障能力的软件工程师、数据库工程师以及硬件网络工程师组成的紧急服务小组解决问题。

应急处理流程

应急处理流程图

流程说明:

1、系统出现故障,我公司接受故障,并确定为紧急情况。

2、启动应急处理服务流程。

3、紧急情况处理小组的领导(由用户和我公司人员共同组成)立刻调派我公司的资深专家和用户相关人员。首先尽最大可能收集事件相关信息,确定事件类别、事件来源,保护证据,以便缩短应急响应时间。

4、根据收集的信息,紧急情况处理小组立刻采取措施抑制事件的影响进一步扩大,限制潜在的损失与破坏。

5、根据实际情况,技术专家进行系统的恢复工作。

6、如果是应用软件故障,我公司保证2小时内解决问题,恢复故障系统。

7、如果项目组难以短时间内解决故障,及时申请公司技术支持中心派专家,必要时申请第三方的技术专家到现场协助排除故障。

8、在问题得到解决、系统恢复工作后,回顾并整理该事件的各种相关信息,尽可能地把所有情况记录到文档中,并完成《紧急事件处理结果报告》。

9、提交《紧急事件处理结果报告》。

itil运维管理体系 篇7

首都医科大学附属北京世纪坛医院是集医、教、研、防为一体的大型综合性三级甲等医院,开放医疗床位1100张,日门诊量达到5000人次。医院计算机中心共有职工10人,负责运维的网络终端830个、网交换设备42台、机房服务器32台、存储设备2套、信息系统20多个;还负责医院信息系统(HIS)的开发、维护以及医保的升级、上传等。计算机中心作为职能科室,更是为临床一线服务的服务型科室。

1 HIS运维管理重要性

我院的信息化建设水平随着临床的需求已具有了一定的规模,全院现有的信息系统有HIS、检验信息系统(LIS)、医学影像系统与通讯系统(PACS)、电子病历(EMR)、医保、病理、健康体检、财务、病案管理等20余个,和大多数同级医院一样,面临着信息安全的考验。医生、护士、管理部门工作人员离开信息系统几乎不能工作,如何保障信息系统业务的连续性、保障医疗工作有序开展、提高信息系统应用水平成为医院计算机中心日常运维工作的重点。

总结我院近7年信息系统运维问题,涉及面很广,包括因机房空调故障造成核心业务服务器过热停机、因随意使用HUB端口造成环路而使部分网络瘫痪、因擅自变更设备IP地址为网管地址造成部分网络瘫痪、因外来工程师在医技科室进行系统升级维护而感染病毒等。而这些问题都要求我们必需采取措施,来保障越来越复杂、依赖性越来越高的信息系统的安全运行。

2 基于ITIL运维服务管理实践

2.1 ITIL V3流程管理主要内容

ITIL即IT基础架构库,是在20世纪80年代末期,由英国商务部发布,现在主要适用于IT服务管理(ITSM)。ITIL V3更关注服务,含5个核心模块:服务战略、服务设计、服务转换、服务运营、持续性服务改进[1]。

2.2 确定总体运维服务战略

运维服务战略在很大程度上是定位科室的职责及如何履行职责。我们要保障终端外设、网络、机房设备、信息系统应用的正常运转。为临床提供服务的价值就体现在保证信息系统业务连续运行、服务响应速度以及服务质量。在运维管理中加强问题管理,把解决问题并且不再发生类似问题作为我们的工作目标,也是我们的服务质量定义。面对需求,我们的做法是首先换位思考,站在临床的角度去考虑,充分理解临床工作需要,然而这并不代表所有的需求都必须修改,要充分考虑信息系统的改造代价和需求的关系,并加强信息系统变更控制。

2.3 运维服务设计

2.3.1 运维服务管理

在进行运维服务流程设计时,根据日常工作的经验,总结定义了7个服务流程管理,5个运维记录管理。7个服务流程管理包括CALL CENTER(呼叫中心)管理、业务需求管理、问题管理、业务数据变更管理、基础数据维护管理、软件开发测试管理、软件发布管理。5个运维记录包括日常运维工作记录、机房巡检记录、值班记录、设备维修记录、设备维护升级记录。

2.3.2 运维服务能力管理

信息系统运维服务能力的高低直接决定了为临床提供服务的质量。为提高服务能力,我们采取了一系列的措施。首先,对科室工程师进行能力成熟度模型(PCMM)分析,分析每位工程师的性格特点、能力水平,让工程师做自己相对喜欢的,和能力匹配的工作,并配以绩效考核标准。如果让喜欢做开发的人下科室安装机器或是让喜欢网络调试的人写代码无疑会给工程师增加很多的工作负担,降低工作效率。其次,通过各种手段加强人员专业技术能力培训,请一些厂商做技术培训,或参加院外的一些培训班。最后,锻炼工程师独立思考,独立处置问题的能力,这将大大提高工程师的工作成就感和工作能力,达到提高运维服务能力的效果[2]。

2.4 运维服务转换

2.4.1 运维服务安全管理

安全管理是运维服务的重中之重,要想少出安全事件或不出安全事件,首先要做到主动管理,主动管理可以在出现问题时及时地采取应对措施,也可以防患于未然[3]。我们首先使用头脑风暴法,枚举涉及到运维安全的可能事件,根据这些事件确定日常巡检的内容,包括机房温湿度、路由交换设备运行状态、服务器存储硬件运行状态、存储空间使用情况、服务器CPU内存及磁盘空间使用情况、数据库逻辑备份情况、归档日志备份情况、应急服务器状态、UPS运行状态、虚拟机资源使用情况等。

除了日常巡检内容,针对服务器存储设备、网络、终端等设备还需要一定的技术手段,如双机集群热备、数据异地容灾备份、数据连续保护CDP设备[4]、网络流量监控系统、桌面管理系统等。监控管理系统日志需定期查看、终端系统漏洞需要及时升级、及时更新杀毒软件及病毒库等,并且配以有效的质控管理手段,这样才可以防患于未然,保证少出事或不出事。

2.4.2 加强运维服务变更管理

我院的HIS由计算机室自行开发维护,系统每年维护升级300个版本以上,需求变更流程的控制非常重要。为此,我们成立了HIS管理小组,主要由计算机中心、医务处、护理部、门诊办公室、医保办、药剂科、财务处等部门的负责人组成,按照项目管理的理论,信息系统管理小组的成员也就是需求变更控制委员会成员,兼具信息系统变更控制委员会的职能。临床或医技部门按照需求申请单的格式提交变更申请后,涉及业务流程变更较复杂的申请都要提交到变更控制委员会讨论,做出系统变更影响分析,决策变更方案,最后由我科执行并跟踪实施效果。在这个流程中最重要的环节是变更影响分析一定要透彻,要充分考虑信息系统的改造代价和需求的关系,例如:是否会影响其他业务流程,是否会造成速度响应慢的问题等,通常为此我们还需要做很多事前的分析工作提交到变更控制委员会做决定。

为保证系统升级的安全性,对大的系统变更都需要进行详细的需求调研、需求分析[5],进行开发小组讨论,制定详细的设计说明后再进入开发。开发工作完成后最重要的工作是测试上线,先由开发人员进行白盒测试,再由测试人员进行黑盒测试,除了科室人员进行的黑白盒测试外,又增加生产环境用户单点测试,进一步防止测试环境与生产环境的不符或测试用例不足而造成的大面积升级故障,当用户单点环境测试通过后再正式全面升级。另外,严格执行软件发布管理规定,做好升级前的源代码、可执行文件的备份,以保证回退的可行性。

2.5 日常运维服务运营

2.5.1 加强问题管理

问题管理是运维服务中最重要的一部分。首先,建立CALL CENTER,专人负责接电话。接电话的人与处理人员是有分工的。接到电话的人要首先简单分析事件的原因及紧急程度再分派到其他工程师,如:软件组或硬件组,被分派到任务的工程师在完成任务后需要向CALL CENTER人员进行反馈并记录处理方法及结果,以关闭任务。我们把能够立刻解决并通过维护也不可避免再发生的归为一般事件,如单点网络故障、打印机设备连接问题;可以通过修正性维护避免再发生的事件归为问题[6],问题需要从根源上解决,并使今后不再发生类似的事件,如信息系统软件BUG必须追踪解决,否则日后工作量反而加倍。为此,在每周科室例会上增加一个本周问题汇总讨论环节,让科室人员清楚问题发生的原因,讨论制定解决方案,并针对每个问题指定问题负责人,跟踪问题处理进度,直到彻底解决[7]。

2.5.2 加强执行控制

在运维管理中制定管理制度、服务流程并不难,难的是遵照执行并保留有价值的运维记录。运维记录一方面可以记录日常工作中的细节,整理挖掘出很多不足及有待改进的内容;另一方面也可从容应对很多检查,如“三好一满意、质量万里行、三级医院评审、信息安全等级保护”等这些检查工作中都涉及到运维记录的内容。可能各医院都经历过检查,修补运维记录的工作没少做,等到检查时却没有事实依据,只能东拼西凑,临时补记录[8]。加强执行控制就需要管理人员定期地检查运维记录。

2.6 运维管理持续服务改进

事实上整个运维过程的服务管理事件都需要应用PDCA循环(Plan-Do-Check-Action)的管理方式,以达到持续改进的目的。我们每周例会时会讨论目前管理流程是否有执行困难、不合理之处,以求进一步改进。必要时也会请临床或职能科室的专家讨论,如何处理才能保证效率和质量。以流程管理中的一个入网申请单为例,根据实施的情况,反复修改了多次才定稿目前使用的版本,它包含了入网申请人、科室、联系电话、房间号、入院原因、科主任签字、现场勘查反馈意见、计算机中心反馈意见、入网人员须知及承诺等内容。随着实施还会有变动,这样才可使整个运维服务的质量持续提高。

3 运维效果总结

基于ITIL的运维管理方法实施1年多以来,共产生日常运维记录2800条,完成HIS升级386次。对运维数据分析得出,日常运维记录中约44%是打印机及终端硬件故障、56%是系统使用操作问题,提示需要加强信息系统使用的专项培训。对系统升级原因进行分析,52%是做适应性维护升级、23%是做改正性维护、8%做预防性维护、17%是做完善性维护,通过这个数据可以说明最近1年我们大部分工作是围绕着医改对信息系统的流程变更而开展的。

我院的信息系统运维管理流程化,自主动管理以来,有效防止了计划外停机故障的发生。信息系统问题管理使我院的信息系统平稳运行,有效保障了医疗工作的有序进行,提高了我院信息系统应用水平。但是,在实施中也存在一定的问题,某些流程可能会让部分临床使用人员感觉繁琐,需要进一步磨合并持续改进。

参考文献

[1]陈宏峰,张亮,黄新峰,等.ITIL Version3白皮书[Z].上海:翰纬IT管理研究咨询中心,2007:17-58.

[2]王成军,葛智勇,窦德强.企业人力资源管理实践的整合与优化-人力资源能力成熟度模型探析[J].中国人力资源开发,2008,(8):29-32.

[3]巴志强,郭锡斌,郭启勇.谈医院后勤保障中的安全管理[J].中华医院管理杂志,2006,22(9):641-643.

[4]翁锦阳,何萍,朱铁兵.大型医院信息系统的容灾设计和应用[J].中国医疗设备,2011,26(1):59-60,168.

[5]李维.基于RUP的医院信息系统需求管理研究与实践[J].中国医疗设备,2010,25(4):43-46.

[6]刘道践,李源,顾风军.基于ITIL的医院运维管理流程研究[J].中国数字医学,2011,6(9):90-92.

[7]孙瑜,冯迟.基于ITIL理念的信息科呼叫中心管理系统在三级甲等专科医院的应用[J].信息安全与技术,2011,(2):61-62.

itil运维管理体系 篇8

【关键词】ITIL;数字图书馆;体系

1.ITIL的主要内容

ITIL(Information Technology Infras-tructure Library),最初被译为“信息技术基础设施的图书馆”,目前通常称作“信息技术基础架构库”,是英国中央计算机与电信总局(CCTA)于1980年为解决“IT服务质量不佳”而开发的服务管理标准库,其核心为“以流程为导向,以客户为中心,通过整合组织业务与IT服务,提高组织IT服务的提供和支持能力及水平”,从而能为IT服务管理与实践提供了一个客观、严谨、可量化的标准和规范,IT部门和最终用户可以根据自己的能力和需求定义自己所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT服务管理能为企业的业务运作提供更好的支持,在实践中为保障IT服务的高效性和可靠性提供了理论依据。

2.高职院校图书馆建立基于ITIL理念数字图书馆体系的必要性

信息技术(IT)的发展,促进了图书馆运作模式的巨大改变,传统图书馆工作中的手工操作与检索逐渐转变到以多媒体技术、网络技术、信息存储技术、云计算技术、RSS技术等现代信息技术为基础的现代信息业务运作上来。WEB2.0时代的高端技术带来了图书馆LIB2.0时代的到来,图书馆真正进入到现代图书馆发展阶段。在这些现代技术面前,高职院校图书馆面临着巨大的挑战,从服务方式、服务手段、服务范围都会发生一定程度的改变,但新技术同样带给高职院校图书馆良好的发展机遇。建立基于ITIL理念的高职院校数字图书馆体系,具有一定的必然性和必要性。

2.1 是高职院校图书馆践行服务理念,提升服务能力的需要

ITIL的一个核心理念即是“以客户为中心”,而这一理念正是高职院校图书馆长期以来所遵循的服务理念。“以用户(读者)为中心,为其提供优质高效的信息服务”一直是高职院校图书馆所追求的最高目标,也是高职院校数字图书馆建设的根本宗旨和发展方向。高职院校数字图书馆的各项服务均通过信息检索、参考咨询、文献传递等读者服务流程(方式)来实现,并由图书馆的咨询、技术、读者服务等部门来具体实施。融入ITIL理念,可以在实施读者服务的整个流程中,让各部门之间相互协作和相互作用,实现流程与业务的重新设计,真正快速准确地满足用户信息需求,提升图书馆的整体核心服务能力。

2.2 是高职院校图书馆规范管理,提升整合效率的需要

ITIL涉及到事故管理、问题管理、配置管理、发布管理、级别管理等主要流程。高职院校数字图书馆平台的构建,也同样涉及到资源配置、资源发布、系統维护、权限给予、数据库更新等多种管理。如何有效地整合这些管理,提升整合管理的效率,是高职院校数字图书馆建设中的重点和关键。建立基于ITIL理念的信息平台,能在一定程度上实现对各类管理及流程的有效整合,大幅度提升整合管理的质量及合作服务能力,用最小的投入获取最大的回报。

2.3 是高职院校图书馆直面竞争,提升核心竞争力的需要

在目前信息网络的大环境下,高职院校图书馆亦面临着激烈的信息竞争,并受到信息网络发展的巨大冲击。不断开拓和创新自身的服务方式,拓展自身服务职能,提升整体的服务质量和效率,在目前整体投入不多经费有限的情况下以最低的成本投入创造最大的服务效益,是高职图书馆提升自身核心竞争力的必然选择。引入ITIL理念,构建一个基于ITIL的信息平台,通过科学的管理和技术手段充分利用好图书馆中现有的人力和资源,保障数字图书馆系统的正常运转,不断提升读者服务能力和水平,是现实条件下提升核心竞争力的最佳选择。

3.基于ITIL理念的高职院校数字图书馆系统架构

高职院校数字图书馆的构建,在一定程度上应是利用最现代的信息技术收集、存储、整理和组织信息,并能为用户提供查询检索咨询等便捷快速信息服务的数字资源整合和服务平台。运用ITIL的基本理念,细分并构建好高职数字图书馆平台的基本模块,将直接关系和影响到高职院校数字图书馆功能的发挥,具有十分重要的意义。笔者认为,基于ITIL理念的高职院校数字图书馆系统架构,因其使用对象主要为馆内外用户以及整个平台的管理者(图书馆员),围绕着既能便捷地服务于用户,又能方便于管理和维护的原则,基于ITIL理念着重构建好服务过程管理、服务质量评估、服务应用拓展、服务运维分析、服务安全保障等五大模块并构建相对应的信息资源库,能为提升整个系统的服务效率打下良好的基础,笔者以为,基于ITIL理念的高职院校数字图书馆系统架构整体框架如图1所示。

3.1 服务过程管理模块

这一模块作为整个系统的核心服务流程,主要包括事件问题处理、服务知识库自助查询、系统变更公告等。其主要功能是借助于丰富的数字资源知识库,图书馆服务人员根据服务级别协议定义的服务权限和服务流程为用户提供相对应的信息服务。这一模块通过服务台的设置,为业务、流程和技术的全面变革提供支持。通过集成整合数字图书馆中的各种数据资源和工具环境,为用户提供单一的联系点,接受用户提出的不同类型的询问和请求,为满足用户的各种信息需求提供高质量的信息支持服务并做出快速的响应,及时向用户传递有关服务的各种信息。

3.2 服务质量评价模块

这一模块的主要用途是搜集各类用户对资源库服务质量的第一手反馈或需求,是对数字图书馆的性能与社会效益一个总的评价,以便对系统进行分析及改进。服务质量评价模块由指标结构评价、规模评价、质量评价、稳定性评价等几部分构成。指标结构评价模块是根据专家和用户对图书馆信息资源库评估的目标提出的要求,制定合理的评估指标体系结构,为评估管理打下基础,它是评估过程中关键的一环;规模评价主要从数字图书馆的数字构件揭示的层次和信息类型的完备性、涵盖学科范围、主题领域的全面性、传统资源与信息支撑资源的综合性来加以评价;质量评价主要从提供信息资源的准确性、权威性、针对性、独特性、新颖性及提供信息的重复率等方面来评价;稳定性评价主要从信息资源时间跨度以及所提供信息资源的持久性来进行评价。

3.3 服务应用拓展模块

这一模块应是整个系统构建的最终目的。其主要功能是提供资源管理及调度服务、馆际互借、文献传递服务、联合虚拟参考服务、网上咨询服务等具备较高层次的个性化服务方式,最大限度地发挥高职院校数字图书馆及整个系统服务平台的功能,协调各类信息服务,提升服务能力,拓展服务功能。通过集成和整合多个分布式、大规模、可互操作的异构的数据库资源,向读者提供高效、一站式、全方位综合文献内容服务及其它配套的数字化应用服务,满足读者多层次的信息需求。

3.4 服务运维分析模块

这一模块是整个系统正常运转的关键。其主要功能是方便于图书馆技术服务人员实时监控资源库的使用情况,并做出预测分析,以辅助相关高层领导进行决策。模块针对资源库的运营服务情况、各子系统使用情况、支持服务人员绩效等进行统计分析,并通过比较以往情况进行趋势预测,将有助于专家领导对资源库进行决策改进。该模块提供服务支持的周、月、年等的统计报告及报表及分析和趋势预测功能,包括事件问题请求数量、事件问题处理状况、事件问题分布、各个支持服务人员处理情况、用户数、用户分布、知识统计、资源库平台及各个子系统的访问量统计、故障统计等,并能将各级报告通过图表进行可视化展现。

3.5 服务安全保障模块

这一模块的主要用途是实时监控数字图书馆平台的安全状况,保护IT基础架构,避免未经授权的使用,保障整个网络和系统的安全运行。就目前而言,网络设备的物理安全、Internet本身存在的安全漏洞、计算机病毒对网路安全的威胁、来自校园网内外的攻击都会对整个数字图书馆系统和平台造成较大的威胁,通过设置这一模块,多措并举,利用硬软件防火墙,设置多种访问控制策略,最大限度地阻止网络黑客访问校园网络信息平台,同时采用目前最先进的漏洞扫描系统定期对工作站、服务器、交换机等进行安全检查,并根据检查结果向系统管理员提供详细可靠的安全性分析报告,为提高网络安全整体水平产生重要依据。

参考文献

[1]李建华,蒋兴浩.电子政务发展趋势分析及建设思考[J].信息网络安全,2005(5).

上一篇:高中数学新授课教学模式下一篇:京城的雾霾何时休诗歌