1、XXXX有限公司 IT 系统运维服务解决方案四川XX科技有限公司2015年4月目 录概述1市信息办IT系统运行现状2运行的系统及设施2非正常或不稳定运行系统2目前系统维护现状和存在的问题3现状总结重点需求3XXXXIT运维服务优势4IT系统运维服务项目指导原则5总体目标5基于 IT 服务管理模式(ITSM)6人员、资源、技术和过程四者平衡的运行维护服务模型6快速响应及时解决7以预防为主的方针7量化的服务级别管理8IT运维服务项目阶段划分设计8启动阶段9正常服务阶段10总结阶段10IT系统运维服务项目的范围11服务范围11运维服务项目服务时间、服务方式11运维服务项目涉及的产品范围12硬件范围清
2、单12软件范围清单15项目运维预算15IT系统运维服务项目组成员及职责16运维服务项目组成员16IT系统运维服务项目服务级别管理19故障级别定义19关键指标定义20SLA服务协议20运营级别协议21支持合同21IT系统运维服务项目配置管理22目的22范围22配置管理项目23配置管理表23流程说明23定义配置管理对象和配置管理项23收集初始数据23更新配置管理表23填写配置变更记录表24定期核查配置管理表24IT系统运维服务项目事件管理24目的24事件管理流程26服务台事件受理26请求记录和分类26热线电话尝试解决26远程解决26现场解决27二线支持27服务响应27调查诊断27确定解决方案27客
3、户确认28资料归档28配置核对更新28热线关闭28服务报告28IT系统运维服务项目问题管理29目的29过程测量指标29问题管理流程30问题确认与受理30问题登记和归类30派单30问题调研和分析诊断30确定临时措施31确定解决方案31问题回顾和评审31问题归档32问题关闭32问题报告32IT系统运维服务项目变更管理32目的32变更级别及定义33变更流程描述33变更确认受理33变更记录和分类34变更分类执行34变更关闭34变更报告34IT系统运维服务项目发布管理35目的35发布过程35制定发布方案35发布方案评审36构建测试环境、测试和验收36沟通和培训36分发和部署36更新配置库36发布关闭37
4、发布报告37IT系统运维服务项目服务信息安全管理37目的37确定安全实施范围38实施安全规范38IT系统运维服务项目服务可用性管理39目的39范围39过程测量指标39服务组件设计40服务组件监控设计40服务组件维护设计40服务组件恢复设计41IT系统运维服务项目服务能力管理41IT系统运维服务项目服务持续性管理41IT系统运维服务项目服务成本管理42IT系统运维服务项目服务报告42IT系统运维服务项目客户沟通管理42IT系统运维服务项目项目质量检查43概述随着XX市政府信息化工作重点已经从基础设施建设向深化应用逐步转移,信息技术应用与业务之间已形成良性互动发展的趋势。XX市政府服务平台信息化系
5、统建设,具有特别的重要性和特殊性,尤其以行政权力系统为核心,扩展到相应的关键业务子系统及集成项目,其运行环境多系统、多数据库、多应用平台、多厂商网络及系统设备,多业务应用等复杂的管理环境。在此背景下,市信息办信息系统的运行维护和建设对比,已经变得同等重要,信息系统建设后的有效应用更依赖于高质量的IT运行维护服务。因各应用系统的维护难度和专业度的不断加深,目前现有的传统维护方式已经无法满足信息应用系统的维护需求,如何提高信息化应用系统的持续可用时间,从而有效提高业务部门的工作效率,已经成为越来越迫切需要解决的问题。XXXX公司作为专业的软、硬件系统建设厂家,为政府信息化系统提供了具有针对性和科学
6、性的运行维护服务解决方案。市信息办IT系统运行现状运行的系统及设施非正常或不稳定运行系统1. 系统名称:2. 运行情况:3. 系统名称:4. 运行情况:目前系统维护现状和存在的问题1. 系统厂家多,售后服务分散,容易形成技术孤岛,造成资源浪费。2. 各系统厂家遇到系统边界线问题时,相互推卸责任,影响系统整体运行效果。3. 当遇到紧急重大故障时,无法得到及时的恢复服务。4. 对于安全隐患或隐性故障没有有效的技术防患措施。现状总结重点需求1. 具有全年365天,7 x 24小时无间隙服务2. 需要加强机房设施及核心设备的日检管理方式3. 需有系统硬件、软件全面维护服务的整体解决方案4. 需常驻资深
7、运维工程师提供快速技术支持5. 需设备备件保障及设备硬件保修6. 需本地现场技术及软件业务操作培训7. 通过相关措施,完善非正常或不稳定运行系统XXXXIT运维服务优势XXXX有限公司可为市电子政务系统提供涵盖主流IT设备厂商从核心服务器、主机、存储、网络、视频、集成设备到软件系统等全线IT基础构架的维保服务产品,为电子政务的IT系统提供跨厂商的技术支持,以专业的工程师队伍和规范的服务流程为电子政务办及时解决软、硬件系统故障、恢复系统故障、恢复系统运行,降低系统故障率,提高IT系统可用性,提升电子政务系统的IT运维管理能力。1) 严格按照ISO/IEC 20000的IT服务管理体系标准,实施运
8、维管理;2) XX科技高层管理对IT运维服务管理体系的实施非常重视,完善的管理体系平台,包括方针和框架,保障有效管理和实施;3) 核心系统(三台合一接处警调度通讯指挥系统)技术故障快速处理能力;4) 针对市电子政务办IT运维服务项目的服务策划管理、SLA服务级别管理、业务关系管理、事件管理、问题管理、配置管理、变更管理、服务报告、服务能力管理、服务可持续性管理、服务可用性管理、服务成本管理、发布管理有一套完整的体系建立;5) 涵盖主流IT厂商软、硬件产品的服务能力,已电子政务系统为核心,统一服务接口,简化服务管理流程;6) 灵活的SLA服务级别选择,便于客户根据自身需求情况定制服务;7) 全天
9、侯服务、全过程监督,通过各关键指标监控实现服务过程可测量;8) 提供从数据、硬件平台、软件平台、网络平台和基础平台的全面维护服务的整体解决方案;9) 现场常驻资深工程师提供快速技术支持和故障排除;10) 建立确定可行的保修设备备件保障机制;11) 通过例行操作服务、响应支持服务、咨询评估服务和优化改善服务,多角度多层次立体式保障客户系统的运行稳定,拓展客户信息化建设思路;IT系统运维服务项目指导原则总体目标引入先进的IT运行维护服务理念和方法,建立并完善基于ISO/IEC 20000 IT 服务流程管理体系,从传统的项目售后服务向基于服务水平管理和流程导向的IT运维服务管理转型,以期达到:1.
10、 建立规范的服务流程,提高服务接受方与服务提供方运营效率; 2. 建立持续一致的服务,提高服务接受方满意度,确保客户满意度; 3. 有效及高效地整合和利用信息、基础架构、应用、人员等 IT 资源; 4. 以最低的成本、最大的效率来利用、管理和维护资产和设备; 5. 提高一线服务台解决率,改善服务流程,快速响应服务接受方的需求。在SLA服务 级别协议约定的事件处理时间内,事件处理完成率达到100%;基 于 IT 服务管理模式(ITSM)ITSM 管理模式通过业务-IT相结合,服务内容定位和管理,服务的实施和开展以及服务运作的管理四个方面将业务和IT服务密切的结合起来。根据业务需求制定出相应的IT
11、策略,并将IT策略转换为具体的IT服务计划和定义出服务级别。服务的建立和实施将IT策略贯穿始终,使IT最大程度的满足业务的需要。人员、资源、技术和过程四者平衡的运行维护服务模型过程服务级别管理 服务报告事件管理 问题管理配置管理 变更管理 发布管理 安全管理技术研发发现问题解决问题人员人员管理 岗位结构知识 技能 经验资源运行维护工具服务台备件库知识库关键指标策划实施改进检查1. 人员:为确保服务提供方的相关人员具备应有的运行维护服务能力。为保证故障响应、解决问题和交付结果可控,XX科技在人员管理、岗位结构和人员的知识、技能、经验、安全意识等方面建立了完善的管理和考核体系,从而保证服务人员能够
12、具备和达到应有的水平。2. 资源:为确保具备提供足够资源的能力,以满足与服务接受方约定的及未来的运行维护服务需求。XX科技将合理建立和配置运行维护工具、服务台、备件库和知识库等相关服务资源,从而保障服务资源的及时、有效投入。3. 技术:为确保具备与运行维护服务策划相适应的技术和手段。在运行维护服务实施过程中,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,XX科技根据客户方的相关要求或技术发展趋势,能够发现和解决问题、风险控制、技术储备以及研发、应用新技术和前沿技术。4. 过程:通过对ITIL最佳服务实践模型的理解,XX科技将建立以下服务过程:服务级别
13、管理、服务报告、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,通过对各个服务过程的流程化、标准化管理对整个服务过程实现可监控,从而保障服务提供的可控和持续可靠。快速响应及时解决XX科技将为XX市电子政务办IT运行维护服务对象提供快捷便利的服务方式,根据客户 IT 运行维护服务对象不同阶段的业务需求和内部人员结构客户化我们的服务。XX科技丰富的经验和庞大的服务体系,以运维团队驻场方式服务,使我们的服务具有快速响应和及时解决事件的能力。 以预防为主的方针XX科技的IT运行维护服务改变了传统保修服务只是被动的接受问题并解决问题的特点,而是从预防为主,通过实时的监控和分析发现IT应用系统
14、中潜在的问题和风险,及时采取相应的措施以避免问题的发生。这样的做法最大程度的减少了IT应用系统事故的发生,保证客户 IT 应用系统最大时间的持续工作。量化的服务级别管理服务质量的评估不再是一种模糊的概念,通过对服务过程中各项关键指标的持续监控,以关键指标量化方式定期按照建立的内部测评审核机制对关键指标达成度进行测量,从而实现服务过程的持续改进,保障服务质量的稳定和持续提高。经合同双方同意的服务级别将作为服务质量管理的依据。清晰明确的服务质量要求使得服务的管理最有效。IT运维服务项目阶段划分设计为了整个IT运维服务项目提供良好的管理监控,并对项目中各管理组织之间的持续运作建立恰当联系,我们把整个
15、项目执行分为四个阶段:1) 启动阶段:服务实施过程前期的准备工作和计划,包括运维服务管理制度的建立、项目团队人力资源的到位。2) 过渡阶段:完善支持服务流程,服务磨合逐渐成熟。3) 正常服务阶段:正常地执行运维服务全过程。4) 总结阶段:项目的总结移交并达到有序的结束。时间跨度如图所示:理管维运理管产资理管目项启动阶段2周过渡阶段2周总结阶段2周管理制度、流程建立资产评估、接管和标准化现场人员到位运维服务磨合(无服务级别承诺)资产信息数据库建立资产的采购和租赁日常的资产管理服务提供正常的运维服务(有服务级别承诺)资产配置的标准化管理管理制度、流程改进服务级别管理、质量控制对第三方的服务监督、评
16、估管理项目管理资产管理运维管理项目启动会定期的沟通协调会,报告过渡阶段的宣传合同签定后SLA确定接管第三方服务渠道服务台到位常规服务阶段48周管理制度、流程建立资产评估、接管和标准化现场人员到位运维服务磨合资产信息数据库建立资产的采购和租赁日常的资产管理服务提供正常的运维服务(有服务级别承诺)资产配置的标准化管理管理制度、流程改进服务级别管理、质量控制资产数据移交服务总结汇报对第三方的服务监督、评估管理项目启动会定期的沟通协调会,报告过渡阶段的宣传合同生效日SLA确定接管第三方服务渠道服务台到位在每一个阶段过程中都有相应的工作安排及阶段成果输出,启动阶段、正常服务阶段和总结阶段三个不同的主要阶
17、段构成完整的服务过程。启动阶段与市电子政务IT运维合同正式生效后,作为整个项目的启动阶段。在此阶段中,主要执行前期的准备工作,为尽快提供高质量的服务打好基础。(启动阶段估计需要2周时间)。该阶段主要工作如下:1) 成立IT运维项目组,确定市电子政务办为运维服务接受方,XX科技为运维服务提供方,并确定双方的职责分配;2) 相关人员到位,提供IT运维服务项目的准备工作;3) 召开项目启动会议,制定各现场支持服务计划沟通会,明确工作范围,制定启动阶段计划;4) 双方互动协调出台SLA服务等级协议细节,报请双方上级部门或领导审核,并明确SLA服务等级协议;5) 项目管理、运营维护等规章制度流程的确定;
18、6) 双方人员一起讨论有关的工作计划和需求;7) 系统维护服务实施计划的出台和审核;8) 针对服务范围涉及的硬件设备进行预检服务;正常服务阶段项目启动后,新的服务系统可以实现IT运维服务范围所承诺的服务后,即进入正常的服务阶段。在正常服务阶段,所有的工作将按照制定的计划进行,并提供服务级别的承诺。具体的工作如下:1) 运维服务管理体系和流程的改进;2) 正常的运维管理;3) 季度服务例会的召开;4) 设备运行风险评估;总结阶段此阶段开始于合同规定服务时间即将结束前2周。这个阶段的主要工作是和XX市电子政务办充分沟通,移交服务本年的工作。并从项目的服务实施过程中积累总结经验,以促进提高在后续运维
19、项目中的工作质量和绩效。1) 收集服务期中各部分的服务文档资料及相关报告;2) 汇总、装订,提交用户并存档;3) 项目评估、总结;4) 召开年度服务回顾总结会形成项目总结报告;IT系统运维服务项目的范围服务范围资产托管服务、技术咨询服务、故障处理服务、系统升级改造服务、系统搬迁服务、培训服务、巡检服务、回访服务、硬件维修更换服务、定期系统健康检查服务、系统演练服务、重大会议保障服务、厂家支撑服务;运维服务项目服务时间、服务方式1) 运维服务项目服务期:从XXXX年XX月XX日起XXXX年XX月XX日止,共计XX年;2) 运维服务项目服务方式:XXXX有限公司的运维项目组在XXX市现场驻点式服务
20、;运维服务项目涉及的产品范围1. 硬件维护服务范围清单根据硬件维护服务范围清单,确定对运维项目中提供服务产品的界定更加准确;2. 软件维护范围清单根据软件维护范围清单,确定对运维项目中软件维护范围更加清晰;硬件范围清单机柜序号设备型号6-06柜1HP服务器DL388 GenB2认证网关吉大正元G3000-E3认证网关吉大正元G3000-E4证书注册中心吉大正元LRA20005身份认证服务器曙光A420r-G6行政权力运行服务器曙光A420r-G7行政权力运行服务器曙光A420r-G8行政权力运行服务器曙光A840-G106-05柜1抗DDOS傲盾KFW-20002负载均衡A华夏APPEX3负载
21、均衡B华夏APPEX4山石VPNHILLSTONESG-6000M31005WEB防火墙国舜科技6交换机H3C S55007交换机H3C S55008深信服AF-1520深信服AF-15209交换机H3C S5120-28P-SI10交换机H3C S5120-28P-SI11深信服155012华三路由器H3C MSR36-206-04柜1交换枢纽IBM system X3650m42办件查询前置IBM system X3650m43信息公开前置IBM system X3650m44数据库/备份服务器IBM system X3850X55WEB服务器IBM system X3850X56WEB服
22、务器IBM system X3850X57WEB服务器IBM system X3850X58IBM 2498-B249IBM DS351210NAS存储IBM system storage N32406-03柜1数据库/备份服务器IBM system X36502企业和部门服务器HP DL5803网页防篡改服务器HP DL380G64电子政务流转服务器IBM X36105电子政务公章服务器/防病毒服务器IBM X36106政务外网市级核心交换机H3C S7506E软件范围清单项目运维预算序号收费项预算计算方式金额备注一软件服务成本预算1、2、二硬件服务成本预算1、2、三硬件保修成本预算1、2、
23、四备品备件库建设预算1、2、五场地成本预算1、办公室2、测试环境3、办公设施六项目组组织成本预算1、薪水:2、培训费:3、交通费:4、差旅:七公司管理成本预算3. 项目的管理成本4. 税金运维服务项目预算合计:IT系统运维服务项目组成员及职责运维服务项目组成员针对运维服务项目,双方建立项目组成员,设计合适的事情管理接口,便于正确有效快速的管理运维项目工作事物。运 维 项 目 小 组 成 员项目负责人业务关系负责人运维项目接口人运维项目协调人应用系统使用部门运维项目经理运维项目待命运维工程师服务台值班运维工程师项目决策项目管理运维工作事件处理XX科技运维服务项目组人员配置及职责运维项目经理(多年
24、IT运维服务项目管理经验)XXXX有限公司指派一名具有良好技术背景和丰富项目经验的项目经理,作为项目的总接口人和项目负责人。1. 负责协调内部人员、软硬件资源,及时对市局运维项目范围提供服务、保证各项指标的完成情况;2. 负责整个服务项目的具体组织和管理,召集季度例会和工作协调会;3. 制作、完善详细的服务项目方案和服务级别计划,在服务过程中及时动态地调整方案,提高工作效率,保证服务质量;4. 给管理小组成员分配任务,随时监控每个成员的服务管理情况,控制服务质量;5. 负责整个服务项目中的问题管理、变更管理;6. 作为与市局指挥系统间的唯一接口,负责向市电子政务办汇报服务情况、变更需求等情况,
25、并及时将有关要求反馈给管理小组;7. 接受市局指挥系统投诉和协调市局指挥系统需求的变化,及时反馈制订应急计划,报告项目领导小组和市局指挥系统负责人;驻场运维工程师(二年IT运维服务项目实施工作经验)1. 负责计划内服务内容的实施;2. 负责第一时间响应客户故障报告;3. 负责主动性监控,及时发现故障隐患;4. 负责现场故障修复;5. 关键、疑难故障及时上报项目经理和热线中心;6. 负责实施其它主动式服务及其它专业服务;7. 负责解决现场和服务台无法解决的客户问题;8. 负责在技术问题方面的与总部支持团队和原厂服务商的联系沟通;项目接口人1. 代表电子政务办,负责运行维护服务项目管理,与XX科技
26、接口人;2. 在运行维护过程中,负责变更管理等需要协调、确定之事宜;3. 突发事件处理的管理协调;4. 与XX科技运维组的定期交流沟通;项目协调人1. 运行维护服务中用户方具体维护协助人员;2. 在运行维护过程中,负责协助运维工程师处理日常故障事宜;3. 突发事件的相关协助工作;4. 日常与运维组人员的交流沟通;IT系统运维服务项目服务级别管理针对市电子政务IT系统运行情况及需求,识别编写具体的服务需求和绩效并形成服务目录和服务级别协议;对服务需求进行商定、定义、编制、监控、变更和评审等;故障级别定义故障级别定义重大故障因核心系统设备或服务端软件导致系统瘫痪,造成整个业务系统功能丧失性故障(如
27、:交换机瘫痪造成数据库瘫痪、核心服务程序故障、整个系统无法进行受理等);一般故障辅助子系统在运行过程中发生的不影响基础业务系统使用或间接性故障(如:服务器故障)关键指标定义关键指标定义响应时间从接到客户故障申报时间起,到工程师电话反馈给客户止,所使用的时间。到场时间故障响应时间起,到工程师抵达故障现场之时止,所使用的时间。解决时间故障响应时间起,到工程师完成故障处置之时止,所使用的时间。主动式服务规定时间结合项目实施周期,制定服务计划,并规定具体的时间阶段,长期执行的过程。SLA服务协议服务项目故障级别SLA-1响应时间重大故障7天*24小时 0-10分钟响应;一般故障7天*24小时 0-10
28、分钟响应;到场时间重大故障7天*24小时 1小时内工程师到场处置;一般故障5天*8小时 2小时内工程师到场处置;解决时间重大故障4小时内工程师处置完毕,核心系统恢复,基本业务系统恢复使用;一般故障24小时内工程师处置完毕业务系统恢复使用;主动式服务规定时间根据服务计划时间,保证时间的不偏离运营级别协议运营级别协议(OLA)是IT运维组与公司研发部门和采购供应部门就市电子政务IT系统运维服务项目所签订的协议。(如服务台或项目组有受理故障升级、软件修改需求时,公司内部需严格遵守与项目组的OLA协议约定,保障运维项目服务执行效果)OLA支持运维组提供的各种服务。支持合同支持合同(UC)是与外部提供商
29、就运维项目中部分服务的供应所签订的合同。(如通信运营商、专用服务器厂商、DLP大屏厂商、其它专用设备厂商等第三方厂商支持保障)IT系统运维服务项目配置管理目的配置管理流程的总体目的是提供一个统一的、一致的流程来管理IT系统运维服务项目环境中的所有组成部分,以确保:1) 所有配置项被识别和记录下来;2) 配置项当前和历史状态得到汇报;3) 配置项记录的完整性得到维护和确认;4) 客户服务环境的稳定性;5) 实现资产管理的目的;范围配置管理的范围是XX科技开发的管理信息系统的运行和服务环境下所包含的配置项,包括接处警调度指挥通讯系统、其它各子系统运行环境的部署环境设备、系统软件等,及服务环境中涉及
30、的客户信息配置。具体活动包括识别、控制、汇报和审核等行为。包括:1) 客户信息:企业客户信息;2) 软件信息:参考软件服务范围清单的全部系统软件,建立配置信息;3) 硬件信息:参考硬件服务范围清单的全部系统硬件,建立配置信息;4) 服务文档:服务项目文档、服务记录、用户手册等;配置管理项目各配置管理对象需记录的具体配置参数项,例如服务器的物理位置、计算机名称、服务器品牌型号、IP地址、CPU型号、内存量、操作系统版本号、安装的业务系统软件名称等。配置管理表记录配置管理对象的各项配置信息。每个配置管理对象建立一张配置管理表,表内记录该对象的每个配置管理项目的具体值。流程说明定义配置管理对象和配置
31、管理项在初次建立配置管理系统或增加新的软硬件资源时,运维经理需要对管理对象和配置参数进行定义,建立相应的配置管理表,并提交给运维工程师。收集初始数据配置维护预案按照配置管理表收集系统数据,并核查其数据的准确性。更新配置管理表在确认配置数据的准确性后,由运维工程师将新的配置信息写入配置管理表,配置维护预案需要在接到配置变更单后24小时内完成配置管理表的更新。填写配置变更记录表运维工程师在完成配置管理表更新,并通知运维经理后,需要将本次配置变更情况记录在配置变更记录表中。定期核查配置管理表1) 当由于系统变更导致配置变更时,在变更完成后1日内填写配置信息变更通知,并提交配置管理员。2) 配置管理员
32、在接到配置变更单后,根据配置变更单的内容进行配置变更派单,由配置操作员进行配置变更操作。若需要增删配置对象或配置项目,则由配置管理员进行相应的增删操作后,通知维护员更新配置信息。3) 配置维护预案在接到配置信息变更单后的24小时内,需要按照流程规定完成配置信息的更新,并在变更单中写明处理人、处理时间和处理结果,并回送至配置管理员。4) 配置管理员在配置变更记录表中记录本次变更行为IT系统运维服务项目事件管理目的事件管理是一个被动性的任务,为了减少或消除存在或可能存在于IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己的正常工作。因此,将事件记录下来并分类,再分配给适当的专业人
33、员处理,同时监控事件的发展,并在事件得到解决之后将其关闭。事件管理流程主要功能是尽快解决日常工作环境中出现的事件,保持IT服务的稳定性,其目的包括:1) 建立统一的事件受理机制;2) 事件处理流程中设立升级机制,与其它流程之间关联接口,设置优先级别和业务影响划分;3) 建立重大事件流程管理;4) 保证事件统计内容全面,保证流程的输入;5) 在成本允许的范围内尽快恢复服务。6) 快速响应服务请求。7) 跟踪事件处理的状态。8) 确认事件的解决和用户满意度。9) 进行事件控制。10) 按规范记录事件。11) 监视并结束事件。12) 进行定期服务回顾。13) 提供一个日常服务接口。事件管理流程服务台
34、事件受理客户通过服务台报告事件,收集好相关信息,受理并进入事件处理流程。服务台需要收集以下信息:1. 来电客户的单位名称、联系人、电话号码等基本信息。2. 影响业务的具体原因、故障现象以及所属优先级。请求记录和分类根据事件报告的信息,一线支持记录客户服务受理单,通过电话方式需要询问客户详细的事件描述,然后根据用户的描述判断事件的分类、优先级等信息。如果事件是关于供应商的问题,根据合同协议,直接转三线支持。若事件比较重大且优先级为重要紧急,则需要报告项目经理。热线电话尝试解决一线支持人员受理事件后,首先根据用户所描述故障情况,参照知识库,对用户进行相应的指导解决。远程解决一线支持人员无法通过电话
35、指导客户解决的事件,在征得客户同意的情况下,可以采用远程工具,登录客户计算机来操作解决。现场解决一线支持人员无法通过电话或远程协助客户解决的事件,需要到现场协助用户解决问题。二线支持经一线支持人员尝试解决无果或经判断不属于一线支持能力范围内的,提交二线支持解决。工程技术部和软件开发部:负责解决客服工作遇到的疑难问题,并分析其问题原因。公司管理层:负责客服人员新增、各种配套服务设备添加的审批,并牵头解决重大的故障或者服务中产生的纠纷问题。服务响应参照SLA服务协议执行。调查诊断现场服务人员(一线、二线、三线)在现场通过标准配置进行比对等方法对故障进行分析,查找出故障原因。确定解决方案技术服务人员
36、根据故障分析结果确定解决方案,并与客户沟通执行解决方案所需要的时间,确定解决方案的可行性。若发生的事件一时解决不了, 需要与客户约定解决时间。对于重大故障(故障等级为高或中)须做好数据备份。若故障处理时涉及一般、重大、紧急的变更,转变更管理流程,参考变更管理程序。事件解决后,故障现场负责人分析若属于影响重大或经常出现的问题,需要通过问题管理进行彻底解决的,转问题管理流程,参考问题管理程序。客户确认待事件处理完毕,需要与客户确认,并以抽样形式进行用户满意度调查。资料归档技术支持人员将客户服务受理单进行归档。将客户服务受理单存档。配置核对更新当事件处理后配置项属性需要变更时,则由一线支持提交配置管
37、理负责人进行配置项修改,修改该支持项目的应用系统配置信息,参考配置管理程序。热线关闭当产生新的解决方案时,需要提交到知识库,对知识库进行相关的维护,该技术服务结束。 服务报告事件管理负责人按每月对事件进行总结并分类,并将报告发给项目经理。 事件报告内容包括:1. 本月事件总数。2. 本月服务响应总数。3. 二线支持解决事件总数。4. 三线支持解决事件总数。IT系统运维服务项目问题管理目的1. 问题管理流程的根本目的是消除或减少系统运行环境和客户服务过程中事件发生的数量和严重程度,防止相同事件的再次发生,从而为市电子政务办建立一个稳定的系统运行环境,提高客户服务的可用性。2. 分析并确定事件的根
38、本原因,找到最终解决方案,以防止此类事件再次发生;3. 确保问题分派了正确支持人员,提高解决率;4. 根据问题优先级合理分派IT资源;5. 对事件记录做趋势性分析,主动提供预防性措施。过程测量指标1. 问题数量2. 问题解决率运维项目经理每月对问题处理进行监控和度量,收集问题处理数据,分析统计问题数据,编写问题报告。问题管理流程问题确认与受理问题来源:1. 不能查找出原因的事件需要上升到问题管理;2. 以往没有发生过的事件需要上升到问题管理;3. 通过对事件的趋势分析得出需要彻底解决的问题,如重复发生的事件;4. 通过监控或巡检得出的问题。问题可以从事件管理流程、售后服务和趋势分析等方面发现问
39、题,可以通过事件提交与其相关联的问题记录。问题登记和归类一线运维工程师发现问题后,经过分类整理,及时填写问题记录表,提交到问题管理负责人。派单问题管理负责人接到问题记录表后,分派问题负责人,问题负责人员成立问题分析小组。问题负责人必须保持问题的跟踪,直到问题关闭。问题调研和分析诊断问题负责人召集问题分析小组对问题进行调查研究,尝试让问题重现,找出问题产生的根本原因并制定解决方案,或采用变通方法,或采取相关的预防措施等,将问题的影响降至最小。确定临时措施1. 当问题查找出原因以后,可以作为已知错误,同样的故障就可以作为事件管理来处理,事件处理过程参照事件管理程序。2. 当相同的故障连续不断地发生
40、的时候,并且严重影响应用系统的不可用性时,问题负责人必须首先采取临时解决措施,首先恢复系统的可用性,以降低影响。3. 问题负责人经过分析判断,如果由于资源不足, 不能解决问题(包括软件资源、硬件资源、技术资源等方面),则把问题提交到三线支持(内部或外部供应商)解决。问题负责人把问题提交三线支持后,还必须负责继续跟踪问题状态,直到问题关闭。确定解决方案1. 问题负责人及问题分析小组通过问题分析,有了解决方案后,补充完善问题记录表,并进行评估,确定是否需要通过变更管理实施该解决方案,变更实施完成后回到问题管理进行问题回顾和评审。2. 变更管理参照变更管理程序。问题回顾和评审问题管理负责人召集问题负
41、责人及相关人员对整个问题的解决过程和结果进行回顾和评审,验证问题解决的效果。如果是属于重大问题的,还要组织评审会议,可能还需要邀请用户代表参加。补充问题记录表,形成会议纪要。问题归档问题负责人对问题解决过程中涉及的资料进行归档,并把问题解决方案加入到知识库中。问题关闭确认问题已经得到解决,所有资料已经归档后,问题负责人员负责关闭问题。问题报告问题解决后,一个月内收集如下信息,形成服务报告:1. 本月问题总数量;2. 本月已解决的问题数量;3. 本月未解决问题数;4. 本月问题分类情况;5. 分析本月问题所造成的影响及范围。IT系统运维服务项目变更管理目的变更管理的目的是保证变更在受控方式下正确
42、评估,批准和实施。减少和杜绝非授权变更,降低变更风险和对业务的影响。变更级别及定义变更级别定义简易变更简易变更是指在维护过程中对系统或服务所做出的各种改变,包括增补、移除和其他修改。说的再具体一点,变更的对象是两个,一个是IT基础架构,一个是IT服务(包括与流程和文档),与这两个对象相关的改变都要归入变更的范围。标准变更一线支持接到客户热线,直接作为事件处理,事件解决过程中涉及变更,直接实施。重大变更重大变更类似:服务器设施变更、通讯组网结构变化、批量数据的更改、系统大版本升级等这类影响面广,系统一旦不可用,用户反映强烈。要有详细的变更方案、步骤、计划、时间安排以及回退步骤等,而且方案需要经过
43、部门经理、公司主管领导的审批。重大变更需在提交变更记录,经过各级审批后,由运维组根据方案执行变更。紧急变更紧急变更包括:指影响关键业务系统正常运行的紧急事件、实施时间紧急的重大变更。由于时间紧迫,变更方案由双方领导直接审核后执行。变更流程描述变更确认受理由事件管理流程、问题管理流程、第三方提出变更请求,变更负责人确定是否需要受理变更。变更记录和分类若接受标准、重大变更申请,变更负责人或申请人填写变更记录表。变更负责人必须确定该变更请求的类别和优先级以便按照不同的流程执行后续变更动作。变更分类执行根据变更的不同类型,分别执行不同的变更流程,有标准变更、重大变更。变更回顾实施变更后需要作变更回顾,
44、要由变更管理负责人从技术和流程角度去回顾变更,确保变更得到了预期效果,对变更加以评定,并寻找流程的改进机会。变更关闭变更实施人员关闭变更请求。变更报告变更管理负责人每月对变更数量进行统计,对变更过程存在的问题进行分析,形成变更服务报告。变更的度量指标包括:1. 各种类型变更的数量;2. 变更期间的服务中断时间;3. 计划时间内完成的重大变更百分率;4. 未达到预期结果的变更数量。IT系统运维服务项目发布管理目的1. 确保与运维服务项目中软件系统的发布是可追溯的和安全的,确保只有正确的、经过批准和测试的版本才能被安装;2. 在发布的规划和试运行期间与市电子政务办进行沟通并考虑他们的期望;3. 确认所有最终发布软件正本的拷贝是安全可靠的,确保软