服务器及存储设备维护保修服务技术方案.doc
《服务器及存储设备维护保修服务技术方案.doc》由会员分享,可在线阅读,更多相关《服务器及存储设备维护保修服务技术方案.doc(20页珍藏版)》请在沃文网上搜索。
1、XX公司IBM服务器及相关存储设备维保方案文件编号文件版本V1.0编制日期2007.12.18审核日期XXXX公司IBM服务器及存储设备维护方案目 录前言3项目背景及需求3一、服务方案制定原则3二、保修服务内容及标准31) 故障排除42) 定期巡检43) 培训44) 增值服务4服务标准5三、服务实施细则51) 前期工作52) 故障预防建议53) 故障排除64) AIX常用故障诊断技术65) 巡检86) 备份与恢复策略97) 项目实施计划118) 工作结果与工作报告11四、服务保障措施121) 备件保障132) 本地化服务133) 组织及人员保障134) 安全条款155) 巡检156) 服务监督
2、16五、应急预案161) 备机替换162) 紧急调用工程师163) 紧急调用备件174) 紧急调用第三方资源175) 远程诊断17六、本公司在本项目中的优势181)悠久的服务历史182)切实有效的服务保障方案19前言非常感谢XXXX公司领导给予 我公司的机会,我们怀着极大的热情精心组织、精心设计有关XXXX公司IBM小型机及相关存储的保修方案,特提交此保修服务方案建议书供领导及相关专家参阅。项目背景及需求中国XXXX公司为了满足业务需要,采用了大量的IBM小型机及相关存储设备。为了保证业务的可持续运行,需要有专业的厂商提供保证硬件环境7X24可用性的能力。而作为上市公司,XXXX公司希望在保证
3、满足质量要求的前提下有更合理的最具性价的服务方案及相关厂商。服务级别:7*24服务期:12个月#机型基本配置数量单价单位小计17029-6C3P615 2-WAY 1.45GHZ/2GB/2*73GB/DVD-ROM1¥19,600台¥19,60021722-60UTotalStorage FAStT600 Storage1¥18,500台¥18,500合计:¥38,100.00人民币金额(大写):叁万捌仟壹佰元整一、服务方案制定原则本方案主要针对XXXX公司的IBM服务器主机及相关的操作系统、数据库、系统软件制定合理科学的维保策略。方案的制定遵循以下原则:l 业务为中心:本项目的最终目标是保
4、证业务系统的安全和可靠运行。包括计算机系统的可靠运行和业务数据的安全保证,我们将动用一切有效的措施手段,力求业务系统万无一失,我们的目标是:“非正常性停机时间为零”。l 重在措施:注重预防。我们将在传统的被动式服务的基础上提供主动式的服务,和客户一起做好系统的监控维护工作。采取以预防为主的策略,把故障隐患消灭在萌芽中。服务组织。服务组织管理和流程管理是项目成功得关键。我们将在责任工程师(项目经理) 的统一调度下,指挥技术、应用、商务及服务监督人员,在售前、服务实施、售后的各个环节紧密与客户方配合l 追求最佳性价比:服务的级别意味着客户的成本,我们在保障高标准服务的前提下,努力通过精心组织、精心
5、实施来降低客户的成本,同时为客户提供更多的增值服务。二、保修服务内容及标准本方案针对XXXX公司上IBM 服务器及相关的硬件设备及操作系统保修服务以及数据库协助保修服务、协助应用软件升级、应用软件的备份等服务内容。主要服务项目如下:1) 故障排除在规定时限内排除故障恢复系统运行,包括故障定位、部件更换、数据恢复的全部工作,不在另外收取任何费用。2) 定期巡检定期对系统进行预防性维护,包括检查系统状态、设备清洁、系统备份,以及与客户工程师的技术交流。3) 培训我们将免费提供针对项目的技术培训和技术交流。包括:现场培训:主要在巡检及项目实施过程中进行,由我公司工程师结合实际情况,对工程设备的安装调
6、试、使用和维护进行详细的讲解,达到客户相关人员能够自主使用和维护系统设备的目标。专业技术培训: 通过培训使相关技术人员能有效管理IBM服务器、监控、日常操作维护,对集群环境、AIX环境、系统性能优化等特别予以关注。我公司将免费提供培训师资、教材及搭建培训软硬件环境。培训的具体地点及安排由我公司和用户协商而定。参考课程如下:l AIX系统及网络管理l 集群高可用方案HACMPl 故障定位与系统运维常见问题4) 增值服务l 咨询服务:解答客户在系统使用中的问题。可通过电话解答客户非保修设备使用中的技术问题。一般情况下,指导客户解决问题,特殊情况下,可到客户现场指导并解决问题,这样可以有效地提高客户
7、的系统管理水平,降低系统的人为故障率。定期发送有关资料,使客户及时跟踪掌握相关IT新技术及新产品,互相交流系统使用及维护方面的经验。协助客户建立健全规范的管理制度和系统使用维护的技术流程及规范。建立系统的配置档案和升级维护档案,定期提交系统维护及管理报告。l 系统升级、扩充为客户提供系统升级、扩充、改造、迁移等服务。结合客户的实际情况,为客户详细制订切实可行的技术方案和合理的费用计划,并可提供现场的实施工作。如客户需要搬迁设备,我们可以为客户制订安全周密的搬迁计划,并负责实施,保证客户设备搬迁后的正常运转,省去了客户自行搬迁所带来的烦恼。l 协调工作协调原厂商(包括软硬件)的维护和维修工作。定
8、期召开例会,双方交流,向客户方领导汇报工作并听取领导及技术人员的意见和建议。服务标准l 服务工作时间:7X24 X 365电话受理服务请求或帮助客户解决技术问题。l 响应时间:接到报修后30分钟内予以实质性响应,工程师8小时内到达服务现场。l 故障恢复时间:接到报修后24个小时内恢复系统正常运行。l 服务热线:项目经理:张旭 13501177867 24小时手机800-810-7333 (全国免费服务热线)010-51656969-101(总调度长/工作时间)l 现场服务规范:详见金支点公司工程师规范l 保密条款金支点公司将严格遵循保密协议,凡涉及客户的机型配置、IP地址、软件等信息不得向第三
9、方泄露,维护过程中如需涉及客户系统的数据信息,必须先通过客户方认可,维护工作的数据信息(无论是打印或介质上的数据信息)不得带离客户工作现场。三、服务实施细则1) 前期工作在保修合同生效前,金支点将派出硬件工程师和系统软件工程师前往客户现场,对现场的IBM P615、DS4300及相关网络设备进行测试,并对运行情况做好文档记录。然后对设备进行必要的清洁、保养和维护,使设备处于良好的运行状态。施工交底 依据合同明确服务标准、工作流程、联系方式;建立设备档案 详细记录设备型号、出厂编号、版本号、工作状态;场地环境检查 包括供电装置、电源电压、接地和室内湿度、温度、温变梯度、空气洁净度、防雷措施等进行
10、检查,对问题隐患提出改进建议;数据备份 在客户方配合下,将操作系统、应用程序、应用数据等做一次完整备份交客户保管以备使用;现场培训与交流;制定服务个案 根据详细系统配置制定XXXXIBM服务器服务实施计划书,详细描述保修服务内容、人员组织分工、工作标准、服务流程、应急预案、现场备件清单、投诉管理、突发或不可预测事件管理等内容,报双方领导批复后执行;承诺现场备件到位,同时在北京中心备件库中配备或补充本案专用备件,配备相应的系统及软件环境。2) 故障预防建议系统工程师通过预防性检查对系统硬件进行检测和诊断,对系统中潜在的硬件故障采取预防措施。如果某些部件出现无法恢复的故障,系统工程师将尽快予以修理
11、更换。维护期内提供定期巡检服务。系统工程师定期巡检的目的在于通过巡检及时发现和纠正可能出现的硬件和系统问题, 从而在最大程度上为设备的连续稳定运行提供保证, 巡检内容主要包括:1)服务器主机系统的运行状态;2)网络设备的运行状态;3)外部设备(包括磁盘阵列)运行情况;4)所有连接接口,CABLE, 电源等可能容易导致设备出现问题的敏感部件;5)检查系统 Error log;6)协助用户机房技术人员解决和分析日常设备运行中出现的未解决问题。 3) 故障排除保修合同生效后,系统发生故障后每次服务流程如下:l 报修系统发生故障,客户可在第一时间内与金支点项目经理(责任工程师)取得联系,说明客户单位、
12、故障机型,尽可能说明故障现象以及可能的故障原因。客户也可与金支点北京服务中心直接联系,服务中心调度长在第一时间内与金支点项目经理取得联系,北京服务中心的SMS系统会全程跟踪本次服务。l 响应金支点项目经理会立即在响应时间(本项目为30分钟)与客户现场工程师取得联系,取得详细的故障信息,做出相应的判断,在电话中与客户工程师互动交流,首先排除因系统参数设定、使用中的软性故障,如果未能排除故障则服务工程师立即准备赴现场服务。l 现场服务服务工程师携带相应备件赴用户现场进行维修。首先进行现场诊断,分析锁定故障部件,更换部件或调整参数,数据恢复,直至系统恢复正常运行。每次现场服务完成后,由金支点工程师填
13、写现场工作日志,由客户方代表确认并签署意见后交公司存档。如第一次现场服务不能解决故障,则立即启动应急预案。l 第三方配合金支点公司承诺:只要是金支点所保的系统发生故障,我们的服务工程师必须在第一时间内赶赴客户现场。不论是系统硬件、操作系统故障,还是非金支点承担的网络、应用程序故障,或者系统升级改造、系统迁移等,金支点服务工程师将积极配合客户完成系统维护工作,绝不会因扯皮推卸责任而损害客户利益。4) AIX常用故障诊断技术 计算机故障类型以及故障的诊断手段有很多,对于AIX小型机的故障我们通常采取以下2种诊断方式: 硬件故障诊断,诊断并排除由硬件引起的故障; 软件故障诊断,诊断并排除由软件(操作
14、系统和应用软件如Oracle数据库、中间件等)引起的故障软件故障诊断由于软件故障情况错综复杂,通常我们常用以下命令来查看系统状态。 l # lsdev Cc adapter列出各I/O卡及设备的所有相关信息:如逻辑单元号,硬件地址及设备文件名等。l # ps -ef 列出正在运行的所有进程的各种信息:如进程号及进程名等。 l # netstat rn列出网卡状态及路由信息等。l # ifconfig -a列出网卡状态及网络配置信息。 l # df列出已加载的逻辑卷及其大小信息。 l # lsvg -o列出已加载的逻辑卷及其加载位置。 l # oslevel s# uname a列出系统ID号,
15、OS版本及用户权限等信息。 l # hostname列出系统网络名称。 l # lsdev Cc disk显示磁盘各种信息,如磁盘大小,包含的逻辑卷,设备名称等。l # lsvg l vgname显示逻辑卷组信息,如包含哪些物理盘及逻辑卷等。 网络故障 l 如需修改网络地址、主机名等,一定要用smitty mktcpip 命令l 查看网卡状态: ifconfig -aHardware Station Crd Hardware Net-Interface Path Address In# state name unit state8/20/5/1 0x0800097843FB 0 up lan0
16、 up l 确认网络地址:# ifconfig en0 l 启动网卡:# ifconfig en0 up l 网络不通的诊断过程:Ifconfig -a 查看网卡是否启动 (up)ping 自己网卡地址 (ip 地址)ping其它机器地址,如不通,在其机器上用lanscan 命令得知 station address,然后linkloop station_address 来确认网线及集成器是否有问题。在同一网中, subnetmask 应一致。 l 配置网关手动加网关:/usr/sbin/route add default 20.08.28.98 1把网关自动加入系统中vi /etc/rc.co
17、nfig.d / netconf: ROUTE_DESTINATION 0=defaultROUTE_GATEWAY 0=20.08.28.98 ROUTE_COUNT 0=1 : /sbin/init.d/net 将执行:/usr/sbin/route add default 20.08.28.98 1命令 netstat -rn 查看路由表 另外也可用 set_parms addl_netwrk 来设缺省路由。Oracle数据库预防与检测协助因为采用预防为主的策略,目前我们知道仅仅靠电话支持服务和紧急救援服务不是解决ORACLE数据库问题的根本方法,因为这些方法无法避免和预防ORACLE突
18、发问题的产生。为使生产系统能够更加安全,高效地运行,避免ORACLE数据库因意外问题而带来的损失,因此用户需要定期的数据库系统维护服务,我公司将派工程师为用户定期巡检。定期巡检与检测服务可以享受到以下好处 加快应用系统的实施周期 规范化客户的数据库维护工作 最大限度地提高系统的可用性 通过高水平的系统维护最大限度的降低系统停机的时间 在现场进行数据库的监控和信息的收集,缩短问题的解决时间 将ORACLE的经验和技术带给您的支持队伍 完善和增强现有系统维护人员的能力 得到专门的技术支持资源,保证技术支持工程师熟悉现场的配置和环境 与我ORACLE工程师共同工作,以更高效的方式提高问题解决能力 把
19、 ORACLE资深支持工程师的技术和经验传授给您的系统维护人员定期巡检与检测服务承诺 定期对系统进行全面的检查,给出详细的报告,根据检查结果给出相应建议和改进方案 检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患 检查数据库空间的使用情况 数据库的备份和恢复 协助解决数据库维护和开发过程中出现的问题 提出检查报告和建议以及改进方案5) 巡检定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题,从而在最大程度上为系统的连续稳定运行提供保证,巡检工作主要包括: 主机系统的运行状态,对系统CPU、内存、I/O状态、进程等检查;对系统设置、日志文件、Error Report进行检查分析,
20、清理系统中的日志文件和垃圾文件; 外部设备运行状态,对磁盘阵列、磁带机、外置光驱、维护终端等的状态、设置进行检查;对风扇、后备电池、磁盘、磁带、键盘等敏感部件进行重点检查,如有故障征兆则进行先期更换; 数据备份; 网络设备的运行状态; 连接件检查,对连接插头、电缆、电源插座等进行检查; 环境检查,包括电源电压、接地和室内温度、湿度、空气洁净度等; 清洁保养,清除机箱、滤清器内的灰尘与异物; 系统优化,协助客户对OS进行系统性能调整和系统优化,提高系统效率;进行相关的安全性进程检查; 技术交流,双方技术人员分析和解决日常运行中出现的未解决问题; 工作报告,在对系统进行全面的检查后,给出详细的报告
21、,根据检查结果给出相应建议和改进方案。北京金支点技术服务有限公司为XXXX公司提供每三个月一次的全面巡检,并出具详细的巡检报告,由金支点工程师填写,由客户方代表确认并签署意见后交公司存档,方便XXXX公司控制和管理。6) 备份与恢复策略随着信息技术的广泛应用,计算机系统的可靠性对生产系统的影响越来越大。作为IT服务的提供者,我们将仔细、全面地考虑并且制订备份与恢复策略。操作系统备份以系统卷为主,必须建立完整的系统备份档案,保证系统宕机时能及时恢复系统原有状态,包括此系统下运行的所有相关软件的配置。双机热备份软件应按应用系统的实际配置情况制定相关的数据备份计划,如卷组备份、卷备份、文件系统备份、
22、文件备份等。应用系统的数据备份应由应用部门根据应用的实际情况列出所有相关数据的连接关系,以便制定出一份详细的数据备份计划,为数据恢复提供一份完整的依据。 我公司系统工程师将为用户制定一份完整的系统备份方案,在日常维护的过程中有义务协助用户做好系统的数据备份工作,并提供相关的技术支持,用户备份的介质将存放在用户处,以便故障的恢复。当用户系统出现故障之后,我公司的系统工程师将在用户的故障现场,开始进行故障的排除工作。需要用备份数据做系统恢复时,用户方需提供完整的数据备份。系统工程师还将对用户提供系统升级和安装补丁的工作。若涉及非系统软件的补丁,只要用户提供补丁,我们也承诺协助用户完成安装任务。7)
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 服务器 存储 设备 维护 保修 服务 技术 方案