服务器运维管理指南.doc
XXXX有限公司服务器运维管理指南XXXX有限公司运维服务部2012/8/30一、文档简介2二、文档目的3三、文档范围3四、事件处理流程4五、具体操作说明4 1)服务器硬件管理4 2)服务器系统管理9 1. Windows系统管理10 2. Linux系统管理11六、相关文档15文档简介本文档根据桑菲消费通信服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。文档目的标准服务器故障处理方法指引,服务器管理知识库积累。文档范围服务器硬件故障判断与标准处理操作服务器系统日常性能检测与标准检测事件处理流程具体操作说明服务器硬件管理1.检查与故障判断:服务器硬件的主动检查方式主要分三种:设备面板指示灯检查硬件系统日志检查第三方工具检查1)面板指示灯检查IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统过热报警灯.硬盘槽还有硬盘指示灯。HP服务器上面指示灯一般为UID,内部和外部健康灯,其他就是电源网口灯了,DELL的机种有的上面有风扇,内存,CPU,指示灯情况,图标都是很直观的,其它服务器与IBM,HP的差不多。图示说明详细描述: 2)系统日志检查"检查内容" "硬件历史异常报错信息" "计算机管理->系统工具->事件查看器,查看系统日志" "重点关注:红色高危事件信息、日常频繁硬件报错信息" "备注:查看硬件历史异常故障情况,分析硬件性能与使用生命周期" 3)第三方检测工具检查"检查内容" "硬件历史异常报错信息" "HP诊断工具: " "打开开始——程序——HP System Tools——HP Insight Diagnostics online " "Edition for Windows——HP Insight Diagnostics online Edition for " "Windows。 " "DELL诊断工具: " "第三方硬件设备诊断工具" "IBM诊断工具: " "IBM Systems Director 、 IBM System