当前位置:文档之家› 服务器巡检操作规划

服务器巡检操作规划

服务器巡检报告一、服务器巡检的重要性服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,提高平台的整体服务水平。

同时可根据日常维护和相关记录,为平台后续发展提供整体建设规划和建议。

二、日常巡检内容包括以下方面:●机房环境温度、湿度巡检●服务器外壳整体检查●服务器清洁程度●服务器的外表温度●服务器风扇运行监测●服务器电源连接检查●服务器网络接口检查●服务器LED警示屏幕检查●服务器硬盘、电源、网卡等设备灯的状态●服务器硬件磁盘、内存、cpu、网卡使用情况●服务器系统日志●运行与服务器上应用是否可用●应用系统日志检查(根据实际情况执行)●杀毒软件的检查三、巡检内容详细说明1、服务器硬件巡检主要内容2、操作系统检查检查项检查操作参考标准windows操作系统版本检查执行命令winver.exelinux操作系统版本检查执行命令uname –a服务器连接系统网络情况在其它机器上采用ping命令观察5分钟是否有丢包情况windows操作系统网络配置情况执行命令ipconfig /all IP地址、子网掩码正确Linux操作系统网络配置情况执行命令ifconfig –a IP地址、子网掩码正确能够正常登陆到系统windows系统账户检查利用administrator身份、口令登陆Linux系统账户检查利用root身份、口令登陆能够正常登陆到系统3、性能检查一、Windows系统服务器性能查询(1)内存、cpu使用情况巡检用命令taskmgr.exe打开任务管理器检查方法:Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序;性能CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图表可以知道当前使用的处理时间是多少。

CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。

PF使用情况:正被系统使用的页面文件的量。

页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值。

总数:显示计算机上正在运行的句柄、线程、进程的总数。

认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存,“总数”值则与“页面文件使用记录”图表中显示的值相同。

物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存”显示当前用于映射打开文件的页面的物理内存。

内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存,由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。

(2)硬盘使用情况,A、检查方法:Windows下通过查看‘我的电脑’—‘管理’—‘磁盘管理’可以查看磁盘分区与对应分区使用情况,使用率不要超过80%。

B、定期检查磁盘的错误信息,选择分区‘属性’—‘工具’—‘开始检查’。

C、定期整理磁盘碎片,选择分区‘属性’—‘工具’—‘开始整理’。

二、linux系统服务器性能查询(1)内存、cpu使用情况巡检用命令top –c查询统计信息区前五行是系统整体的统计信息。

第一行是任务队列信息,同 uptime 命令的执行结果。

其内容如下:16:35:22 当前时间up 17 day 5:45 系统运行时间,格式为时:分4 user 当前登录用户数load average:0.15, 0.15, 0.08 系统负载,即任务队列的平均长度。

三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。

Tasks: 366 total 进程总数1 running 正在运行的进程数364 sleeping 睡眠的进程数0 stopped 停止的进程数1 zombie 僵尸进程数Cpu(s): 0.3% us 用户空间占用CPU百分比0.0% sy 内核空间占用CPU百分比0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比99.9% id 空闲CPU百分比0.0% wa 等待输入输出的CPU时间百分比0.0% hi0.0% si第五行以后内容是内存信息。

内容如下:Mem:16429816ktotal物理内存总量16366812kused使用的物理内存总量63004k free 空闲内存总量377544kbuffers用作内核缓存的内存量Swap:18481144ktotal交换区总量320k used 使用的交换区总量18480824kfree空闲交换区总量7835708k cached 缓冲的交换区总量。

内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小。

相应的内存再次被换出时可不必再对交换区写入。

PID 每个进程的父进程ID。

USER 每个进程所有者的用户名。

PR 每个进程的优先级别。

NI 该进程的优先级值。

VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。

单位是KB。

RES 该进程占用的物理内存的总数量,单位是KB。

SHR 该进程使用共享内存的数量。

S 该进程的状态。

其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态。

CPU % 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。

MEM% 该进程占用的物理内存占总内存的百分比。

TIME+ 该进程自启动以来所占用的总CPU时间。

如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。

且标题会变成CTIME。

COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。

内存中的进程会有一个完整的命令行。

4、安全检查一、Windows系统服务器安全检查示关于计算机及其操作系统的详细配置信息systeminfo系统UP时间应该为上次重启导目前的时间系统日志、应用日志、安全日志eventvwr 事件查看器查看系统日志无错误日志或错误日志不会影响系统的正常运行系统端口检查netstat –a 指显示出提供对于服务的端口,无关的端口一律关闭symantec杀毒软件检查打开杀毒软件,查看防病毒和防间谍软件防护的扫描日志、风险日志、系统日志。

防病毒是否及时更新更新时间差应不超一个星期(1)系统信息检查显示关于计算机及其操作系统的详细配置信息,包括操作系统配置、安全信息、产品 ID 和硬件属性,如 RAM、磁盘空间和网卡,系统运行时间。

(2)服务器重要的系统日志检查检查方法:windows系统下通过事件查看器进行查看,重点记录其错误日志号即可,通过错误日志号对错误进行定位解决,打开事件查看器命令eventvwr。

事件查看器里面的日志放在电脑里面的c:\windows\system32\config目录,AppEvent.evt即“应用程序”日志,SysEvent.evt即“系统”日志,SecEvent.evt即“安全性”日志A、应用程序日志,包含由应用程序或系统程序记录的事件,主要记录程序运行方面的事件,例如数据库程序可以在应用程序日志中记录文件错误,程序开发人员可以自行决定监视哪些事件。

如果某个应用程序出现崩溃情况,那么我们可以从程序事件日志中找到相应的记录。

B、安全性日志,记录了诸如有效和无效的登录尝试等事件,以及与资源使用相关的事件,例如创建、打开或删除文件或其他对象,系统管理员可以指定在安全性日志中记录什么事件。

C、系统日志,包含Windows系统组件记录的事件,例如在启动过程中加载驱动程序或其他系统组件失败将记录在系统日志中。

(3)系统端口检查查看开启了哪些端口,显示所有连接和监听端口。

所接开启端口的服务。

二、 linux系统服务器安全检查检查项目检查操作参考标准检查当前登陆用户执行命令who 除了管理员外没有其他用户登录文件系统占用率执行命令df –ah 没有文件系统超过80%的现象系统账户安全检查执行命令more /etc/passwd执行命令more /etc/shadow没有异常账户信息存在文件系统日志执行命令dmesg 无错误日志或错误日志不会影响系统的正常运行系统开放端口检查执行命令netstat 指显示出提供对于服务的端口,无关的端口一律关闭系统登陆情况检查执行命令lastlog 无异常账户或异常时间登陆显示登录在系统里的用户,检查他们正在做什么以及他们的处理器使用状况。

属于常用的安全方面的命令。

执行命令w 无异常账户登陆或在做一些危险操作。

相关主题