北京北大软件工程发展有限公司
Beijing Beida Software Engineering Development Co.,Ltd.
信息采集和监控(发现问题)的方
案
修订记录
信息采集方案
信息采集的定义
信息采集是将非结构化信息从大量的网页、监控系统等抽取出来保存到结构化的数据库中的过程。
信息收集是信息得以利用的第一步,也是关键的一步。
信息收集工作的好坏,直接关系到整个信息管理工作的质量。
信息收集的原则
(1)准确性原则该原则要求所收集到的信息要真实,可靠。
当然,这个原则是信息收集工作的最基本的要求。
为达到这样的要求,信息收集者就必须对收集到的信息反复核实,不断检验,力求把误差减少到最低限度。
(2)全面性原则该原则要求所搜集到的信息要广泛,全面,完整。
只有广泛、全面地搜集信息,才能完整地反映管理活动和决策对象发展的全貌,为决策的科学性提供保障。
当然,实际所收集到的信息不可能做到绝对的全面完整,因此,如何在不完整、不完备的信息下做出科学的决策就是一个非常值得探讨的问题。
(3)时效性原则信息的利用价值取决于该信息是否能及时地提供,即它的时效性。
信息只有及时、迅速地提供给它的使用者才能有效地发挥作用。
持别是决策对信息的要求是“事前”的消息和情报,而不是“马后炮”。
所以,只有信息是“事前”的,对决策才是有效的。
信息采集的方法
(1)社会调查社会调查是获得真实可靠信息的重要手段。
社会调查是指运用观察、询问等方法直接从社会中了解情况,收集资料和数据的活动。
利用社会调查收集到的信息是第一手资料,因而比较接近社会,接近生活,容易做到真实、可靠。
(2)建立监控系统管理活动要求信息准确,全面,及时。
为了达到这样的要求靠单一渠道收集信息足远远不够的。
可以靠建立监控系统,多方面的采集信息,不仅仅准确,而且获取信息有效、快捷、安全。
(3)从文献中获取信息文献是前人留下的宝贵财富,是知识的集合体,如何在数量庞大,高度分散的文献中找到所需要的有价值的信息足情报检索所研究的内容。
监控方案
监控方案涉及到如何监控,需要监控什么信息。
还需要一套完善的监控系统。
为了直观的表示监控系统(除非特殊说明都指操作系统)和应用的运行状态,能让不熟悉运维知识的运维工程师看明白当前的运行状态,最好的方法就是运用图的方式将这些系统和应用之间的逻辑关系展示出来。
根据系统和业务两种区分可以将它们分成三张图。
1.系统架构图:表示所有系统的堆叠关系,例如物理服务器和虚拟服务器用不同的形式在图中展示出来,通过此图一眼就能看到那些系统存在问题,存在什么问题。
2.业务逻辑图:单独表示业务逻辑,将业务逻辑之间的依赖关系和其他关系表示出来,便于在发现整体故障时,确定哪里存在问题能导致整体故障的发生,通过此图一眼就能看到那些业务存在问题,存在什么问题。
3.软件架构图:表示业务与系统的对应关系,即那些业务运行在哪些系统中,或每个系统运行着那些业务,便于当出现问题时该去排查哪些系统或者哪些模块。
监控方法:
1.硬件层面:当前服务器的实际使用情况,例如服务器的数量,主机名称(规范的FQDN),IP地址(有多少地址写多少地址),内存大小及使用情况,操作系统类别,管理方式和管理信息(如何远程登录、用户名和密码等);如果可能,最好包含有网络设备的相关信息,如与服务器的连接方式、带宽等相关信息。
2.操作系统层面:不管操作系统是虚拟的还是非虚拟的,对于监控来说都是一个完整的监控实体,与硬件层面的服务器一样,它也需要确切的知道主机名称(规范的FQDN),IP地址(有多少地址写多少地址,并区分管理地址和业务地址等),操作系统类别,管理方式和管理信息(如何远程登录、用户名和密码等)。
3.软件(业务)层面:每一个业务模块的名称、提供的功能,依赖关系(该业务模块需要哪些其他的业务模块,哪些业务模块需要该业务模块),进程或服务名称,监听的IP地址和端口(socket),每一个业务模块正常运行时的可监控状态(如返回值是多少正常,输出什么字符串是正常等)。
4.软件层面中每一个业务模块与操作系统层面的对应关系,业务模块需要操
作系统中那些软件包(依赖关系)、安装路径、可用的诊断程序和维护工具等。