当前位置:文档之家› 曙光Gridview2.0安装维护手册2.0

曙光Gridview2.0安装维护手册2.0

Gridview2.0 安装维护手册Gridview2.0安装维护手册目录1、系统安装 01-1、安装条件 01-2、GRIDVIEW2.0安装前设置 01-3、GRIDVIEW2.0安装 (5)1-3--1、管理节点安装 (5)1-3--2、计算节点安装 (7)1-4、安装后的验证 (8)1-4--1、管理节点验证 (8)1-4--2、计算节点验证 (9)2、系统卸载 (10)2-1、管理节点卸载 (10)2-1--1、卸载步骤—计算中心版 (10)2-1--2、卸载步骤—数据中心版......................................................... 错误!未定义书签。

2-2、计算节点卸载 (10)2-2--1、批量卸载—计算中心版......................................................... 错误!未定义书签。

2-2--2、手动卸载—计算中心版......................................................... 错误!未定义书签。

2-2--3、批量卸载—数据中心版......................................................... 错误!未定义书签。

2-2--4、手动卸载—数据中心版......................................................... 错误!未定义书签。

3、系统维护 (11)3-1、配置文件 (11)3-1--1、安装配置文件 (11)3-1--2、PORTAL相关配置文件 (12)3-1--3、告警预处理相关配置文件 (12)3-1--4、LOG配置文件 (13)3-1--5、采集相关配置文件 (13)3-1--6、HIBERNATE配置文件 (16)3-1--7、作业调度管理进程配置文件 (18)3-2、设备信息导入及参数设置 (19)3-2--1、设备信息导入 (20)3-2--2、采集参数设置 (22)3-2--3、告警参数设置 (22)3-2--4、设备使用配置 (23)Gridview2.0安装维护手册3-3、运行状态检查 (24)3-3--1、采集器运行状态检查 (24)3-3--2、告警预处理服务运行状态检查 (25)3-3--3、TOMCAT服务运行状态检查 (25)3-3--4、作业调度管理进程状态检查 (25)3-4、故障处理 (25)3-4--1、网络故障 (25)3-4--2、应用程序故障 (25)3-5、系统日志 (26)3-5--1、采集系统日志 (27)3-5--2、告警预处理系统日志 (28)3-5--3、作业调度管理进程系统日志 (28)1、系统安装1-1、安装条件➢本软件支持的操作系统1-2、Gridview2.0安装前设置●确定集群各个节点的ip地址配置正确,确定集群各个节点的/etc/hosts文件内容完整并且正确。

●解压缩源程序安装包,并进入解压缩后产生的文件夹●进入tools/deploy_tool目录,运行命令make,将会出现如图1.1的界面:Gridview2.0安装维护手册图1.1 make程序主页面里面包含make程序的所有功能。

make程序的功能包含集群节点设置、集群ssh 无密码访问、系统时间设置、重起服务、帮助等●用户输入1并输入回车时,将进入集群节点设置的子程序,如图1.2所示。

该程序包含2个功能,功能一是察看集群所包含节点的名称,即要配置ssh无密码访问和系统时间的节点的名称;功能二是设置集群所包含节点的名称,即要配置ssh无密码访问和系统时间的节点的名称。

此时输入1并且输入回车键时,将进入功能一,输入2并输入回车键时,将进入功能2。

设置完成后,输入3并输入回车时,将退出到make程序主目录。

注意:节点名称要跟/etc/host的ip 地址设置保持一致。

功能二设置节点名称时,程序调用了vi编辑器,编写集群节点完成后,请用vi命令的保存方式保存数据。

图1.2 集群节点设置界面●设置好集群所包含的节点并返回到make程序主目录后,用户可以设置ssh无密码访问和系统时间。

用户输入2并且输入回车时,将进入ssh无密码访问功能的界面,如图1.3所示。

ssh 无密码访问功能包含2个子功能,功能一为检查某个用户的ssh访问是否不需要密码,此时输入1便进入了功能一,如图1.4所示,功能一将提示请输入待检查的用户名称,输入用户名称后该功能将会自动检查ssh无密码访问,检查结束后将返回检查结果,出现bad_connect:none 时,此时表明指定用户在该集群的指定节点上已经实现了ssh无密码访问。

如果出现bac_connect: node1->node2的提示或者类似的提示,则表明从node1连接node2时,该用户无法实现无密码Gridview2.0安装维护手册访问;在设置ssh无密码访问界面中输入2时,将进入设置ssh无密码程序,如图1.5所示。

根据提示,输入用户名和密码,如果输入的用户为普通用户时,还会提示是否共享了home目录,如果共享了home目录,这输入y或者yes,否则输入n或者no,此时该程序将自动设置好指定用户的ssh无密码访问。

注意:集群的所有节点的用户密码必须跟管理节点的密码一致。

图 1.3 ssh无密码访问功能的界面图 1.4 检查ssh无密码访问界面Gridview2.0安装维护手册图1.5 设置ssh无密码访问界面进入make 程序主页面后,输入3并输入回车时,将进入时间设置的界面,如图1.6所示。

输入1时将进入检查集群的系统时间的程序,如图1.7所示;输入2时将进入设置系统时间的程序,如图1.8所示。

注意:检查集群的系统时间时,只能精确到年月日,设置系统时间时,是设置成服务器的一个时刻的时间。

图1.6 时间设置界面Gridview2.0安装维护手册图1.7 检查集群的系统时间图1.8 设置集群的系统时间在gridview部署完成后,我们提供了重启服务的功能。

进入make 程序主页面后,输入4并输入回车时,将进入重启服务的界面,如图1.9所示。

在该界面下输入1并输入回车键,将重启作业调度服务;在改界面下输入2并输入回车键,将重起整个gridview的服务。

Gridview2.0安装维护手册图 1.9 重起服务界面●在make程序主界面,输入5后,将进入帮助界面,包含使用该软件的介绍。

●在make 程序主界面,输入6后,将退出make程序。

注意:建议将该make软件放在管理节点上,并且将其拷贝到管理员的私人文件夹下。

1-3、Gridview2.0安装安装计算中心版的gridview,请配好集群的ssh无密码访问和/etc/hosts文件以及操作系统的系统时间。

1-3--1、管理节点安装1-3--1-1、安装步骤按如下步骤安装:1.加压安装包gridview_2_0.tar2.进入解压目录gridview_2_03.修改配置文件manager.cfg,具体含义见3-1节配置文件4.执行安装脚本install_gridview_manager.sh5.等待脚本执行完成,则完成安装1-3--1-2、目录结构|----/opt/gridview/ 程序根目录|||----collector 采集程序主目录||----alarm 告警引擎主目录Gridview2.0安装维护手册||--- jobmanager 作业调度管理程序主目录||---conf 节点采集配置目录||---mysql5.1 数据库目录||----java jre目录||----ldd_patch 程序所需动态库目录||----tomcat tomcat目录||----tools 一些必要的rpm包等||----pbs/ dispatcher 作业调度资源管理器服务节点主目录||----pbs/ dispatcher-sched 作业调度调度器主目录||---- uninstall 卸载脚本目录Gridview2.0安装维护手册1-3--1-3、异常处理安装过程中可能出现的异常:1.gmond程序未启动检查/etc/init.d/gmond脚本是否存在,是否有可执行权限;如果文件存在并且可执行,则手动执行脚本/etc/init.d/gmond start;如果文件不存在,则从/opt/gridview/conf下拷贝至/etc/init.d下,如果是suse,则拷贝文件gmond_suse,并使用chkconfig –add 将gmond做成服务2.tomcatd未启动检查/etc/init.d/gridview_tomcatd脚本是否存在,是否有可执行权限;如果文件存在并且可执行,则手动执行脚本/etc/init.d/gridview_tomcatd start;如果文件不存在,则从/opt/gridview/conf下拷贝到/etc/init.d/下,并使用chkconfig –add gridview_tomcatd命令将tomcat做成服务如果经过上述步骤无法启动,查看java环境是否正确。

程序的java目录在/opt/gridview/java/jre1.6.0_133.安装完成后,导入配置文件失败检查配置文件各项,如果配置了需要监控的设备类型,检查该设备类型所有属性是否均设置,如有遗漏,则将其补全。

如果上一步无法解决问题。

检查后台mysql数据库是否启动,详见mysql无法启动一节。

4.Mysql未启动检查/etc/init.d/gridview_mysqld脚本是否存在,是否有可执行权限;如果文件存在且可以执行,则手动执行/etc/init.d/gridview_mysqld start,如果无法启动,查看后台日志,日志文件在/opt/gridview/mysql5.1/data/nodename.err,其中nodename为被安装节点的节点名。

可能出现的问题有:无法创建/tmp/目录下临时文件,检查磁盘空间是否够用5.Mysql已启动,数据库无法连接进入mysql安装目录,/opt/gridview/mysql5.1, 执行命令bin/mysql –uroot –pdawning123 ,进入mysql控制台后,执行命令use gridview_local看能否执行成功,如果被告知没有这个数据库,则退出mysql环境,手动执行sql/init_mysql.sh创建数据库。

1-3--2、计算节点安装1-3--2-1、安装步骤1.所有计算节点配置好ssh或rsh,确保登陆计算节点无需输入密码2.加压安装包gridview_2_0.tar3.进入解压目录gridview_2_04.补全node_list安装列表,修改node.cfg具体含义见3-1-1节Gridview2.0安装维护手册5.执行批量安装脚本install_gridview_all_node.sh1-3--2-2、目录结构|----/opt/gridview/ 程序根目录|||----collector 采集程序主目录||----conf 节点采集配置目录||----java jre目录||----ldd_patch 程序所需动态库目录||----tools 一些必要的rpm包等||----pbs/dispatcher 作业调度资源管理器执行程序安装目录||---- uninstall 卸载脚本目录1-3--2-3、异常处理1-4、安装后的验证1-4--1、管理节点验证1-4--1-1、Portal启动使用web浏览器登陆管理节点,在浏览器输入http://<serverip>:8080/gridview_portal, 如http://192.168.0.1:8080/gridview_portal,可以看到如下界面,则表示portal安装成功。

相关主题