, Nagios安装,客户端
rpm -ivh, http://www.aminglinux.com/bbs/data/p_w_upload/forum/month_1211/epel -释放- 6 - 7. - noarch.rpm
yum安装- y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
vim/etc/nagios/nrpe.cfg,
找到“allowed_hosts=127.0.0.1”改为“后面的ip为服务端ip,,
找到“dont_blame_nrpe=0”改为,",
注:服务端获得客户端服务状态时,是通过nrpe服务这个中间介质来取得的。
首先进入服务端,编辑配置文件。
cd/etc/nagios/conf.d/
vim 192.168.1.51。cfg
加入如下配置:
定义主机{
使用linux服务器
host_name 192.168.1.51
1.51别名地址192.168.1.51
}
定义服务{
使用通用服务
host_name 192.168.1.51
service_description check_ping
check_command check_ping ! 100.0, 20% ! 200.0, 50%
normal_check_interval max_check_attempts 5 1
}
定义服务{
使用通用服务
host_name 192.168.1.51
service_description check_ssh
check_command check_ssh
normal_check_interval max_check_attempts 5 1
60 notification_interval}
定义服务{
使用通用服务
host_name 192.168.1.51
service_description check_http
check_command check_http
normal_check_interval max_check_attempts 5 1
}
检查一下配置文件
6。配置文件的简单说明
我们定义的配置文件中一共监控了三个服务:ssh,平,http这三个项目是使用本地的nagios工具去连接远程机器,也就是说即使客户端没有安装nagios-plugins以及nrpe也是可以监控到的。其他的一些服务诸如负载,磁盘使用等是需要服务端通过nrpe去连接到远程主机获得信息,所以需要远程主机安装nrpe服务以及相应的执行脚本(nagios-plugins)
max_check_attempts 5, #当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
normal_check_interval 1 #重新检测的时间间隔,单位是分钟,默认是3分钟
notification_interval 60 #在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
以上服务不依赖于客户端nrpe服务,我们可以想象,我们在自己电脑上可以使用平或者telnet探测远程任何一台机器是否存活,是否开启某个端口或服务。而当我们想要检测客户端上的某个具体服务的情况时,就需要借助于nrpe了,比如想知道客户端机器的负责或磁盘使用情况。
监控http ssh平可以不用借助nrpe,也就是说客户端不用安装nrpe。