1.5 nagios监控客户端1

, Nagios安装,客户端

rpm -ivh, http://www.aminglinux.com/bbs/data/p_w_upload/forum/month_1211/epel -释放- 6 - 7. - noarch.rpm

yum安装- y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe 

vim/etc/nagios/nrpe.cfg,

找到“allowed_hosts=127.0.0.1”改为“后面的ip为服务端ip,,

找到“dont_blame_nrpe=0”改为,",


注:服务端获得客户端服务状态时,是通过nrpe服务这个中间介质来取得的。


首先进入服务端,编辑配置文件。

cd/etc/nagios/conf.d/

vim 192.168.1.51。cfg

加入如下配置:

定义主机{

使用linux服务器

host_name 192.168.1.51

1.51别名地址192.168.1.51

}

定义服务{

使用通用服务

host_name 192.168.1.51

service_description check_ping

check_command check_ping ! 100.0, 20% ! 200.0, 50%

normal_check_interval max_check_attempts 5 1

}

定义服务{

使用通用服务

host_name 192.168.1.51

service_description check_ssh

check_command check_ssh

normal_check_interval max_check_attempts 5 1

60 notification_interval}

定义服务{

使用通用服务

host_name 192.168.1.51

service_description check_http

check_command check_http

normal_check_interval max_check_attempts 5 1

}


检查一下配置文件

6。配置文件的简单说明

我们定义的配置文件中一共监控了三个服务:ssh,平,http这三个项目是使用本地的nagios工具去连接远程机器,也就是说即使客户端没有安装nagios-plugins以及nrpe也是可以监控到的。其他的一些服务诸如负载,磁盘使用等是需要服务端通过nrpe去连接到远程主机获得信息,所以需要远程主机安装nrpe服务以及相应的执行脚本(nagios-plugins)

max_check_attempts 5, #当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警

normal_check_interval 1 #重新检测的时间间隔,单位是分钟,默认是3分钟

notification_interval 60 #在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。


以上服务不依赖于客户端nrpe服务,我们可以想象,我们在自己电脑上可以使用平或者telnet探测远程任何一台机器是否存活,是否开启某个端口或服务。而当我们想要检测客户端上的某个具体服务的情况时,就需要借助于nrpe了,比如想知道客户端机器的负责或磁盘使用情况。


监控http ssh平可以不用借助nrpe,也就是说客户端不用安装nrpe。


1.5 nagios监控客户端1