在早期的版本中Kubernetes提供了heapster, influxDB, grafana的组合来监控系统,现在更加流行的监控工具是普罗米修斯,普罗米修斯是谷歌内部监控报警系统的开源版本
Kubernetes集群的监控方案目前主要有以下几种方案:
1, Heapster: Heapster是一个集群范围的监控和数据聚合工具,以圆荚体的形式运行在集群中。
2, metrics-server: metrics-server也是一个集群范围内的资源数据聚合工具,是Heapster的替代品,同样的,metrics-server也只是显示数据,并不提供数据存储服务。
3, cAdvisor: cAdvisor是谷歌开源的容器资源监控和性能分析工具,它是专门为容器而生,本身也支持码头工人容器,在Kubernetes中,我们不需要单独去安装,cAdvisor作为kubelet内置的一部分程序可以直接使用。
4, Kube-state-metrics: Kube-state-metrics通过监听API服务器生成有关资源对象的状态指标,比如部署节点,仓,需要注意的是Kube-state-metrics只是简单提供一个指标数据,并不会存储这些指标数据,所以我们可以使用普罗米修斯来抓取这些数据然后存储。
普罗米修斯相比于其他传统监控工具主要有以下几个特点:
具有由指标名称和键/值对标识的时间序列数据的多维数据模型
有一个灵活的查询语言
不依赖分布式存储,只和本地磁盘有关
通过HTTP的服务拉取时间序列数据
也支持推送的方式来添加时间序列数据
还支持通过服务发现或静态配置发现目标
多种图形和仪表板支持
普罗米修斯由多个组件组成,但是其中许多组件是可选的:
普罗米修斯服务器:用于抓取指标,存储时间序列数据
出口国:暴露指标让任务来抓
pushgateway:推动的方式将指标数据推送到该网关
alertmanager:处理报警的报警组件
adhoc网络:用于数据查询
1,创建独立的命名空间
<代码> apiVersion: v1 :名称空间 元数据: 名称:kube-ops 代码>
2,以configmap的形式管理配置文件prometheus.yml
<代码> apiVersion: v1 :ConfigMap 元数据: 名称:prometheus-config 名称空间:kube-ops 数据: 普罗米修斯。yml: | 全球: scrape_interval: 15秒 scrape_timeout: 15秒 scrape_configs: ——job_name:‘普罗米修斯’ static_configs: ——目标(“localhost: 9090”): 代码>
配置文件普罗米修斯。yml中包含了3个模块:全球、rule_files和scrape_configs
其中全球模块控制普罗米修斯服务器的全局配置
rule_files模块制定了规则所在的位置,普罗米修斯可以根据这个配置加载规则,用于生成新的时间序列数据或者报警信息,当前我们没有配置任何规则
scrape_configs用于控制普罗米修斯监控哪些资源。
在默认的配置里有一个单独的工作,叫做普罗米修斯,它采集普罗米修斯服务本身的时间序列数据。这个工作包含了一个单独的,静态配置的目标:监听本地主机上的9090端口。
普罗米修斯默认会通过目标的/度量路径采集指标。所以,默认的工作通过URL: http://localhost: 9090/数据采集指标。
3,配置rbac认证
<代码> apiVersion: v1 :ServiceAccount 元数据: 名称:普罗米修斯 名称空间:kube-ops --- apiVersion: rbac.authorization.k8s.io/v1 :ClusterRole 元数据: 名称:普罗米修斯 规则: - apiGroups: ——“” 资源: ——节点 ——服务 ——端点 ——豆荚 -节点/代理 动词: ——得到 ——列表 - - - - - -看 - apiGroups: ——“” 资源: ——configmaps -节点/指标 动词: ——得到 - nonResourceURLs: ——/指标 动词: ——得到 --- apiVersion: rbac.authorization.k8s.io/v1beta1 :ClusterRoleBinding 元数据: 名称:普罗米修斯 roleRef: apiGroup: rbac.authorization.k8s.io :ClusterRole 名称:普罗米修斯 主题: 类型:ServiceAccount 名称:普罗米修斯 名称空间:kube-ops 代码>
4,配置pv和pvc用于数据持久化
<代码> apiVersion: v1 :PersistentVolume 元数据: 名称:普罗米修斯 规范: 容量: 存储:10胃肠道 accessModes: ——ReadWriteOnce persistentVolumeReclaimPolicy:回收 nfs: 服务器:192.168.1.244 路径:/数据/美丽 --- apiVersion: v1 :PersistentVolumeClaim 元数据: 名称:普罗米修斯 名称空间:kube-ops 规范: accessModes: ——ReadWriteOnce 资源: 请求: 存储:10 gi在k8集群中安装普罗米修斯