我部署了Prometheus with an Helm chart from Rancher。Alertmanager、Prometheus、Grafana、Node-exporter、Kubelet等目标都是自动配置的。例如,来自alertmanager的端点指的是特定pod的IP地址。我还成功配置了多个目标,如Jira和Confluence。
由于服务external-dns运行在名称空间kube-system
中,因此它也是自动配置的,但只有这个服务得到错误Context deadline exceeded
。
我在一个随机pod中检查了这些指标是否可以通过运行命令curl -s http://<IP-ADDRESS-POD>:7979/metrics
来访问。还对服务的ip地址(kubectl get service external-dns
和curl-s http://<IP-ADDRESS-SVC>:7979/metrics
)进行了检查。这两个curl命令都在一秒内返回了指标。因此,增加刮擦超时不会有帮助。
但是当我在Prometheus容器中使用exec
并使用promtool debug metrics
命令时,它显示了与在我的浏览器中相同的行为。外部dns返回两个IP地址的超时,如果我在另一个目标上尝试此操作,它只返回度量。
我也不认为这是SSL问题,因为我已经为目标Jira和Confluence注入了正确的CA包。
所以有人有什么想法吗?:)
1条答案
按热度按时间kqlmhetl1#
我不得不编辑
kube-system
命名空间中的NetworkPolicy。来自cattle-monitoring-system
命名空间的容器现在被允许访问来自kube-system
命名空间的容器。You can upload your NetworkPolicies here并显示哪些资源可以访问或不能访问。NetworkPolicy现在看起来像这样: