背 景
在白盒监控中我们需要将export程序安装到被监控的主机上从而实现对主机各种资源及其状态的数据采集工作。
但某些情况下操作技术以及其他原因,不是所有的export都能部署到被监控的主机环境中,针对这样的场景Prometheus提供了黑盒解决方案,blackbox无需安装到被监控的主机目标中,只需要将其安装在proethus和被监控目标互通的环境中,通过HTTP、HTTPS、DNS、TCP、ICMP等方式对网络进行探测监控还可以探测SSL证书过期时间,主要用来关注现象,重点在于对正在发生的故障进行告警。
应用场景
业务组件端口状态监听;
应用层协议定义与监听。
主机探活机制。
接口联通性。
安装部署
# cd /app/software/
# tar -zxvf blackbox_export-0.17.0.linux-amd64.tar.gz -C /app/
# cd /app/
# mv blackbox-export-0.17.0.linux-amd64 blackbox-export
# ln -sv ./blackbox-export /app/blackbox
# cd /app/blackbox
# nohup ./blackbox_export --config.file blackbox.yml --web.listen-address ":9155" &
# ss -nutlp | grep 9155
tcp LISTEN 0 128 *:9155 *:* users:(("blackbox_export",pid=2053,fd=3))
检 查
http://192.168.XX.*:9155
Prometheus集成
第一个重新标记relabel通过将address标签即当前目标地址写入_param_target标签来创建参数。
第二个relabel将获取的_param_target的值,覆盖写道instance标签中。
labels:
group: blackbox_exporter
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: 192.168.xx.15:9115
- job_name: "blackbox_exporter_192.168.xx.19:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.19:9115
- job_name: "blackbox_exporter_192.168.xx.16:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.16:9115
- job_name: "blackbox_exporter_192.168.xx.18:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.18:9115
- job_name: "blackbox_exporter_192.168.xx.15:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.15:9115
- job_name: "blackbox_exporter_192.168.xx.17:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.17:9115
通过在grafana官网下载blackbox的监控json导入。
总 结
黑盒监控相较于白盒监控最大的不同在于黑盒监控是以故障为导向当故障发生时,黑盒监控能快速发现故障,所以我们监控时候以粒度比较细的,如端口、接口、线路等进行监控可以快速实现和定制化我们需要的相关监控策略。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/129454.html
摘要:京东云监控响应实践京东云运维平台为数万台机器提供监控,部署,机器管理,权限管理,安全管理,审计和运营分析等功能,为京东云所有的业务在各类异构网络环境下提供标准和统一的运维支撑能力。 showImg(https://segmentfault.com/img/bVbsKlQ); 微服务本身并没有一个严格的定义,不过从很多人的反馈来看,大家都达成了这样一个共识:微服务是一种简单的应用,大概有...
摘要:本文已经收录在合集都可以采集那些指标常用合集中。允许通过和对接口进行黑盒探测监控。我们来看这个示例文件,其他是经常搭配服务发现来进行工作的,比如搭配基于的服务发现来进行。小结其实在监控系统中非常实用,尤其是监控和监控。 本文已经收录在 Prometheus 合集 Prometheus 都可以采集那些指标?-- ...
摘要:结合的日志发现就算是发生了老年代也已经回收不了,内存已经到顶。定位由于生产上的内存文件非常大,达到了几十。也是由于我们的内存设置太大有关。同时后台也开始打印内存溢出了,这样便复现出问题。结果发现类型的对象占用了将近的内存。 showImg(https://segmentfault.com/img/remote/1460000016186784?w=2048&h=1365); 前言 Ou...
摘要:也就是说整个监控系统不是部署在中。非的怎么监控是今天需要讨论的问题。官方给出的配置联邦机制也实现了的扩展。我们的集群外监控的方案就基于此。在同一个数据中心,每个监控其他的。上一级的监控数据中心级别的。 前言 有时候对于一个公司,k8s集群或是所谓的caas只是整个技术体系的一部分,往往这个时候监控系统不仅仅要k8s集群以及k8s中部署的应用,而且要监控传统部署的项目。也就是说整个监控系...
摘要:也就是说整个监控系统不是部署在中。非的怎么监控是今天需要讨论的问题。官方给出的配置联邦机制也实现了的扩展。我们的集群外监控的方案就基于此。在同一个数据中心,每个监控其他的。上一级的监控数据中心级别的。 前言 有时候对于一个公司,k8s集群或是所谓的caas只是整个技术体系的一部分,往往这个时候监控系统不仅仅要k8s集群以及k8s中部署的应用,而且要监控传统部署的项目。也就是说整个监控系...
阅读 1347·2023-01-11 13:20
阅读 1685·2023-01-11 13:20
阅读 1133·2023-01-11 13:20
阅读 1860·2023-01-11 13:20
阅读 4101·2023-01-11 13:20
阅读 2705·2023-01-11 13:20
阅读 1386·2023-01-11 13:20
阅读 3598·2023-01-11 13:20