摘要:添加接收人监控中心支持添加邮箱及微信两种告警,需要注意的是,添加邮箱告警的话,需要预先配置发件服务器。由于监控中心配置了一条告警规则,只要企业微信的信息填写正确,一般分钟以内均可从企业微信中获取到告警信息。
监控中心是UK8S提供的产品化监控方案,提供基于Prometheus的产品解决方案,涵盖Prometheus集群的全生命周期管理,以及告警规则配置、报警设置等功能,省去了自行搭建监控服务的学习成本及运维成本。
监控中心基于CoreOS 开源的Prometheus Operator实现,部署在UK8S集群中,包含三大监控模块,分别是Prometheus、Alertmanager、Grafana,高可用模式下,Prometheus及Alertmanager分别部署2个和3个副本,也支持单节点模式。
同时,为了简化监控服务部署的负担,监控中心启动后,会默认安装NodeExporter以抓取Node节点的监控数据,并添加了Scheduler、Controller Manager、etcd、kubelet等Target,零配置即可实现UK8S的健康状态监控。
功能点 | 功能说明 |
---|---|
创建集群 | 一键创建Prometheus集群 |
销毁集群 | 销毁已创建的Prometheus集群 |
创建告警规则 | 创建一条告警规则,即Prometheus Rule |
删除告警规则 | 删除Prometheus Rule |
添加监控目标 | 添加监控目标,即Target |
删除监控目标 | 删除监控目标,不再抓取其监控数据 |
添加接收人 | 在Alertmanager中配置邮件及微信接受人 |
监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的CPU、内存资源,因此,如果开启勾选了高可用模式,请注意:
建议参数配置如下:
一个监控目标可理解为Prometheus中的一个Target或Job. 原生Prometheus既支持静态配置监控目标,也支持动态服务发现。
由于K8S的Pod被设置非永久性的资源,为了正确地抓取到每个应用对应的Pod监控数据,Prometheus Operator引入了Service Monitor机制,通过监听Service后面的EP(可认为是健康的Pod)来实现监控数据的采集。
因此,为了抓取一组Pod的监控数据,我们必须为这组Pod创建一个对应的Service,并暴露对应的Metrics端口。
! 这里需要强调的是,Service必须暴露Metrics端口,而非业务端口。如我们有一个应用,其应用端口为80,Metrics端口为9200,则供Prometheus抓取数据的Service端口必须是9200,如果设置为80,则不能抓取到任何监控数据。
在下面这个例子中,我们部署了一个示例应用,该应用为一个web应用程序,其容器对外暴露了两个端口,一个是业务端口80,另一个是Metrics端口8080. 并且创建了一个Service,暴露的端口与容器端口一致。
apiVersion: apps/v1
kind: Deployment
metadata:
name: example-app
spec:
replicas: 2
selector:
matchLabels:
app: example-app
template:
metadata:
labels:
app: example-app
spec:
containers:
- name: example-app
image: uhub.service.ucloud.cn/uk8s_public/instrumented_app:latest
ports:
- name: metrics
containerPort: 8080
- name: web
containerPort: 80
---
kind: Service
apiVersion: v1
metadata:
name: example-app
labels:
app: example-app
spec:
selector:
app: example-app
ports:
- name: metrics
port: 8080
- name: web
port: 80
我们在UK8S的监控中心-->监控目标页面,直接选中该Service,端口名称选择“metrics”,抓取路径一般默认填写“/metrics”,如果监控指标的路径是自定义请咨询业务方。
添加完毕后,我们可以打开Prometheus 控制台,查看该监控目标是否已添加成功。
监控中心支持添加邮箱及微信两种告警,需要注意的是,添加邮箱告警的话,需要预先配置发件服务器。
不同的邮件服务提供商对于发件服务器的配置都有较为详细的说明,这里强调两点:
支持添加多个邮件接收人
在使用微信接收人之前,我们必须在微信管理后台创建一个应用并获取应用ID、企业ID、应用秘钥、部门ID、企业微信用户ID等信息,需要咨询你的企业微信负责人方可获取到此信息。
在使用微信接收人之前,我们必须在微信管理后台创建一个应用并获取应用ID、企业ID、应用秘钥、部门ID、企业微信用户ID等信息,需要咨询你的企业微信负责人方可获取到此信息。
由于监控中心配置了一条watchdog告警规则,只要企业微信的信息填写正确,一般10分钟以内均可从企业微信中获取到告警信息。
实时文档欢迎访问https://docs.ucloud.cn/uk8s/monitor/prometheusplugin/intro
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/126278.html
摘要:宋体自年被开源以来,很快便成为了容器编排领域的标准。宋体年月,乐心医疗的第一个生产用集群正式上线。所以于年推出后,乐心医疗的运维团队在开会讨论之后一致决定尽快迁移到。Kubernetes 自 2014 年被 Google 开源以来,很快便成为了容器编排领域的标准。因其支持自动化部署、大规模可伸缩和容器化管理等天然优势,已经被广泛接纳。但由于 Kubernetes 本身的复杂性,也让很多企业的...
摘要:宋体本文从拉勾网的业务架构日志采集监控服务暴露调用等方面介绍了其基于的容器化改造实践。宋体此外,拉勾网还有一套自研的环境的业务发布系统,不过这套发布系统未适配容器环境。写在前面 拉勾网于 2019 年 3 月份开始尝试将生产环境的业务从 UHost 迁移到 UK8S,截至 2019 年 9 月份,QA 环境的大部分业务模块已经完成容器化改造,生产环境中,后台管理服务已全部迁移到 UK8...
摘要:开启监控中心开启监控中心开启监控中心监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的内存资源,因此,如果开启勾选了高可用模式,请注意至少有个节点的可用资源大于的容器配置。其中为块,为块。 开启监控中心监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的CPU、内存资源,因此,如果开启勾选了高可用模式,请注意:至少有2个Node节点的可用资源...
摘要:概述之前讲过容器的可视化监控,即监控容器的运行情况,包括使用率内存占用网络状况以及磁盘空间等等一系列信息。实战一下中添加依赖启动应用程序之后,只要在浏览器中输入端点信息就能获得应用的一些状态信息。 showImg(https://segmentfault.com/img/remote/1460000014684947); 概述 之前讲过Docker容器的可视化监控,即监控容器的运行情...
摘要:综上所述,容器化性能上接近物理机,在多测试场景下,表现相对稳定可靠。和实现了云服务器节点从物理机到宿主机的转变。 2018年数人云Meetup第一站,联合vivo在深圳举办 Building Microservice 系列活动第一期。本次技术沙龙vivo、中兴通讯、华为、数人云共同派出技术大咖,为开发者们带来有关微服务、容器化、配置中心、服务网格等领域的实战与干货分享。 数人云Meet...
阅读 3514·2023-04-25 20:09
阅读 3720·2022-06-28 19:00
阅读 3035·2022-06-28 19:00
阅读 3058·2022-06-28 19:00
阅读 3131·2022-06-28 19:00
阅读 2859·2022-06-28 19:00
阅读 3014·2022-06-28 19:00
阅读 2610·2022-06-28 19:00