资讯专栏INFORMATION COLUMN

【容器云 UK8S】日志监控方案:监控中心操作指南之监控中心概述,开启监控中心,添加监控目标和添加接

Tecode / 2395人阅读

摘要:添加接收人监控中心支持添加邮箱及微信两种告警,需要注意的是,添加邮箱告警的话,需要预先配置发件服务器。由于监控中心配置了一条告警规则,只要企业微信的信息填写正确,一般分钟以内均可从企业微信中获取到告警信息。

监控中心概述

监控中心是UK8S提供的产品化监控方案,提供基于Prometheus的产品解决方案,涵盖Prometheus集群的全生命周期管理,以及告警规则配置、报警设置等功能,省去了自行搭建监控服务的学习成本及运维成本。

实现原理

监控中心基于CoreOS 开源的Prometheus Operator实现,部署在UK8S集群中,包含三大监控模块,分别是Prometheus、Alertmanager、Grafana,高可用模式下,Prometheus及Alertmanager分别部署2个和3个副本,也支持单节点模式。

同时,为了简化监控服务部署的负担,监控中心启动后,会默认安装NodeExporter以抓取Node节点的监控数据,并添加了Scheduler、Controller Manager、etcd、kubelet等Target,零配置即可实现UK8S的健康状态监控。

功能一览

功能点功能说明
创建集群一键创建Prometheus集群
销毁集群销毁已创建的Prometheus集群
创建告警规则创建一条告警规则,即Prometheus Rule
删除告警规则删除Prometheus Rule
添加监控目标添加监控目标,即Target
删除监控目标删除监控目标,不再抓取其监控数据
添加接收人在Alertmanager中配置邮件及微信接受人

开启监控中心

监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的CPU、内存资源,因此,如果开启勾选了高可用模式,请注意:

  1. 至少有2个Node节点的可用资源大于Prometheus的容器配置。(建议可用资源大于4C8G)
  2. 至少有3个Node节点的可用资源大于Alertmanager的容器配置。(建议可用资源大于1C2G)
  3. 由于Prometheus和Alertmanager均需要持久性存储,因此会产生额外的UDisk费用。其中Prometheus为2块100G UDisk,Alertmanager为3块 UDisk。

开启监控

建议参数配置如下:

  1. Prometheus 数据盘大小: 100G以上,如果集群规模大于100台,建议磁盘大小扩展到500G;
  2. Prometheus 数据保留时长: 建议240小时;
  3. Grafana配置: 用户名和密码均可自定义;

添加监控目标

一个监控目标可理解为Prometheus中的一个Target或Job. 原生Prometheus既支持静态配置监控目标,也支持动态服务发现。

由于K8S的Pod被设置非永久性的资源,为了正确地抓取到每个应用对应的Pod监控数据,Prometheus Operator引入了Service Monitor机制,通过监听Service后面的EP(可认为是健康的Pod)来实现监控数据的采集。

因此,为了抓取一组Pod的监控数据,我们必须为这组Pod创建一个对应的Service,并暴露对应的Metrics端口。

! 这里需要强调的是,Service必须暴露Metrics端口,而非业务端口。如我们有一个应用,其应用端口为80,Metrics端口为9200,则供Prometheus抓取数据的Service端口必须是9200,如果设置为80,则不能抓取到任何监控数据。

操作说明

1. 部署应用

在下面这个例子中,我们部署了一个示例应用,该应用为一个web应用程序,其容器对外暴露了两个端口,一个是业务端口80,另一个是Metrics端口8080. 并且创建了一个Service,暴露的端口与容器端口一致。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: example-app
spec:
  replicas: 2
  selector:
    matchLabels:
      app: example-app
  template:
    metadata:
      labels:
        app: example-app
    spec:
      containers:
      - name: example-app
        image: uhub.service.ucloud.cn/uk8s_public/instrumented_app:latest
        ports:
        - name: metrics
          containerPort: 8080
        - name: web
          containerPort: 80
---
kind: Service
apiVersion: v1
metadata:
  name: example-app
  labels:
    app: example-app
spec:
  selector:
    app: example-app
  ports:
  - name: metrics
    port: 8080
  - name: web
    port: 80

2、添加监控目标

我们在UK8S的监控中心-->监控目标页面,直接选中该Service,端口名称选择“metrics”,抓取路径一般默认填写“/metrics”,如果监控指标的路径是自定义请咨询业务方。

3、查看监控目标

添加完毕后,我们可以打开Prometheus 控制台,查看该监控目标是否已添加成功。

添加接收人

监控中心支持添加邮箱及微信两种告警,需要注意的是,添加邮箱告警的话,需要预先配置发件服务器

1、配置发件服务器

不同的邮件服务提供商对于发件服务器的配置都有较为详细的说明,这里强调两点:

  1. 目前尚不支持TLS,因此请勿填写TLS端口;
  2. 密码建议为客户端密码,填写邮箱登录密码可能无法发送邮件。

2、配置邮件接收人

支持添加多个邮件接收人

3、配置企业微信接收人

在使用微信接收人之前,我们必须在微信管理后台创建一个应用并获取应用ID、企业ID、应用秘钥、部门ID、企业微信用户ID等信息,需要咨询你的企业微信负责人方可获取到此信息。

在使用微信接收人之前,我们必须在微信管理后台创建一个应用并获取应用ID、企业ID、应用秘钥、部门ID、企业微信用户ID等信息,需要咨询你的企业微信负责人方可获取到此信息。

由于监控中心配置了一条watchdog告警规则,只要企业微信的信息填写正确,一般10分钟以内均可从企业微信中获取到告警信息。

实时文档欢迎访问https://docs.ucloud.cn/uk8s/monitor/prometheusplugin/intro

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/126278.html

相关文章

  • 乐心医疗的 Kubernetes平台建设实践

    摘要:宋体自年被开源以来,很快便成为了容器编排领域的标准。宋体年月,乐心医疗的第一个生产用集群正式上线。所以于年推出后,乐心医疗的运维团队在开会讨论之后一致决定尽快迁移到。Kubernetes 自 2014 年被 Google 开源以来,很快便成为了容器编排领域的标准。因其支持自动化部署、大规模可伸缩和容器化管理等天然优势,已经被广泛接纳。但由于 Kubernetes 本身的复杂性,也让很多企业的...

    testHs 评论0 收藏0
  • 拉勾网基于 UK8S平台的容器化改造实践

    摘要:宋体本文从拉勾网的业务架构日志采集监控服务暴露调用等方面介绍了其基于的容器化改造实践。宋体此外,拉勾网还有一套自研的环境的业务发布系统,不过这套发布系统未适配容器环境。写在前面 拉勾网于 2019 年 3 月份开始尝试将生产环境的业务从 UHost 迁移到 UK8S,截至 2019 年 9 月份,QA 环境的大部分业务模块已经完成容器化改造,生产环境中,后台管理服务已全部迁移到 UK8...

    CoorChice 评论0 收藏0
  • 开启监控中心 容器 UK8S

    摘要:开启监控中心开启监控中心开启监控中心监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的内存资源,因此,如果开启勾选了高可用模式,请注意至少有个节点的可用资源大于的容器配置。其中为块,为块。 开启监控中心监控中心支持单节点模式和高可用两种模式,需要注意的是,开启监控需要消耗一定的CPU、内存资源,因此,如果开启勾选了高可用模式,请注意:至少有2个Node节点的可用资源...

    ernest.wang 评论0 收藏2371
  • Spring Boot应用监控实战

    摘要:概述之前讲过容器的可视化监控,即监控容器的运行情况,包括使用率内存占用网络状况以及磁盘空间等等一系列信息。实战一下中添加依赖启动应用程序之后,只要在浏览器中输入端点信息就能获得应用的一些状态信息。 showImg(https://segmentfault.com/img/remote/1460000014684947); 概述 之前讲过Docker容器的可视化监控,即监控容器的运行情...

    mtunique 评论0 收藏0
  • PPT下载 | 亿级用户万台服务器背后,vivo服务容器化如何破茧化蝶?

    摘要:综上所述,容器化性能上接近物理机,在多测试场景下,表现相对稳定可靠。和实现了云服务器节点从物理机到宿主机的转变。 2018年数人云Meetup第一站,联合vivo在深圳举办 Building Microservice 系列活动第一期。本次技术沙龙vivo、中兴通讯、华为、数人云共同派出技术大咖,为开发者们带来有关微服务、容器化、配置中心、服务网格等领域的实战与干货分享。 数人云Meet...

    plokmju88 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<