资讯专栏INFORMATION COLUMN

ZABBIX开源工具应用总结

IT那活儿 / 2980人阅读
ZABBIX开源工具应用总结
点击上方蓝字关注我们


初识Zabbix


Zabbix是一个企业级分布式开源监控工具,能监控各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位、解决存在的各种问题,是一个基于web界面的提供分布式系统监视以及网络监视功能的开源解决方案。


Zabbix实现监控的两种模式


简单的讲,主动模式和被动模式都是将Agent作为参照的。

主动模式:agent请求server获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy。

被动模式:server向agent请求获取监控项的数据,agent返回数据。

【主动监测】通信过程如下:

1、Agent打开TCP连接(主动检测变成Agent打开)

2、Agent请求items检测列表

3、Server返回items列表

4、Agent处理响应

5、关闭TCP连接

6、Agent开始收集数据

【被动监测】通信过程如下:

1、Server打开一个TCP连接

2、Server发送请求agent.ping

3、Agent接收到请求并且响应

1

4、Server处理接收到的数据1

5、关闭TCP连接


Zabbix支持的数据采集协议


1.SNMP(SimpleNetwork ManagementProtocol),简单网络管理协议。这是一个非常古老的且通用的监控协议,几乎任何设备都支持用此方式进行系统监控。

2.Agent在被监控端安装专门的监控程序,将数据采集后通过Agent发送至Server。

3.IPMI智能平台管理接口。可在常用的服务器上看到类似以太网口的接口。

4.JMXJavaManagement Extensions


zabbix监控架构


在实际监控架构中,zabbix根据网络环境、监控规模等分了三种架构:server-clientmaster-node-client、server-proxy-client三种

1server-client架构

  zabbix的最简单的架构,监控器和被监控机之间不经过任何代理直接由zabbixserver和zabbixagent之间进行数据交互。适用于网络比较简单,设备比较少的监控环境。

2server-proxy-client架构

  其中proxy是server、client之间沟通的一个桥梁,proxy本身没有前端,而且其本身并不存放数据,只是将agent发来的数据暂时存放,,而后在提交给server,该架构经常是和master-node-client架构作比较的架构,一般适用于跨机房,跨网络的中型网络架构的监控。

3master-node-client架构

  该架构是zabbix最复杂的监控架构,适用于跨网络、跨机房、设备较多的大环境。每个node同时也是一个server端,node下面可以接proxy,也可以直接接client。node由自己的配置文件和数据库,其要做的是将配置信息和监控数据向master同步,master的故障或损坏不影响node其下的架构的完整性。


Zabbix实际应用遇到问题及解决方案


1、server端和agent端报错找不到以下host

zabbix_server.log

 26214:20161117:143243.773cannot send list of active checks to "127.0.0.1": host [hz]not found

zabbix_agentd.log

26272:20161117:145243.961no active checks on server [127.0.0.1:10051]: host [hz] not found

解决方法agent中的hostname配置必须和zabbix页面中的主机一样

/usr/local/zabbix/etc/zabbix_agentd.conf

Hostname=hz-support

2、zabbix触发器提示Toomany processes on Zabbix server

原因是使用zabbix默认配置的监控模板中设置的触发器监控进程数默认值(默认是300)太少导致报警

可以改成更高的数值。

配置—>模板—>TemplateOS Linux–kelong

TemplateOS Linux–kelong—>触发器—>Toomany processes on {HOST.NAME}

更新刷新页面等待一下 可以看到报警消失


Zabbix监控主机CPU使用率场景示例


创建监控项

创建监控图形

查看图像结果


总结


Zabbix内部的数据流对Zabbix的使用也很重要。首先,为了创建一个采集数据的监控项,就必须先创建主机。其次,在任务的另外一端,必须要有监控项才能创建触发器(trigger),必须要有触发器来创建动作(action)。因此,如果想要收到类似“X个server上CPU负载过高”这样的告警,就必须首先为 ServerX 创建一个主机条目,其次创建一个用于监控其CPU的监控项,最后创建一个触发器,用来触发CPU负载过高这个动作,并将其发送到邮箱或短信告警。虽然这些步骤看起来很繁琐,但是使用模板的话,实际操作非常简单。也正是由于这种设计,使得Zabbix的配置变得更加灵活易用。


END



文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/129991.html

相关文章

  • B站运维团队成长的血泪史

    摘要:胡凯,运维负责人,曾经就职于金山软件金山网络猎豹移动,负责运维相关工作。胡凯在去年加入站刚刚成立的运维部,人少事多,遇到了很多坑。 胡凯,bilibili运维负责人,曾经就职于金山软件、金山网络、猎豹移动,负责运维相关工作。Bilibili是国内最大的年轻人潮流文化娱乐社区,银河系知名弹幕视频分享UGC平台。 95后二次元新人类的追捧,让以视频弹幕、UP主闻名于世的bilibili(...

    gitmilk 评论0 收藏0
  • Zabbix 集成 OneAlert 实现全方位告警

    摘要:前言告警将重要信息发送给运维或者其他相关人,及时发现并且处理问题。在所有开源监控软件里面,的告警方式无疑是最棒的。在发生告警之后立即发送邮件和微信消息给用户,分钟后还未确认,那么发送短信,分钟还未确认则打电话给用户。 1. 前言 告警将重要信息发送给运维「或者其他相关人」,及时发现并且处理问题。在所有开源监控软件里面,Zabbix 的告警方式无疑是最棒的。告警的方式各式各样,从 Ema...

    fai1017 评论0 收藏0
  • 运维 2.0 时代:数据聚合和分组

    摘要:灵活查询,聚合分组并存除开单纯的聚合和分组,还支持聚合和分组的复合查询。所以,与会聚合为一条曲线,而和的关系则是分组的关系。当然,的功能在未来,还远远不止这些,高效运维的时代才刚刚开启。 运维 2.0 时代 运维 2.0 是指,从技术运维升级为服务运维,向公司提供可依赖的专业服务。运维 2.0 强调服务交付能力,而不是技术能力,需求可依赖、懂业务、服务化的专业运维。 为了了解运维 2....

    skinner 评论0 收藏0
  • OneAPM 云监控部署与试用体验

    摘要:作为骨灰级粉丝,一直以来对第三方监控都是拒绝的。例如白屏时间首屏时间脚本错误网页加载就绪时间各种浏览器的访问情况,甚至能了解不同浏览器运营商地区用户的访问状况。脚本错误在所难免,错误进一步导致网站部分功能无法使用。 作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市...

    Tecode 评论0 收藏0
  • 全球说:要给 OneAlert 点100个赞

    摘要:也有幸和全球说运维负责人李云伟先生进行一次深入沟通。面临挑战全球说的应用主要是在线系统和移动为主。是北京科技有限公司旗下产品,中国首个模式的,集成国内外主流监控支撑系统,实现一个平台上集中处理所有事件,提升可靠性。 客户背景 「全球说」 Talkmate,是北京酷语时代教育科技有限公司(酷语科技)旗下产品,酷语科技是一家诞生于中国的语言技术公司,致力于为全球用户提供一个全新的多语言学习...

    txgcwm 评论0 收藏0

发表评论

0条评论

IT那活儿

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<