资讯专栏INFORMATION COLUMN

详解 OneAlert 排班可以帮你做什么

moven_j / 3213人阅读

摘要:戴明环优化排班策略如果你的团队有不定期的的习惯,建议参考参考循环,通过从告警响应告警解决时长解决告警的数量等角度,检查值班人员的工作效率,从而优化排班,为团队以最小工作量实现最大价值。

排班的存在,实质是通过有序安排,降低企业/团队人力成本,提升工作效率。

1、详解排班功能

轮班机制

工作时间

双视图展示

灵活调整

2、利用排班如何助力运维团队

排班策略让告警更精准分派到人

PDCA 戴明环优化排班策略

3、总结

1、详解排班功能

轮班机制

OneAlert 分派功能已经解决了将某类告警分派给相关负责人的问题,但是并非所有企业/团队,单类告警的处理人只有 1 个,大部分企业是多人协作处理。是否每个告警都需要多人同时处理?答案是否定的。最简单粗暴的方法:每人值班一天。轮班机制在工作日可能效果没那么明显,但是对于五一、国庆、春节等假期期间的值班安排就显得尤为重要了。

小编总结了大部分团队的排班按照以下规则:

按天轮循排班

按12小时轮循排班(两班倒)

按8小时轮循排班(三班倒)

OneAlert 支持按照周、天、小时排班,基本上覆盖排班轮休周期需求。如果同一时间排班人数>1,可以通过添加分组功能,增加多人排班

工作时间

大部分企业/团队严格区分上下班时间,并且上下班的时间也并非都是朝九晚五,因此 OneAlert 支持自定义工作时间。团队可以非常简单实现仅在周一-周五,9:30-18:30 排班(去年年底前,这个功能是缺失的。感谢大家对产品优化的建议和反馈)

设置工作时间后,排班仅在工作时间段内轮循,非工作时间轮空。

双视图展示

OneAlert 支持时间线视图日历视图预览排班。时间线视图方便在排班时查看以更细粒度查看排班(支持按小时显示),日历视图方便在排班最后整体检查效果。

灵活调整

实际情况,换班、请假等情况不可避免,OneAlert 支持对已生效的排班,灵活调整,在已排班人员处,单击即可更改。设定排班人员和周期后系统自动排班,易于维护。

2、利用排班如何助力运维团队

排班策略让告警更精准分派到人

分派策略+排班策略,能够更精准的实现告警分派到人,如果你有一线排班和二线排班,可以通过分派策略实现分派升级。(再提一句:分派策略支持将告警分派给人、组、排班策略、协作策略钉钉等)。

PDCA 戴明环优化排班策略

如果你的团队有不/定期的 review 的习惯,建议参考参考 PDCA 循环,通过从告警响应、告警解决时长、解决告警的数量等角度,检查值班人员的工作效率,从而优化排班,为团队以最小工作量实现最大价值。

PDCA 循环的含义是将质量管理分为四个阶段,即计划(plan)、执行(do)、检查(check)、行动(action)

3、总结

1.OneAlert 支持灵活排班轮休机制,通过自定义工作时间,尽可能的满足实际排班使用

2.排班策略+分派策略,让告警能够更精准分派到责任人

3.(建议)通过定期 review 告警处理情况,优化分派和排班

最后的福利:排班功能的优化离不开大家的反馈和建议,现在排班功能免费对所有用户开放,欢迎大家使用,有任何问题或建议可以直接联系 lixin@oneapm.com 或者在这留言。

OneAlert 是北京蓝海讯通科技股份有限公司旗下产品,是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。想了解更多信息,请访问 OneAlert 官网 ,欢迎免费注册体验 。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/8051.html

相关文章

  • 有效运维的 on-call 机制

    摘要:如何有效处理紧急事件驱动的工作,成为特别是运维主管运维工作的关键。通知到位和及时响应。机器学习领域是未来的重要发展方向,目前我们还在摸索中。机器学习告警合并事件单的处理如果告警量很大,告警后续处理和跟踪往往会依赖于外部团队部门外或公司外。 编者按]本文作者为陈伯龙,云告警平台[OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。 正文 互联...

    binaryTree 评论0 收藏0
  • 有效运维的 on-call 机制

    摘要:如何有效处理紧急事件驱动的工作,成为特别是运维主管运维工作的关键。通知到位和及时响应。机器学习领域是未来的重要发展方向,目前我们还在摸索中。机器学习告警合并事件单的处理如果告警量很大,告警后续处理和跟踪往往会依赖于外部团队部门外或公司外。 编者按]本文作者为陈伯龙,云告警平台[OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。 正文 互联...

    DirtyMind 评论0 收藏0
  • 告警分析:如何帮助运维团队快速做出最佳决策?

    摘要:健全的告警分析体系真正认识你的团队好的告警分析机制能够帮助管理者分析团队整体的工作情况,根据作为评判标准。根据告警内容分析也是很有必要的,能够帮助团队管理者对资源进行适当的调整,工作重心的调整。 「路漫漫其修远兮,吾将上下而求索」,「转身」不见得华丽,但我必须「转身」,不要安逸于现在的运维状况。 如果你运维一线人员,是否会遇到以下情况: 公司所有的服务器告警消息会塞满自己的整个邮箱,...

    pumpkin9 评论0 收藏0
  • Zabbix 集成 OneAlert 实现全方位告警

    摘要:前言告警将重要信息发送给运维或者其他相关人,及时发现并且处理问题。在所有开源监控软件里面,的告警方式无疑是最棒的。在发生告警之后立即发送邮件和微信消息给用户,分钟后还未确认,那么发送短信,分钟还未确认则打电话给用户。 1. 前言 告警将重要信息发送给运维「或者其他相关人」,及时发现并且处理问题。在所有开源监控软件里面,Zabbix 的告警方式无疑是最棒的。告警的方式各式各样,从 Ema...

    fai1017 评论0 收藏0
  • 全球说:要给 OneAlert 点100个赞

    摘要:也有幸和全球说运维负责人李云伟先生进行一次深入沟通。面临挑战全球说的应用主要是在线系统和移动为主。是北京科技有限公司旗下产品,中国首个模式的,集成国内外主流监控支撑系统,实现一个平台上集中处理所有事件,提升可靠性。 客户背景 「全球说」 Talkmate,是北京酷语时代教育科技有限公司(酷语科技)旗下产品,酷语科技是一家诞生于中国的语言技术公司,致力于为全球用户提供一个全新的多语言学习...

    txgcwm 评论0 收藏0

发表评论

0条评论

moven_j

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<