本站公告

  • 版权说明:网站所有内容均来自互联网用户共享内容,不代表小新棋牌登录立场,若侵犯您的权益,请与我们联系。

  • 投诉/建议:欢迎与小新棋牌登录合作、投诉、建议,意见可以发送详细内容至邮件:67801662@qq.com

某500强银行基于Zabbix高级特性的全栈自动化监控实践

本文根据蔡翔华老师在〖deeplus直播“运维监控谈:Prometheus与Zabbix的对比选型”〗线上分享演讲内容整理而成。(文末有获取本期PPT&回放的方式,不要错过)

蔡翔华

Zabbix认证专家

国内首批Zabbix认证专家,DevOps Master。活跃于Zabbix和DevOps的社区,参加《DevOps最佳实践》和《Zabbix官方手册》的翻译工作; 10年四大及银行IT基础架构经验,7年Zabbix和DevOps经验。 一、Zabbix适合的监控场景

时常会听到很多运维伙伴在争论,Prometheus和Zabbix哪一个更好?在我看来,脱离实际应用场景讨论技术的优劣其实是没有任何意义的。

1、监控的维度

在选择具体的监控平台之前,我们最先需要明确,我们监控的目标是什么?在我的理解中,监控分为两个维度:即监控的广度和监控的深度。

1)监控的广度

小新棋牌登录大家所需要监控的系统少则几种,多则几十种,比如需要监控硬件、存储、操作系统、中间件、数据库及应用等。

而在每一个平台中,又存在多种平台:比如我们有华为、戴尔、惠普、IBM的硬件服务器或者交换机,同时也会有Windows、Linux、Aix、ESXi等多种操作系统。

系统和平台维度的组合,意味着我们不仅仅要监控多个层级的监控,也意味着每个层级内部的需要监控的对象更精细化。因此系统异构性和平台的多样性构成了运维的复杂性。

综上,一个理想的监控平台应该支持基于各类系统,覆盖各类厂商和平台的监控。

2)监控的深度

相对的,监控目标需要考虑的另一维度是监控的深度。就监控深度而言,我们可以将其简单分成可用性监控、性能监控、日志监控和自定义监控这四大类。

可用性监控:它的状态是一个布尔型,即只有1或者0。比方说,一个服务是处于停止状态还是运行状态,一个端口是up还是down,根据可用性监控我们可以获知监控对象是否处于正常状态; 性能监控:是基于可用性监控的更进一步监控。比如说我们监控某个ip地址,在可用性监控中我们会去ping这个ip。如果通,就说明这个ip可达;更进一步,ping延迟就是这个ip的性能监控。通过性能监控,我们可以获知监控对象的健康程度以及负载水平。CPU、内存使用率,磁盘的IOPS,网络的吞吐量,都是常见的性能监控指标; 日志监控:不管是可用性监控还是性能监控,都基于一定的轮询周期进行采样,在两个采样点之间的监控其实是缺失的,因此在两个采样点之间可能会遗漏一些异常监控数据。通过日志监控,可以记录下每一个操作或者行为,确保监控的完整性。常用的日志监控会分为安全日志、系统日志、应用日志和操作日志等;

(责任编辑:小新棋牌登录)