#yyds干货盘点#Prometheus 之 OpenStack 的监控简述

会挽雕弓如满月,西北望,射天狼。这篇文章主要讲述#yyds干货盘点#Prometheus 之 OpenStack 的监控简述相关的知识,希望能为你提供帮助。
OpenStack 的监控分为三方面:监控、报警;诊断、追踪;故障处理。监控和报警是发现问题的第一步,故障解决的主要问题是面对大规模部署 OpenStack 的复杂环境,如何准确、详尽地报告系统目前情况,及早发现并提示故障发生。

OpenStack 的监控可以分为三个层次:操作系统监控、服务监控、端到端监控,相互依赖,服务的稳定依赖操作系统的稳定,只有服务稳定了,用户才能正常的操作云资源.


Telemetry 服务是 OpenStack 的监控框架,从 Grizzly 版本之后就集成到了 OpenStack 生态中,能够可靠地收集部署在云环境中使用的物理资源和虚拟资源数据,包含计量(metering)、计费(rating)、结算(billing)。收集、分析这些数据,当达到定义的临界值时触发动作确保资源健康。


【#yyds干货盘点#Prometheus 之 OpenStack 的监控简述】计算节点代理、控制节点代理等主动调用 OpenStack 组件的 API 将收集的信息(CPU、IO)发送到通知总线,OpenStack 组件将信息推送到通知总线,通知代理监听 oslo 消息框架并获取信息,处理后再发送到通知总线,MessageBus 将信息发送给 Pipeine,处理后发送给 Collector 收集器,收集器将信息存储到 Metrics、Events。报警程序将报警结果存储到 Alarms,并产生动作(发短信、邮件)。


Prometheus 对 OpenStack 的监控是通过抓取 Exporter 的方式来采集运行指标的。现在比较实用的开源 OpenStack Exporter 主要有以下 3 个:

  • Prometheus 官网推荐的 OpenStack Exporter 是由英国 Linaro 用 GO 语言编写的开源软件,支持采集 neutron、nova、cinder、identity 等组件的指标,详见源码网站https://github.com/openstack-exporter/openstack-exporter。
  • 由著名开源软件公司 Canonical 提供的,采集一些 OpenStack 高层级的指标,详见源码网站https://github.com/CanonicalLtd/prometheus-openstack-exporter。
  • 由 AT& T 开源社区提供的,通过 OpenStack 的 API 采集度量指标,详见源码网站https://github.com/att-comdev/prometheus-openstack-exporter。


这 3 个开源软件都是编写 Exporter 来采集 OpenStack 的 API 接口的数据,并提供给 Prometheus 做进一步处理。总体上是一致的,建议安装在 Ubuntu 16.04 以上版本。


    推荐阅读