容器化|容器化 | 构建 RadonDB MySQL 集群监控平台
上一篇文章我们演示了如何《在 S3 备份恢复 RadonDB MySQL 集群数据》,本文将演示在 KubeSphere[1] 中使用 Prometheus[2] + Grafana[3] 构建 MySQL 监控平台,开启所需监控指标。
背景
Prometheus 基于文本的暴露格式,已经成为云原生监控领域事实上的标准格式。
RadonDB MySQL 监控引擎基于 Prometheus MySQLd Exporter[5] 定义。通过 mysqld-exporter
抓取 RadonDB MySQL 服务指标,再通过接入第三方应用平台实现监控指标可视化。
准备工作
- 已准备可用 Kubernetes 或 KubeSphere 集群
- 已部署 RadonDB MySQL 集群 《部署文档》
- RadonDB MySQL Kubernetes 版本 2.1.0+
【容器化|容器化 | 构建 RadonDB MySQL 集群监控平台】
serviceMonitor
开启后将自动绑定 mysqld_exporter
与 Prometheus。serviceMonitor
参数包含如下字段:serviceMonitor:
enabled: true
## Additional labels for the serviceMonitor. Useful if you have multiple prometheus operators running to select only specific ServiceMonitors
# additionalLabels:
#prometheus: prom-internal
interval: 10s
scrapeTimeout: 3s
# jobLabel:
# targetLabels:
# podTargetLabels:
namespaceSelector:
any: true
selector:
matchLabels:
app.kubernetes.io/managed-by: mysql.radondb.com
app.kubernetes.io/name: mysql
您可以在
charts/mysql-operator/values.yaml
文件中配置 serviceMonitor
。- 新部署 Operator 时,
serviceMonitor.enabled
默认为 true,表示默认开启。 - 已部署 Operator 2.1.0 以下版本的集群,需重新部署 Operator。
metricsOpts
是 CRD mysqlclusters.mysql.radondb.com
中定义 RadonDB MySQL 集群监控的参数,可通过配置mysql_v1alpha1_mysqlcluster.yaml
文件中参数值开启监控服务。metricsOpts
参数包含如下字段:metricsOpts:
enabled: false
image: prom/mysqld-exporter:v0.12.1resources:
requests:
cpu: 10m
memory: 32Mi
limits:
cpu: 100m
memory: 128Mi
metricsOpts.enabled
默认为 false,需手动设置为 true。- 设置
metricsOpts.enabled
为 true,开启集群监控功能; - 设置资源参数值,定义监控容器资源配额大小;
$ kubectl apply -f config/sample/mysql_v1alpha1_mysqlcluster.yaml
cluster.mysql.radondb.com/sample created/configured
查看监控服务 通过客户端查看
您可以通过如下指令查看集群监控服务和 serviceMonitor 信息。
$ kubectl get service,servicemonitor$ kubectl describe servicemonitor
预期效果
$ kubectl get service,servicemonitor
NAMETYPECLUSTER-IPEXTERNAL-IPPORT(S)AGE
service/mysql-operator-metricsClusterIP10.96.242.2058443/TCP3h25m
service/sample-followerClusterIP10.96.2.2343306/TCP21h
service/sample-leaderClusterIP10.96.30.2383306/TCP21h
service/sample-metricsClusterIP10.96.7.2229104/TCP3h24m
service/sample-mysqlClusterIPNone3306/TCP21hNAMEAGE
servicemonitor.monitoring.coreos.com/demo-mysql-operator3h25m$ kubectl describe servicemonitor demo-mysql-operator
Name:test-radondb-mysql-metrics
Namespace:default
Labels:app=test-radondb-mysql
app.kubernetes.io/managed-by=Helm
app.kubernetes.io/vendor=kubesphere
chart=radondb-mysql-1.0.0
heritage=Helm
release=test
Annotations:kubesphere.io/creator: admin
API Version:monitoring.coreos.com/v1
Kind:ServiceMonitor
......
Spec:
Endpoints:
Interval:1m
Path:/metrics
Port:metrics
Scheme:http
Scrape Timeout:10s
......
在 KubeSphere 平台查看
在 KubeSphere 企业空间部署的 RadonDB MySQL Operator 和集群,开启监控后,可在如下页面查看监控服务状态。
- 在项目空间应用负载下的服务页面,点击
<集群名称>-metrics
,可查看监控服务信息。
文章图片
- 在项目空间应用负载下的容器组页面,点击一个容器的名称,可查看该容器中
metrics
资源状态。
文章图片
查看监控内容 通过 KubeSphere 自定义监控
KubeSphere 的监控引擎基于 Prometheus 和 Prometheus Operator。使用 KubeSphere 的自定义监控功能支持以可视化的形式监控 RadonDB MySQL 指标。
- 在集群同一项目中,选择 监控告警 -> 自定义监控 -> 创建;
- 在对话框中,选择 MySQL 模版,并继续配置监控模版;
文章图片
- 点击 保存模版,即新创建监控面板。
文章图片
- 新建监控面板需等待约十分钟,即可查看监控数据。
文章图片
更多详情,请查看 KubeSphere 自定义监控介绍[6] 和 可视化监控[7]。
通过 Prometheus + Grafana 平台
Grafana 是一个跨平台、开源的数据可视化网络应用程序平台。通过 Prometheus + Grafana 平台查看监控基本原理如下:
- 通过 mysql_exporter 获取 RadonDB MySQL 服务监控数据.
- 通过 node_exporter 获得 RadonDB MySQL 服务器的监控数据。
- 将监控数据传到 Prometheus 后,通过配置数据源,最终在 Grafana 呈现丰富的监控数据图表和警告。
文章图片
更多 Grafana 可视化监控使用说明,请参见 Grafana Dashboards[8]。
参考引用
- KubeSphere:https://kubesphere.com.cn
- Prometheus:https://prometheus.io/
- Grafana:https://grafana.org/
- RadonDB MySQL Kubernetes 2.1.3:https://radondb.com/projects/...
- Prometheus MySQLd Exporter:https://github.com/prometheus...
- 自定义监控:https://kubesphere.io/zh/docs...
- 可视化监控:https://kubesphere.io/zh/docs...
- Grafana Dashboards:https://grafana.com/docs/graf...
推荐阅读
- Flask初识,第八篇,实例化Flask的参数及对app的配置
- Android 性能优化的方面方面都在这儿
- Android热修复与插件化实践之路
- Android性能优化之图片压缩优化
- appium 移动端自动化测试一
- 投稿|微信小程序,已经进化到能玩“王者荣耀”了
- Appium移动自动化测试-----AppiumDesktop录制脚本生成极简脚本
- DefaultNamespaceHandlerResolver中handlerMappings如何初始化
- Android插件化技术简介
- 基于appium的app自动化测试框架