prometheus监控哪些指标，prometheus监控告警里面的百分比用什么表示怎么设置呢，深入解析Prometheus监控告警中的百分比表示及其设置方法

欧气 2024年10月07日 10:59 0 0

Prometheus监控指标包括系统、应用、网络等多个方面。告警中的百分比通常表示指标值相对于设定阈值的相对比例。设置方法涉及配置告警规则，其中阈值设置为百分比形式，通过alert指令在Prometheus配置文件中定义。深入解析包括理解阈值计算方式、告警条件触发机制及告警处理流程。

本文目录导读：

Prometheus监控指标
百分比表示及其设置方法

Prometheus是一款开源的监控和告警工具，广泛应用于云计算和大数据领域，在Prometheus中，告警是一个非常重要的功能，可以帮助我们及时发现系统中的异常情况，而在告警规则中，百分比是一个常见的指标，本文将深入解析Prometheus监控告警中的百分比表示及其设置方法。

Prometheus监控指标

Prometheus监控指标主要分为以下几类：

1、Counter（计数器）：表示某种事件发生的次数，通常是累积的，不会减少。

2、Gauge（仪表盘）：表示某个数值，可以增加或减少。

prometheus监控哪些指标，prometheus监控告警里面的百分比用什么表示怎么设置呢，深入解析Prometheus监控告警中的百分比表示及其设置方法

图片来源于网络，如有侵权联系删除

3、Histogram（直方图）：表示一组数据在不同值域上的分布情况。

4、Summary（：表示一组数据的统计信息，如最大值、最小值、平均值等。

5、Untyped（未分类）：表示任意类型的数据。

在Prometheus中，我们可以通过以下方式来监控指标：

1、自定义指标：通过PromQL（Prometheus查询语言）来创建自定义指标。

2、内置指标：Prometheus内置了一些常见的指标，如CPU使用率、内存使用率等。

3、第三方插件：通过第三方插件来收集系统指标。

百分比表示及其设置方法

1、百分比表示

在Prometheus监控告警中，百分比通常用于表示某个指标相对于总体的比例，CPU使用率、内存使用率等。

百分比表示方法如下：

prometheus监控哪些指标，prometheus监控告警里面的百分比用什么表示怎么设置呢，深入解析Prometheus监控告警中的百分比表示及其设置方法

图片来源于网络，如有侵权联系删除

- 使用“%”符号表示，如“50%”表示50%。

2、设置方法

（1）创建告警规则

我们需要创建一个告警规则，用于监控某个指标的百分比，以下是一个示例告警规则：

alert: HighCPUUsage
expr: (sum(rate(container_cpu_usage_seconds_total{image!="", cluster!=""}[5m])) by (image, cluster) / sum(container_cpu_usage_seconds_total{image!="", cluster!=""}[5m])) * 100 > 80
for: 1m
labels:
  severity: critical
annotations:
  summary: "High CPU usage on {{ $labels.image }} in {{ $labels.cluster }}"
  description: "The CPU usage of {{ $labels.image }} in {{ $labels.cluster }} is {{ $value }}% over the last 5 minutes."

在这个告警规则中，我们监控了容器CPU使用率，当其超过80%时，会触发告警。

（2）设置百分比阈值

在告警规则中，我们可以通过expr字段来设置百分比阈值，以下是一些常用的PromQL表达式：

rate(x[5m])：表示过去5分钟内x指标的变化率。

sum(x)：表示x指标的总和。

avg(x)：表示x指标的平均值。

prometheus监控哪些指标，prometheus监控告警里面的百分比用什么表示怎么设置呢，深入解析Prometheus监控告警中的百分比表示及其设置方法

图片来源于网络，如有侵权联系删除

max(x)：表示x指标的最大值。

min(x)：表示x指标的最小值。

以下表达式表示过去5分钟内，某个指标的CPU使用率超过80%：

(sum(rate(container_cpu_usage_seconds_total{image!="", cluster!=""}[5m])) by (image, cluster) / sum(container_cpu_usage_seconds_total{image!="", cluster!=""}[5m])) * 100 > 80

（3）设置告警通知

在Prometheus中，我们可以通过Alertmanager来设置告警通知，以下是一个示例：

route: default
receiver: 'email'
group_by: [cluster]
match:
  alertname: HighCPUUsage
  severity: critical

在这个示例中，当触发HighCPUUsage告警时，会将通知发送到指定的邮箱地址。

本文深入解析了Prometheus监控告警中的百分比表示及其设置方法，通过合理设置告警规则和阈值，我们可以及时发现系统中的异常情况，确保系统的稳定运行，在实际应用中，我们需要根据具体的业务需求来调整告警规则和阈值，以达到最佳的监控效果。