跳转至

告警策略

DCE 5.0 除了内置的告警策略外,还可以自定义创建新的告警策略。 每条告警策略是一组告警规则的集合,支持对集群、节点、工作负载等资源设置告警规则。 当告警对象达到策略下任一规则设定的阈值,则会自动触发告警并发送通知。

以内置告警为例,点击第一条告警策略 alertmanager.rules

告警策略

可以看到其下已设置了一些告警规则,可以在该策略下添加更多规则,也可以随时编辑或删除规则。还可以查看有关这条告警策略的历史告警和活动告警,编辑通知配置等。

alertmanager.rules

创建告警策略

  1. 选择告警中心 -> 告警策略,点击创建告警策略按钮。

    告警策略

  2. 填写基本信息,选择一个或多个集群、节点或工作负载为告警对象后点击下一步

    基本信息

  3. 列表需至少有一条规则。如果列表为空,请添加规则

    添加规则

    在弹窗中创建告警规则,填写各项参数后点击确定

    创建规则

    • 模板规则:预定义了基础指标,可以按 CPU、内存、磁盘、网络设定要监控的指标。
    • PromQL 规则:输入一个 PromQL 表达式,具体请查询 Prometheus 表达式
    • 持续时长:告警被触发且持续时间达到该设定值后,告警策略将变为触发中状态。
    • 告警级别:包含紧急、警告、信息三种级别。
    • 高级设置:可以自定义标签和注解。
  4. 点击下一步后配置通知。

    通知配置

  5. 配置完成后,点击确定按钮,返回告警策略列表。

Tip

新建的告警策略为未触发状态。一旦满足规则中的阈值条件和持续时间后,将变为触发中状态。

创建日志规则

  1. 完成基本信息的填写后,点击添加规则,规则类型选择日志告警

    通知配置

    字段说明:

    • 过滤条件:查询日志内容的字段,支持与、或、正则匹配、模糊匹配四种过滤条件。
    • 判断条件:根据过滤条件,输入关键字或匹配条件。
    • 时间范围:日志查询的时间范围。
    • 阈值条件:在输入框中输入告警阈值。当达到设置的阈值时,则触发告警。支持的比较运算符有: >、≥、=、≤、< 。
    • 告警级别:选择告警级别,用于表示告警的严重程度。

其他操作

在列表右侧点击 ,在弹出菜单中选择删除,可以删除告警策略。点击策略名称,进入策略详情,可以添加、编辑、删除其下的告警规则。

告警规则

Warning

删除后的告警策略将完全消失,请谨慎操作。

评论