监控和告警
最后更新时间:2021-07-27 17:25:16
负载均衡监控
负载均衡监控和告警作为基础架构里重要的组成部分,对日常运维十分重要。小鸟云提供了负载均衡监控功能,帮助用户迅速了解负载均衡的运行状态。有实时带宽、总连接数、http 状态码等8个监控指标进行监控。并支持用户自定义报警规则。
监控项说明
实例层面
监控项 | 解释 | 单位 | 最小时间颗粒度 |
---|---|---|---|
带宽 | 实时使用带宽统计 | Mbps | 1min |
数据包数 | 实时发送或接收的数据包数 | 个/秒 | 1min |
总连接数 | 负载均衡所有连接数的总和 | 个/秒 | 1min |
新增连接数 | 单位时间内新增的连接数 | 个/秒 | 1min |
监听层面
4/7层监听公有监控项:
监控项 | 解释 | 单位 | 最小时间颗粒度 |
---|---|---|---|
带宽 | 实时使用带宽统计 | Mbps | 1min |
数据包数 | 实时发送或接收的数据包数 | 个/秒 | 1min |
总连接数 | 负载均衡所有连接数的总和 | 个/秒 | 1min |
新增连接数 | 单位时间内新增的连接数 | 个/秒 | 1min |
7层监听特有监控项:
监控项 | 解释 | 单位 | 最小时间颗粒度 |
---|---|---|---|
每秒查询数 | 负载均衡每秒被查询的次数 | Mbps | 1min |
客户端请求时延 | 客户端请求到达负载均衡的时间 | 次/秒 | 1min |
后端服务器返回时延 | 后端服务器响应负载均衡的时间 | ms | 1min |
http 返回码 | 客户端得到的负载均衡http返回码的个数,包含2xx, 3xx, 4xx, 5xx 四个返回码 | 次/秒 | 1min |
注意:
总连接数和新建连接数都是是指客户端到负载均衡的连接数目;
总连接数由established连接数和非established连接数及其他连接数组成,其他连接数很少,一般忽略。
告警说明
当负载均衡处于不健康状态时会触发告警事件,并通知告警事件联系人。告警事件的触发是通过用户自定义的告警规则实现。
告警规则
告警规则主要由关联的资源,规则描述和通知方式构成。创建告警规则
规则描述包含统计周期,统计方法,条件判断,以及阀值。
监控细分项:监控页面监控项,这里进行细分到每一个小项。如监控项“带宽”,细分项包含“流入带宽”和“流出带宽”;
统计周期:单位时间周期检查发生的事件;
统计方法:按照平均值,最大值,最小值3种方法统计;
阀值:事件发生的的阀值,超过该值及触发告警事件。
注意:
设置监控告警规则的对象为4层端口(TCP/UDP)、7层端口(HTTP/HTTPS),或全部端口。全部端口即为负载均衡实例所有前端端口的数据总和。
原则上4层端口对应4层告警规则,7层端口对应7层告警规则。4层端口可选择7层告警规则,但不生效。反之亦然。
查看监控
1.登陆小鸟云控制台,选择“负载均衡” —> “负载均衡管理” —> “某负载均衡ID”
2.选择“性能监控”,即可查看监控