- A+
1.云服务器ECS(Elastic Compute Service)
报警名称 | 报警触发规则 |
---|---|
CPU使用率(CPU Utilization) | 一分钟内最大值>90%,连续三次 |
磁盘使用率(vm.DiskUtilization) | 一分钟内最大值>90%,连续三次 |
内存使用率(vm.MemoryUtilization) | 一分钟内最大值>90%,连续三次 |
公网流出带宽使用率(InternetOutRate_Percent) | 一分钟内最大值>80%,连续三次 |
等待IO操作的CPU百分比(cpu.iowait) | 一分钟内最大值>20%,连续三次 |
过去1分钟的系统平均负载(load1) | 一分钟内最大值>5,连续三次 |
iNode使用率(fs.inode) | 一分钟内最大值>90%,连续三次 |
TCP连接数(Host.tcpconnection) | 一分钟内最大值>2000,连续三次 |
网卡上行带宽(Host.netin.rate) | 一分钟内最大值>360M/s,连续三次 |
网卡下行带宽(Host.netout.rate) | 一分钟内最大值>360M/s,连续三次 |
2.关系型数据库RDS(Relational Database Service)
报警名称 | 报警触发规则 |
---|---|
连接数使用率 | 五分钟内最大值>80%,连续一次 |
只读实例延迟 | 五分钟内最大值>5秒,连续一次 |
IOPS使用率 | 五分钟内最大值>80%,连续一次 |
CPU使用率 | 五分钟内最大值>80%,连续一次 |
磁盘使用率 | 五分钟内最大值>80%,连续一次 |
内存使用率 | 五分钟内最大值>90%,连续一次 |
3.负载均衡SLB(Server Load Balancer)
报警名称 | 报警触发规则 |
---|---|
监听每秒丢失连接数(DropConnection) | 一分钟内最大值>0,连续三次 |
最大连接数使用率 | 一分钟内监控值>80%,连续三次 |
QPS使用率 | 一分钟内监控值>80%,连续三次 |
端口维度的请求平均延时 | 一分钟内监控值>5000ms,连续三次 |
后端异常ECS实例个数 | 一分钟内监控值>1or=1,连续三次 |
端口4xx状态码个数 | 一分钟内监控值>100,连续三次 |
端口5xx状态码个数 | 一分钟内监控值>100,连续三次 |
端口Upstream 4xx状态码个数 | 一分钟内监控值>100,连续三次 |
端口Upstream 5xx状态码个数 | 一分钟内监控值>100,连续三次 |
端口UpstreamRT(端口维度的rs发给proxy的平均请求延迟) | 一分钟内监控值>5000ms,连续三次 |
七层协议实例QPS | 一分钟内监控值>10000,连续三次 |
七层协议端口QPS | 一分钟内监控值>10000,连续三次 |
DropTrafficRX(监听每秒丢失入bit数) | 一分钟内监控值>0,连续三次 |
DropTrafficTX(监听每秒丢失出bit数) | 一分钟内监控值>0,连续三次 |
4.对象存储服务OSS(Object Storage Service)
报警名称 | 报警触发规则 |
---|---|
服务端请求占比 | 一分钟内监控值>1%,连续三次 |
网络请求占比 | 一分钟内监控值>1%,连续三次 |
客户端授权错误请求占比 | 一分钟内监控值>1%,连续三次 |
客户端资源不存在错误请求占比 | 一分钟内监控值>1%,连续三次 |
客户端超时错误请求占比 | 一分钟内监控值>1%,连续三次 |
请求平均服务器延时 | 一分钟内监控值>3000ms,连续三次 |
请求平均E2E延时 | 一分钟内监控值>3000ms,连续三次 |
5.Redis
报警名称 | 报警触发规则 |
---|---|
CPU使用率(CPUUsage) | 一分钟最大值>80%,连续三次 |
连接数使用率(ConnectionUsage) | 一分钟最大值>80%,连续三次 |
内存使用率(MemoryUsage) | 一分钟最大值>80%,连续三次 |
写入带宽使用率(IntranetInRatio) | 一分钟最大值>80%,连续三次 |
读取带宽使用率(IntranetOutRatio) | 一分钟最大值>80%,连续三次 |
命中率 | 一分钟最大值<80%,连续三次 |
平均响应时间 | 一分钟最大值>2s or =2s,连续三次 |
最大响应时间 | 一分钟最大值>3s or =3s,连续三次 |
QPS使用率 | 一分钟最大值>80%,连续三次 |
6.MemCache
报警名称 | 报警触发规则 |
---|---|
连接数使用率 | 一分钟最大值>90%,连续三次 |
CPU使用率 | 一分钟最大值>90%,连续三次 |
读取命中率 | 一分钟最大值<80%,连续三次 |
写入带宽使用率 | 一分钟最大值>90%,连续三次 |
读取带宽使用率 | 一分钟最大值>90%,连续三次 |
内存使用率 | 一分钟最大值>90%,连续三次 |
7.内容分发网络CDN(Content Delivery Network)
报警名称 | 报警触发规则 |
---|---|
命中率 | 一分钟最大值<80%,连续三次 |