经常业务上有给硬件设备做性能监控的需求,搞来搞去也就 3 个指标:CPU 、内存和磁盘占比。
我想知道的是,看这三个指标有啥用。。。监控的意义在哪里?
1
waringid 2022-10-25 07:38:59 +08:00
试着回答以下几个问题:
1 、业务的高峰期是什么时候?访问量是多少?有哪些服务器资源?高峰期服务器资源占用情况如何? 2 、新上线的业务预估访问量比旧业务高 10 倍,能不能公用服务器?新购服务器需要什么配置? 3 、业务量没有变化为什么访问变慢了? 3 、各历史业务高峰期服务器资源变化有什么特点? |
3
perfectlife 2022-10-25 10:44:23 +08:00
一般做了也不天天看,最多内存 /cpu 高报警了看一下,磁盘占比主要是怕磁盘满了,影响服务
|
4
foufoufm OP @perfectlife 太真实。。。
|
5
perfectlife 2022-10-25 13:08:20 +08:00
@foufoufm 对运维来讲,基本不看但是监控得有,不然背锅还甩不掉
|
6
foufoufm OP @perfectlife 一般是怎么甩锅的?想了解一下哈哈哈哈
|
7
lixile 2022-10-25 14:34:15 +08:00
cpu 平均负载 峰值负载 满负载时长 (决定扩容与否)
内存 内存使用比例 (决定扩容与否) 磁盘 使用率(决定扩容与否) 每秒读写 每秒 iops 每秒 I/O 操作耗时占比 每次 I/O 读写耗时 (决定了硬件选型 机械 sata_ssd nvme_ssd 容量优先、读优先、写优先等等) 打开文件描述符数量、每秒上下文切换次数 网络 io 每小时流量 (评估交换机峰值流量) 每秒网络带宽使用 (评估网卡选型与扩容) 网络 socket 链接类型与数量 |
8
perfectlife 2022-10-25 15:58:00 +08:00
@foufoufm 比谁嗓门大
|