Raid卡性能导致IO告警

存储 存储设备
不同的机器性能不同,但是我们应用开发一般不去关注这些。只有等压力到一定程度后,我们才会发现不同的机器表现不一样。

[[403171]]

前言

不同的机器性能不同,但是我们应用开发一般不去关注这些。只有等压力到一定程度后,我们才会发现不同的机器表现不一样。

现场

有一天,笔者突然收到了线上Zookeeper的告警。其中一台机器磁盘IOWait高,奇异的是 我们线上的5台机器组成一个集群,唯独只有一台IOWait高。

为什么仅有一台iowait高

这个问题第一个疑点就是Zookeeper最为一个集群,为什么只有C变高,况且C只是个follower节点。于是笔者看了下分别机器的ios,发现iops竟然差不多。

机器问题,Raid卡没电池

到这里,很自然的就怀疑起机器的问题了。和SA一块排查,比较异同。发现有问题的机器是用的旧型号机器,而这批机器Raid卡竟然没有带电池!

本来Raid卡是自带一块RAM加速写入性能的,不带电池的后果就是Raid卡会不启用写缓存的功能。怪不得IOWait高。

顺手解决了另一个疑惑

在发现这个点之后,笔者立马就想起了之前大促的时候,一个应用的部分机器会卡主,翻日志会发现。两条没有任何请求的日志之间会出现好几秒的间隔情况,翻了下之前的ip,发现他们也是在这种没有电池的机器上-_-!

总结

在相同负载下的机器会有不同性能表现时,我们需要将其宿主机的硬件性能作为一个可能的点考虑进来。

本文转载自微信公众号「解Bug之路」,可以通过以下二维码关注。转载本文请联系解Bug之路公众号。

 

责任编辑:武晓燕 来源: 解Bug之路
相关推荐

2017-11-30 12:23:55

IO性能RAID

2021-05-08 23:33:12

iOS苹果系统

2018-03-30 09:21:27

SSD阵列RAID 50RAID 10

2018-02-06 09:21:17

Raid 5Raid 6差异

2016-08-16 14:11:32

存储极客

2017-07-07 16:36:28

BIOIO模型 NIO

2013-01-31 10:23:58

2011-03-17 15:54:11

2011-11-08 21:54:05

Windows 监控

2011-11-08 21:51:43

Linux 监控 IO

2010-12-22 13:17:47

Linux性能监测磁盘IO

2009-02-06 09:40:14

固态硬盘性能实测SSD

2020-06-17 16:43:40

网络IO框架

2011-11-08 21:47:37

Linux 监控 IO

2010-05-26 18:31:51

Linux性能监控

2009-06-25 18:41:02

云计算数据中心虚拟化

2013-06-28 10:01:29

Ubuntu软Raid故障处理

2018-09-10 10:20:26

磁盘 IO网络 IO监控

2023-12-28 11:24:29

IO系统请求

2014-08-21 10:05:59

SQL Server
点赞
收藏

51CTO技术栈公众号