2013/12/27 <[email protected]>: > 大家好, > > 这周迁移基本停滞,因为我们发现 lxc 中的 rootfs 读写速度非常慢。I/O > latency 一直在 1s 左右,最差的时候会达到 7s. > > 肖骐做了一轮测试,发现在 xen 的 dom0 上(没有 I/O overhead) 硬盘 sda 的 > 速度也低于 30MB/s. > > 最初樊栖江严重怀疑是 btrfs 的问题,徐亮最早也引述过 btrfs fsync 特别慢的 > 观察。续本达以为这是由 copy-on-write 所致,但是在把频繁更新的文件如rrd数 > 据库都设为 nocow 之后,latency 没有丝毫改观。 > > 我们把 rrd 数据库放在了 sdc 的 ext4 分区上时,读写速度很快。为了确认它确 > 实是 btrfs 的问题,我们又在 sda 上建了一个 ext4 分区,但测试结果却是:比 > btrfs 还慢。 > > 续本达开始认真怀疑是硬盘的问题,于是我们开始集中在 dom0 上做测试。 > > 把 sdc 上的 ext4 分区挂在 dom0 上,dd 测写入速度,与 sda 的 ext4 和 > btrfs 比较。结果都是,速度只与硬盘有关,与分区格式无关。 > > 随后我们查了 sda 的 SMART 记录,发现了很高的 Seek Error Rate ,大约在千分 > 之一左右。这是导致 sda 写入慢的直接原因。同时,两轮 SMART selftest,sda > 并未报错。 > > 接下来的问题是,为什么新硬盘会有这么高的 Seek Error Rate. > > 在这一点上我们出现了分歧: > > 续本达觉得硬盘质量有问题,没必要再软件测试了。唯一可以排查的是到机房看一 > 下数据线的连接以及主板的接口。但是 Seek Error 一般跟硬盘的伺服电机有关, > 不大可能是传输线或主板接口的问题。不过既然是新的,那么最简单的解决方法是 > 返厂。 > > 肖骐觉得 btrfs 的某种未被发现的写入规则让 sda 不堪重负,提前坏了,或者频 > 繁寻道诱导出 Seek Error。需要进一步测试验证 btrfs 与 Seek Error 的关联。 > 但是这几天他各方面任务很重,测试暂放下了。 >
在 Xen 的 domU 里,btrfs 识别虚拟磁盘类型时会认为是SSD。这时会刻意将所有的写入操作分布在盘的不同位置,尽量让每个位置有接近的写入次数,以达到SSD的最大使用寿命。但是对于普通硬盘来说,显然是个挺大的坏事。。。 -- Regards, Aron Xu -- --- 您收到此邮件是因为您订阅了 Google 网上论坛的“TUNA 主邮件列表”论坛。 要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到 [email protected]。 要查看更多选项,请访问 https://groups.google.com/groups/opt_out。
