On Dec 29, 2013, at 11:12, [email protected] wrote:
> 硬盘问题调试成果问答:
>
> 1. 现在服务器的硬盘是怎么分区的?
>
> 1s = 512B
>
> sda:GPT
> Number Start End Size File system 用途
> 1 2048s 195311615s 195309568s ext4 dom0
> 2 195311616s 5000001535s 4804689920s xfs iso 等大文件仓库
> 6 5000001536s 5242882047s 242880512s ext4 domU
> 5 5242882048s 5860532223s 617650176s btrfs lxc pool
>
> sdc:GPT
> Number Start End Size File system 用途
> 1 2048s 5242882047s 5242880000s ext4 仓库
> 2 5242882048s 5860532223s 617650176s btrfs lxc pool
>
> sd{b,d}: 全盘GPT单分区仓库
>
> 注:为了直接使用 sda6 ,不加 MBR 引导,改用了 pygrub,并把 domU 的虚拟模
> 式从 PV-on-HVM 改成了 PV.
>
> 2. sda 真的坏了吗?
>
> 第1答中,sdc2 与 sda5 使用完全相同的硬盘的完全相同的地址,连续写入的速
> 度分别为80MB/s 和 110MB/s (把 cache 写饱和之后观察到的恒定速度)
>
> 因为 sda 上还有其它分区在使用时会有多余的寻道,会对测试结果产生影响。
>
> sda2 分区在 sda 比较靠前的位置,使用 xfs ,连续写入速度为 25MB/s.
>
> SMART short 和 long selftest 都没有发现问题。
>
> 最终回答:95% 可能坏了。如果要 100% 确定说它坏了,需要拆下来线下测连续
> 和随机读写速度。
>
> 3. 怎么坏的呢?这是新硬盘啊!
>
> 无法排除以下的因素:
>
> a. 这块硬盘质量不好,出厂时就坏了
>
> b. 被我们非常规地用坏了:
> b1. sda 中创建分区后,把分区当作硬盘映射到 domU ,再在 domU 里创建
> 分区表使用。很可能导致分区中分区的 sector size 与实际硬盘的错位。但是粗略地计
> 算分区中分区的 offset 表明没有错位,可能是有其它因素影响 offset。
>
> 这个原因简称为“分区套分区”
>
觉得这个可以仔细算算,比较懒了于是我不动手了。。。哪位有空算下吧。
> b2. sda 中的分区被 xen (blkfront) 映射进 domU 后,
>
> /sys/block/xvda2/queue/rotational
>
> 的值为 0, 因此被 btrfs 当作 ssd 处理。错位的随机写入会非常多,导致
> 硬盘频繁寻道。
>
> 这个原因简称为"btrfs ssd 误判"
>
> b3. 第2答中,sda2 与 sda5 的写入速度相差非常大 (25MB/s vs 80MB/s),
> 而 sda2 所在的硬盘区域恰好是从前 分区套分区 + btrfs ssd 误判的区域。
> 令人怀疑两者的关联。
>
单纯的分区对齐问题没怎么听说会把SMART搞上去,尤其硬盘本身还没有经过太多折磨呢。只知道在不对齐存在的地方性能一定很差。
其实我觉得 btrfs 加不对齐不像是能如此快地把硬盘搞出问题的。。。
>
> 4. sda 速度慢跟 SMART 报的 seek error 有关吗?
>
> 不知道。
>
> 现在很可能已经无关。
>
> 清除 sda 上的分区套分区之后,平均 seek error 从 0.08% 下降到 0.06%. 我
> 们需要再观察几天。
>
这个数据是怎么得到的?
> 5. 换不换硬盘了?
>
> 我的主张:换,因为 sda 的写入速度已经这么低了是事实。seagate 给返厂最
> 好,即使不能给返厂我们也买一个新的。
>
换 +1
当然建议先看看盘有没有可供升级的firmware可以刷一下。
以及我想知道硬盘的具体型号。
> 征求大家的意见。
>
> 征求大家的意见。
>
> --
Thanks,
Aron
--
---
您收到此邮件是因为您订阅了 Google 网上论坛的“TUNA 主邮件列表”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到 [email protected]。
要查看更多选项,请访问 https://groups.google.com/groups/opt_out。