藤原@今度2度目の zpool HDD 故障に対応予定です。

Solaris ベースでの知識ですが、参考までに。

2012年4月2日17:21 NAKAJI Hiroyuki <[email protected]>:

> で、BUFFALOの1.5TBなドライブ2台をミラーで/homeに使っていたところ、
>
>  pool: mypool
>  state: DEGRADED
> status: One or more devices could not be opened.  Sufficient replicas exist 
> for
>        the pool to continue functioning in a degraded state.
> action: Attach the missing device and online it using 'zpool online'.
>   see: http://www.sun.com/msg/ZFS-8000-2Q
>  scan: resilvered 10.4G in 1h21m with 0 errors on Sun Aug  7 13:56:16 2011
> config:
>
>        NAME                      STATE     READ WRITE CKSUM
>        mypool                    DEGRADED     0     0     0
>          mirror-0                DEGRADED     0     0     0
>            11857334834842275203  UNAVAIL      0     0     0  was /dev/da4
>            da3                   ONLINE       0     0     0
>
> errors: No known data errors
>
> なんてことになってしまっていました。同時に購入した2台のHDDなのでda3も油断
> なりません。
>
> まだ失ったものはなさそうですが、この先やるべきことは、おおまかには
>
> 0. 落ち着く
> 1. da3のバックアップを取る
> 2. UNAVAILなda4をmypoolから外す
> 3. (容量がda3以上の)新しいディスクを用意する
> 4. それをmypoolに追加する
>
> ですか?

コントローラレベルで反応しなくなった経験では、下手に不良ドライブにアクセスすると、
ZFS が I/O 応答待ち等で、システムがブロックしてしまったりするので:

  - zfs レベルでの通常アクセス
  - 不良ディスクをつないだままでの zpool scrub やディスク追加

はやめた方が良いと思います。

> そして、2と4でzpoolコマンドをどう使うかという問題が続く次第です。
>
> 今のようにda4がカーネルから(たぶんBIOSでも)見えなくなっている状態でUNAVAIL
> なディスクをmypoolから外す場合、
>
> zpool remove mypool 11857334834842275203
>
> でよいですか?

"zpool detach mypool <devicename>" でプールから除外できます。

"man zpool" によると、remove は通常用途のデバイスには使えない模様。

        This command currently  only supports removing hot spares, cache, and
         log devices.


そのまま稼動させておくと、不良 HDD へのアクセスが発生してしまうので、
とりあえずは、"zpool detach" でプールからディスクを切り離してしまいましょう。

新規ディスクにブート設定とかが記録されていなければ、後は以下の手順で行ける筈。

  - シャットダウン
  - ディスクの入れ替え
  - 再起動
  - zpool attach で新規ディスク追加

他の用途のディスクを再利用する場合、起動時に変な挙動をして欲しくないので、
僕の場合なら以下の感じで進めると思います。

  - シャットダウン
  - ディスクの入れ替え
  - 新規ディスクは、信号ケーブルを外して再起動
  - SATA のホットプラグ機能を使って、新規ディスクを認識
  - zpool attach で新規ディスク追加

BIOS 設定によっては、SATA のつもりが IDE エミュレーションだったので、
ホットプラグが機能しない、などという落とし穴があったりします(笑)

> 現在、それからどうするんだっけと想像できない程度には、「落ち着く」ができて
> いない気がします。

私自身は、一台怪しくなっても交換するまで比較的精神衛生に優しい
『HDD x 3 でミラーリング』という構成に落ち着きました。参考になれば幸いです。

# http://d.hatena.ne.jp/flying-foozy/20110921/1316607157

-- 
----------------------------------------------------------------------
FUJIWARA Katsunori([email protected])
_______________________________________________
ug-jposug mailing list
[email protected]
http://mail.opensolaris.org/mailman/listinfo/ug-jposug

メールによる返信