いわさきと申します

ちょっと前にcissドライバの話が出たので便乗します。
HP SmartArray 6i, 6400, E200などで、
           ciss0: ADAPTER HEARTBEAT FAILED
というコンソールメッセージが出力されフリーズする現象を
たまに聞きますが、これを調べたいと思っています。
ものが手元にないのが辛いところですが、情報をお持ちの方、
パッチを試して頂ける方、協力をお願いします。

ちょっと調べたところ、共通の症状としてこんな感じです。
 - pingに反応するのでカーネルは死んでいない模様
 - ディスクI/Oを伴う処理は一切反応しない
 - こうなったら今のところリブートするしかない
 - ハードウェア交換で解決する場合もあるので、個体固有の問題かも

Linuxなどでこういう現象があるのかは知らないのですが、参考までに
ccissドライバの実装と比較して見ています。

まず、手始めにHEARTBEATモニタリングのところを眺めてみたところ、
FreeBSD側ではNOPメッセージの定期書き込みが無かったので、これを
追加してみました(RELENG_6用とCURRENT用のパッチ)。

http://people.freebsd.org/~iwasaki/ciss/ciss-nop-message-6.patch
http://people.freebsd.org/~iwasaki/ciss/ciss-nop-message-7.patch

これが原因なのか不明なのですが、とりあえずこのパッチに悪い副作用
が無いことを確認して頂ける、勇気ある人柱を募集します :-)

ではでは

メールによる返信