On Sat, 29 Sep 2007 18:02:53 +0900
Mitsuru IWASAKI 
<[&#x30E1;&#x30FC;&#x30EB;&#x30A2;&#x30C9;&#x30EC;&#x30B9;&#x4FDD;&#x8B77;]> 
wrote:

 | ちょっと前にcissドライバの話が出たので便乗します。
 | HP SmartArray 6i, 6400, E200などで、
 |         ciss0: ADAPTER HEARTBEAT FAILED
 | というコンソールメッセージが出力されフリーズする現象を
 | たまに聞きますが、これを調べたいと思っています。
 | ものが手元にないのが辛いところですが、情報をお持ちの方、
 | パッチを試して頂ける方、協力をお願いします。

SmartArray E200i(ML350 G5で使っています)で、何度か不定期に
上記メッセージを経験しています。

 | ちょっと調べたところ、共通の症状としてこんな感じです。
 |  - pingに反応するのでカーネルは死んでいない模様
 |  - ディスクI/Oを伴う処理は一切反応しない
 |  - こうなったら今のところリブートするしかない
 |  - ハードウェア交換で解決する場合もあるので、個体固有の問題かも

わたしのところで発生した症状と同じです。

これに関係するかどうかわかりませんが、わたしのところでは
PPM2の障害が今年に入って2度ほど発生していて、2度目は電源すら
入らない状態になりました。保守業者さんがいろいろチェックした結果、
二重化している電源ユニットを制御するモジュールの不具合とのことで、
該当するモジュールを交換しました。その後一ヶ月ほど経ちますが、
今のところADAPTER HEARTBEAT FAILEDは出ていません。
# Smart Start CDでは全く不具合が発見できませんでした。

 | まず、手始めにHEARTBEATモニタリングのところを眺めてみたところ、
 | FreeBSD側ではNOPメッセージの定期書き込みが無かったので、これを
 | 追加してみました(RELENG_6用とCURRENT用のパッチ)。
 | 
 | http://people.freebsd.org/~iwasaki/ciss/ciss-nop-message-6.patch
 | http://people.freebsd.org/~iwasaki/ciss/ciss-nop-message-7.patch
 | 
 | これが原因なのか不明なのですが、とりあえずこのパッチに悪い副作用
 | が無いことを確認して頂ける、勇気ある人柱を募集します :-)

今すぐ試せないのですが、時間ができたら試してみます。

-- 
Masaki YATSU / 谷津昌樹 
<[&#x30E1;&#x30FC;&#x30EB;&#x30A2;&#x30C9;&#x30EC;&#x30B9;&#x4FDD;&#x8B77;]>

メールによる返信