以前からもそうでしたが、非常に稀に Xが暴走することは起こるので、
引続き Xが暴走した後にコンソール画面を復旧する方法をご存知の方は
よろしくお願いいたします。
vidcontrol で何かできそうな感じだったので試してみたところ、使い方が悪いのか、
vidcontrol 80x25 とかやると、コンソールの表示が変化しなくなって
reboot せざるをえない状況になってしまいました。。。
# amd64 だからなのか…。
吉田 充@横浜チーム.情報基盤センター.理化学研究所
# ML に届いていないようなので再送。重複したらすみません。
流れを見ていますとカーネルの時間計測に問題がありそうな気がするのですが、
sysctl kern.timecounter.choice
及び
sysctl kern.timecounter.hardware
はどうなっていますでしょうか?
手元に G33-DS3R と G33m-DS2R で FreeBSD 7.1-RELEASE が動いていたので、
見てみました。
kern.timecounter.choice: TSC(-100) HPET(900) ACPI-fast(1000) i8254(0)
7R系はは試していないので、ちょっと恐いのですが、6.4Rなら対応可能なので、
2つ先の週末までにでもやってみたいと思います。
先の mail に書きましたが、
手元にある G33-DS3R, G33m-DS2R の 7.1-RELEASE でもおかしい感じです。
さて、昨日(1/6)から実行していたsleep 10;date +%sの繰り返しですが、date
の間隔について
10秒 … 7387回
11秒 … 962回
12秒 …1回 15:43:21まで
16秒 …1回 15:44:30まで
388秒 … 1回
内部で arp(8) の -n オプションを自動的に有効にしているのですな。
FreeBSDで加えられたNetBSD辺りにはないコードです。おそらく、
http://cvsweb.netbsd.org/bsdweb.cgi/src/usr.sbin/arp/arp.c?only_with_tag=MAIN
で探してみました。
NetBSD では元々はあったのが、Revision 1.27 で修正されたようです。
--
いわさきです
| をを、非常に心強いです :)
わたしのところのマシンだけの問題ではなかったようなので、
逆に安心(?)しました。
ADAPTER HEARTBEAT FAILEDのレポートは数が少ないし、再現条件がよく分からないし、
発生するマシンでも頻発しているわけでもないし、リブートすれば普通に動くので
完全な故障というわけでもないし、なかなか厄介な感じですね。
なんとなく、HEARTBEATが停止する現象のほとんどが瞬電が原因かなぁと
思っていますがどうでしょうかね?
谷津さんのところの、電源関係のモジュール交換によってこの先問題が発生しなければ
いわさきです
こんにちは、河野と申します。
どもども
いわさきさんのパッチがcurrentにcommitされてからpanicするように
なってしまいました。NOPメッセージを送る部分をなくすとpanicしません。
環境はHP Proliant ML110G4にSmartArrayE200が入っています。
10月26日のCurrentでamd64です。
ご報告どうもありがとうございます。おかげさまで原因はすぐに分かりました。
calloutからsleepしようとしていたのが悪いので、モニタリング処理を
カーネルスレッドで実装し直そうと思います。
いわさきです
手が空いたので作ってみました。ご確認頂ければ幸いです。
http://people.freebsd.org/~iwasaki/ciss/ciss_periodic_thread-20071030.patch
RELENG_7や6用に差分を作ったりテストして頂ける人、大募集中です :-)
ではでは
いわさきです
手が空いたので作ってみました。ご確認頂ければ幸いです。
http://people.freebsd.org/~iwasaki/ciss/ciss_periodic_thread-20071030.patch
レポートした時点に近い10/26 00:00:00 GMT時点のcurrentにあてて
試してみました。結果はマルチになる前にpanicしてしまいました。
申し訳ないです、ちょっと急ぎすぎましたね。今度はどうでしょう?
いわさきです
こんどのパッチは大丈夫でした。ありがとうございます。
確認して頂いてありがとうございました。
が、下川さんのおかげでもっとスマートなパッチができそうですので、
よろしければまた確認して頂けるとうれしいです。
でも、10月中頃にCurrentにcommitされていたのに、他の方やCurrentにも報告が
上がっていなかったのはなぜでしょう?
うーん、多分そういうごついサーバでCURRENTを動かす強者があまりいないか、
いても性能重視でINVARIANTSとかのオプションを外しているんじゃないかと。
とにかく、河野さんには最初のレポートから丁寧に必要な情報を
いわさきです
下川さん、お久しぶりです :)
codeを斜め読みしだけなので, 間違ってるかもしれませんが,
気になった点をいくつか指摘させてください.
いやー指摘頂いた点は、実は全部不安になってたところなんです。
ありがとうございます。
特に、
3. kproc 必要?
私の印象ですが, nop送るだけなら, わざわざ, kproc 作る必要が
あるかなと思います. 同期 request を使うから sleep しなくて
はいけないのであって, 普通に非同期 request して,
callback で, struct ciss_reqest
いわさきです
こんな感じでNOP messageを投げるだけのパッチを作ってみます。
ずいぶん小さくなりそうです :-)
http://people.freebsd.org/~iwasaki/ciss/ciss-fix-20071101.patch
今度こそ、どうでしょう?
では
# もう少し見直す時間が欲しいところですが、なかなか腰を据えて
# 取り組めないのが辛いところです...
いわさきです
皆様はじめまして、末廣と申します。
ども
私どもではML310とML150(ともに4core)にてあるシステムを運用してい
るのですが、標記の件が数ヶ月に一度必ず発生します。
上記ドライバの更新がされたかなと期待をして 7.0 RELEASE への新規
インストールを試みたりしてみたのですが、同様でした。
使用しているものは、
FreeBSD 6.2-RELEASE および、FreeBSD 7.0-RELEASE(ともにamd64)
です。
サーバのファームとE200のファームは共に最新に上げてみたのですが
12 matches
Mail list logo