> 内部で arp(8) の -n オプションを自動的に有効にしているのですな。
> FreeBSDで加えられたNetBSD辺りにはないコードです。おそらく、
http://cvsweb.netbsd.org/bsdweb.cgi/src/usr.sbin/arp/arp.c?only_with_tag=MAIN
で探してみました。
NetBSD では元々はあったのが、Revision 1.27 で修正されたようです。
--
Revisi
> それで FreeBSD 4.11 の w.c は -n 指定時わざわざそれを
> gethostbyname(3) して inet_ntoa(3) して表示しています。
> -n の動作は「逆引きしない」ではなく「正引きして表示する」が実情なようです。
>
> 7.2R のコードではその部分がそっくり存在しないような気がします。
http://www.jp.FreeBSD.org/cgi/cvsweb.cgi/src/usr.bin/w/w.c
を見ると、Revision 1.48 で変更が入ったみたいですね。
理由は、
When -n is specified, don't
> もしかして隠しメニュー内だったでしょうか?
> "E"のつかないシリーズであれば、BIOS上「Ctrl-F1」押下で
> メニュー項目が微妙に増えてくれると思います。
おお。こんな機能が。たしかに増えました。
しかし、DES の項目はありませんでした。
> 「gigabyte ズレる 時間 P35」でググると報告もひっかかります。
出てますね。board の Revision によっては、DES がついてないものも
あるみたいですね。
C1E と EIST を disable にすると、、、などと書いている人が
いたので、BIOS の設定変更をいくつか試してみたところ、
C1E
> 7R系はは試していないので、ちょっと恐いのですが、6.4Rなら対応可能なので、
> 2つ先の週末までにでもやってみたいと思います。
先の mail に書きましたが、
手元にある G33-DS3R, G33m-DS2R の 7.1-RELEASE でもおかしい感じです。
> さて、昨日(1/6)から実行していたsleep 10;date +%sの繰り返しですが、date
> の間隔について
> 10秒 … 7387回
> 11秒 … 962回
> 12秒 …1回 15:43:21まで
> 16秒 …1回 15:44:30まで
> 388秒 …
# ML に届いていないようなので再送。重複したらすみません。
> 流れを見ていますとカーネルの時間計測に問題がありそうな気がするのですが、
> sysctl kern.timecounter.choice
> 及び
> sysctl kern.timecounter.hardware
> はどうなっていますでしょうか?
手元に G33-DS3R と G33m-DS2R で FreeBSD 7.1-RELEASE が動いていたので、
見てみました。
kern.timecounter.choice: TSC(-100) HPET(900) ACPI-fast(1000) i8254(0)
> > > 1. 何故sleepがうまくいかないことがあるのでしょうか?
> > fwcontrol が動いている間、ものすごく忙しくなっていて、sleep の後の
> > pkill がなかなか実行されない、というような状態なのかもしれません。
>
> 最初のメールに書いたように
> Intel S875WP1-E + Pentium 4 (Prescott) 3.0GHz
> のときは殆んど同じ使い方をしていて起きてなかったので、その可能性が低い
> と思っています。
マザーと CPU が変わっているということは、chipset 等の主要な部分が変わって
いるということなので、
> 但し、起きる曜日と時間の組合せは一定しています。
> 例えば、火曜日の17時30分からから1645秒とかの録画予約は必ず上記現象が発
> 生しています。
>
> 1. 何故sleepがうまくいかないことがあるのでしょうか?
fwcontrol が動いている間、ものすごく忙しくなっていて、sleep の後の
pkill がなかなか実行されない、というような状態なのかもしれません。
録画中に top とか vmstat などで system の状態を確認してみてください。
他の時間帯でも、fwcontrol 実行中に、
date ; sleep 10 ; date
などを何回か実行して
いわさきです
> 早速のフォローアップありがとうございました!
> 近日中にサーバ再起動のスケジュールを組んでみたいと思います。
宜しくお願いします(_ _)
> >hw.ciss.nop_message_heartbeat="1"
>
> これは6.2RELEASEでも有効でしょうか?
いえ、7.0 or laterです。6系には突っ込んでません。
一応パッチは以下にありますが、ちゃんと動くか不安かもです。
http://people.freebsd.org/~iwasaki/ciss/ciss-nop-message-health-check-RELENG_6.diff
いわさきです
> 皆様はじめまして、末廣と申します。
ども
> 私どもではML310とML150(ともに4core)にてあるシステムを運用してい
> るのですが、標記の件が数ヶ月に一度必ず発生します。
>
> 上記ドライバの更新がされたかなと期待をして 7.0 RELEASE への新規
> インストールを試みたりしてみたのですが、同様でした。
>
> 使用しているものは、
>
> FreeBSD 6.2-RELEASE および、FreeBSD 7.0-RELEASE(ともにamd64)
>
> です。
>
> サーバのファームとE200のファームは共に最新に上
いわさきです
河野さん:
> 以前と同じ10/26 00:00:00 GMT のCurrentにあてて試してみました。
> 3日ほど運転してますが、問題なく動いてます。もともとHeartbeatの
> 問題がでる環境ではなかったのでPanicしなくなったと言うだけなので
> 動作報告には程遠いのですが...
いえいえ、何分自分の手元にモノが無いので、非常に助かります。
何度も動作確認して頂きありがとうございました。
下川さん:
> 私もパッチを確認しました。
> callback関数が呼ばれるときはlockを保持している
> はずですし、 問題ないと思います。
> ごくろうさまでした。
いわさきです
> こんな感じでNOP messageを投げるだけのパッチを作ってみます。
> ずいぶん小さくなりそうです :-)
http://people.freebsd.org/~iwasaki/ciss/ciss-fix-20071101.patch
今度こそ、どうでしょう?
では
# もう少し見直す時間が欲しいところですが、なかなか腰を据えて
# 取り組めないのが辛いところです...
いわさきです
下川さん、お久しぶりです :)
> codeを斜め読みしだけなので, 間違ってるかもしれませんが,
> 気になった点をいくつか指摘させてください.
いやー指摘頂いた点は、実は全部不安になってたところなんです。
ありがとうございます。
特に、
> 3. kproc 必要?
> 私の印象ですが, nop送るだけなら, わざわざ, kproc 作る必要が
> あるかなと思います. 同期 request を使うから sleep しなくて
> はいけないのであって, 普通に非同期 request して,
> callback で, struct ciss_reqest を解放する
いわさきです
> こんどのパッチは大丈夫でした。ありがとうございます。
確認して頂いてありがとうございました。
が、下川さんのおかげでもっとスマートなパッチができそうですので、
よろしければまた確認して頂けるとうれしいです。
> でも、10月中頃にCurrentにcommitされていたのに、他の方やCurrentにも報告が
> 上がっていなかったのはなぜでしょう?
うーん、多分そういうごついサーバでCURRENTを動かす強者があまりいないか、
いても性能重視でINVARIANTSとかのオプションを外しているんじゃないかと。
とにかく、河野さんには最初のレポートから丁寧に必要な情報を
いわさきです
> > 手が空いたので作ってみました。ご確認頂ければ幸いです。
> > http://people.freebsd.org/~iwasaki/ciss/ciss_periodic_thread-20071030.patch
>
> レポートした時点に近い10/26 00:00:00 GMT時点のcurrentにあてて
> 試してみました。結果はマルチになる前にpanicしてしまいました。
申し訳ないです、ちょっと急ぎすぎましたね。今度はどうでしょう?
http://people.freebsd.org/~iwasaki/ciss/ciss_periodic_thread
いわさきです
手が空いたので作ってみました。ご確認頂ければ幸いです。
http://people.freebsd.org/~iwasaki/ciss/ciss_periodic_thread-20071030.patch
RELENG_7や6用に差分を作ったりテストして頂ける人、大募集中です :-)
ではでは
いわさきです
> こんにちは、河野と申します。
どもども
> いわさきさんのパッチがcurrentにcommitされてからpanicするように
> なってしまいました。NOPメッセージを送る部分をなくすとpanicしません。
> 環境はHP Proliant ML110G4にSmartArrayE200が入っています。
> 10月26日のCurrentでamd64です。
ご報告どうもありがとうございます。おかげさまで原因はすぐに分かりました。
calloutからsleepしようとしていたのが悪いので、モニタリング処理を
カーネルスレッドで実装し直そうと思います。
手が空いたらパッチを
いわさきです
> | をを、非常に心強いです :)
>
> わたしのところのマシンだけの問題ではなかったようなので、
> 逆に安心(?)しました。
ADAPTER HEARTBEAT FAILEDのレポートは数が少ないし、再現条件がよく分からないし、
発生するマシンでも頻発しているわけでもないし、リブートすれば普通に動くので
完全な故障というわけでもないし、なかなか厄介な感じですね。
なんとなく、HEARTBEATが停止する現象のほとんどが瞬電が原因かなぁと
思っていますがどうでしょうかね?
谷津さんのところの、電源関係のモジュール交換によってこの先問題が発生しなければ
その可能性
いわさきです
> SmartArray E200i(ML350 G5で使っています)で、何度か不定期に
> 上記メッセージを経験しています。
をを、非常に心強いです :)
> これに関係するかどうかわかりませんが、わたしのところでは
> PPM2の障害が今年に入って2度ほど発生していて、2度目は電源すら
> 入らない状態になりました。保守業者さんがいろいろチェックした結果、
> 二重化している電源ユニットを制御するモジュールの不具合とのことで、
> 該当するモジュールを交換しました。その後一ヶ月ほど経ちますが、
> 今のところADAPTER HEARTBEAT FAILEDは出ていませ
いわさきと申します
ちょっと前にcissドライバの話が出たので便乗します。
HP SmartArray 6i, 6400, E200などで、
ciss0: ADAPTER HEARTBEAT FAILED
というコンソールメッセージが出力されフリーズする現象を
たまに聞きますが、これを調べたいと思っています。
ものが手元にないのが辛いところですが、情報をお持ちの方、
パッチを試して頂ける方、協力をお願いします。
ちょっと調べたところ、共通の症状としてこんな感じです。
- pingに反応するのでカーネルは死んでいない模様
- ディスクI/Oを伴う処理は一切反応しな
> 以前からもそうでしたが、非常に稀に Xが暴走することは起こるので、
> 引続き Xが暴走した後にコンソール画面を復旧する方法をご存知の方は
> よろしくお願いいたします。
vidcontrol で何かできそうな感じだったので試してみたところ、使い方が悪いのか、
vidcontrol 80x25 とかやると、コンソールの表示が変化しなくなって
reboot せざるをえない状況になってしまいました。。。
# amd64 だからなのか…。
吉田 充@横浜チーム.情報基盤センター.理化学研究所
([メールアドレス保護])
rootになって、
# rm /tmp/mysql.sock
としてみるとどうでしょう?
> NECのCore duoマシン LaVie RX にFreeBSD 6.0-RELEASEをインストールしま
> した。
>
> 特に問題なくインストールできて、SMPカーネルを作ったのですが、どうもCPU
> が1つしか動いてないようです。
>
> 症状としては、cpu自体は2つ認識しているようですがTopで見るとCPU0しか動
> いてない感じです。負荷かけてもtopでのCPUの使用率が50%までしか上りません。
>
> 何か間違いがあるか確認して頂けますでしょうか?
BIOS で HTT disable にしておくか、
sysctl -w machdep.hypert
22 matches
Mail list logo