Bogdan-Stefan Rotariu wrote:
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Buna seara,

Am o mica problema, legata de urmatoarea configuratie si de ProSys.
Poate aveti idee sau stiti pe cineva de acolo care are putin mai mult de
2 neuroni si ar putea gandi destul de rezonabil si nu cu idei de genul e
de la "CentOS", ca pe Windows Server 2003 merge, etc.

CPU: 2 x (INTEL Quad Core Xeon E5405 / 2GHz / 12MB / 1333MHz / LGA771)
MB: Intel Server Board S5000
RAM: 4 x (KINGSTON 2GB DDR2 667MHz ECC Fully Buffered)
RAID: ARECA ARC-1220 ? PCIE x8 to 8ports SATA-II, 256MB on board, RAID
0/1/(0+1)/3/5/6
HDD: 6 x (SEAGATE Barracuda 7200.11 1TB 7200rpm 32MB cache SATA NCQ 3Gbit/s)

Linux 32bit (din diferite motive), Centos 5.1, kernel 2.6.24.4 (testate:
2.6.18-53.1.14.el5.centos.plusPAE, 2.6.18-53.1.14.el5PAE,
2.6.18-53.el5PAE, + alte versiuni la sfatul lui wolfy)
Problema :

Masina a rulat in idle, fara probleme, pana sa ajunga in productie, a
fost relativ testata, si totul functiona ok. Pe ea ruleaza un server
NFS, un PostgreSQL si niste encodere flv. Dupa cateva ore de rulare,
rareori la incarcari de 2-3%, masina se blocheaza (totul random) cu
erori de genul :
Apr  6 08:04:42 db kernel: CPU#7: Unexpected int18 (Machine Check).
Apr  6 08:04:42 db kernel: CPU#4: Unexpected int18 (Machine Check).
Apr  6 08:04:42 db kernel: CPU#6: Unexpected int18 (Machine Check).
Apr  6 08:04:42 db kernel: CPU#5: Unexpected int18 (Machine Check).
(nomce in bootloader, altfel murea fara sa zica nimic.)

Pe net nu am gasit nimic legat de aceasta problema, dar vreau, pareri si
idei pentru a putea demonstra (ceva ce stiu sigur ca e hardware, de asta
doresc injuraturile pe offtopic) celor de la ProSys, ca sunt total in
aer, si sa lase solutiile de genul sa refac array-urile, sa pun alt
linux, etc. :)

Astept parerile voastre...

P.S. Putin offtopic

Dupa multe sfaturi (thx rpetre) si discutii cu cei de la ProSys s-a
putut scoate procesorul (al 2lea), si masina functioneaza normal, acum
trebuie sa le demonstrez ca e de la hardware si nu de la sistemul de
operare...

Any other horror story cu prosys ?

pe vremea cand lucram acolo (cu ceva ani in urma) eu patchuiam toata ziua pe la bios-uri/bmc-uri/fru-uri pentru bube de genu' asta. in principiu e posibil ca pe masina ta sa fie cpu-uri din stepping-uri diferite si fara o versiune "buna" de bios sa nu mearga in veci cu ambele procesoare simultan. la fel de bine poate fi o duda in cpu power module care s-o ia razna cand ti-e lumea mai draga, sau vre-o lipitura rece pe undeva pe motherboard. in mod cert e un defect fizic. te-ai uitat in bmc logs? ar trebui sa scrie acolo cand da cu procesoru' de pereti. iar faza cu winblowsu e in felu' urmator: p'ala il doare in basca de mce int18, el baga capu'ntre umeri si continua cu 4 procesoare, d'aia "merge in windows". ps: nu mai stiu cum e acum, dar eu reglam problemele astea tete-a-tete cu clientu' nu ajungeam in situatii d'astea jenante. eh, alte vremuri taica...

--
Best Regards,
Sorin Toma

_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug

Raspunde prin e-mail lui