Bogdan-Stefan Rotariu wrote:
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Buna seara,
Am o mica problema, legata de urmatoarea configuratie si de ProSys.
Poate aveti idee sau stiti pe cineva de acolo care are putin mai mult de
2 neuroni si ar putea gandi destul de rezonabil si nu cu idei de genul e
de la "CentOS", ca pe Windows Server 2003 merge, etc.
CPU: 2 x (INTEL Quad Core Xeon E5405 / 2GHz / 12MB / 1333MHz / LGA771)
MB: Intel Server Board S5000
RAM: 4 x (KINGSTON 2GB DDR2 667MHz ECC Fully Buffered)
RAID: ARECA ARC-1220 ? PCIE x8 to 8ports SATA-II, 256MB on board, RAID
0/1/(0+1)/3/5/6
HDD: 6 x (SEAGATE Barracuda 7200.11 1TB 7200rpm 32MB cache SATA NCQ 3Gbit/s)
Linux 32bit (din diferite motive), Centos 5.1, kernel 2.6.24.4 (testate:
2.6.18-53.1.14.el5.centos.plusPAE, 2.6.18-53.1.14.el5PAE,
2.6.18-53.el5PAE, + alte versiuni la sfatul lui wolfy)
Problema :
Masina a rulat in idle, fara probleme, pana sa ajunga in productie, a
fost relativ testata, si totul functiona ok. Pe ea ruleaza un server
NFS, un PostgreSQL si niste encodere flv. Dupa cateva ore de rulare,
rareori la incarcari de 2-3%, masina se blocheaza (totul random) cu
erori de genul :
Apr 6 08:04:42 db kernel: CPU#7: Unexpected int18 (Machine Check).
Apr 6 08:04:42 db kernel: CPU#4: Unexpected int18 (Machine Check).
Apr 6 08:04:42 db kernel: CPU#6: Unexpected int18 (Machine Check).
Apr 6 08:04:42 db kernel: CPU#5: Unexpected int18 (Machine Check).
(nomce in bootloader, altfel murea fara sa zica nimic.)
Pe net nu am gasit nimic legat de aceasta problema, dar vreau, pareri si
idei pentru a putea demonstra (ceva ce stiu sigur ca e hardware, de asta
doresc injuraturile pe offtopic) celor de la ProSys, ca sunt total in
aer, si sa lase solutiile de genul sa refac array-urile, sa pun alt
linux, etc. :)
Astept parerile voastre...
P.S. Putin offtopic
Dupa multe sfaturi (thx rpetre) si discutii cu cei de la ProSys s-a
putut scoate procesorul (al 2lea), si masina functioneaza normal, acum
trebuie sa le demonstrez ca e de la hardware si nu de la sistemul de
operare...
Any other horror story cu prosys ?
pe vremea cand lucram acolo (cu ceva ani in urma) eu patchuiam toata
ziua pe la bios-uri/bmc-uri/fru-uri pentru bube de genu' asta. in
principiu e posibil ca pe masina ta sa fie cpu-uri din stepping-uri
diferite si fara o versiune "buna" de bios sa nu mearga in veci cu
ambele procesoare simultan.
la fel de bine poate fi o duda in cpu power module care s-o ia razna
cand ti-e lumea mai draga, sau vre-o lipitura rece pe undeva pe
motherboard. in mod cert e un defect fizic. te-ai uitat in bmc logs? ar
trebui sa scrie acolo cand da cu procesoru' de pereti. iar faza cu
winblowsu e in felu' urmator: p'ala il doare in basca de mce int18, el
baga capu'ntre umeri si continua cu 4 procesoare, d'aia "merge in windows".
ps: nu mai stiu cum e acum, dar eu reglam problemele astea tete-a-tete
cu clientu' nu ajungeam in situatii d'astea jenante. eh, alte vremuri
taica...
--
Best Regards,
Sorin Toma
_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug