Ati mai vazut asa ceva? Ma refer la primul proces <defunct> 99.8% CPU
top - 18:10:27 up 2 days, 2:57, 2 users, load average: 12.22, 11.51, 10.44 Tasks: 648 total, 8 running, 638 sleeping, 0 stopped, 2 zombie Cpu(s): 24.6% us, 23.0% sy, 0.0% ni, 50.5% id, 1.0% wa, 0.1% hi, 0.9% si Mem: 16373896k total, 7659644k used, 8714252k free, 7992k buffers Swap: 4200956k total, 20k used, 4200936k free, 3415248k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 20337 oracle 16 0 0 0 0 Z 99.8 0.0 86:49.32 f90webm <defunct> 28226 oracle 15 0 1634m 179m 176m S 55.3 1.1 0:07.71 oracle 151 root 16 0 0 0 0 R 53.0 0.0 3:55.09 kswapd0 20042 oracle 15 0 1633m 285m 280m S 17.6 1.8 0:05.86 oracle 21977 oracle 15 0 66400 37m 3364 S 9.8 0.2 36:21.12 webcached Faza este ca, la o bucata de vreme dupa ce am observat acest zombie, nodul respectiv din cluster a inghetat. Am vazut pe 2 noduri diferite inainte de crash. Prima oara nu am facut legatura, nici acum nu-s prea sigur ca exista o legatura, dar e prea dubios! "top"-ul asta este ultima chestie in care a inghetat, altceva n-a mai iesit din acel computer. Mai e un aspect: masina aia are purcoi de RAM, nu face swap niciodata. Cu toate acestea, in acel moment am vazut cum a intrat in top kswapd0, se vede ca avea 53% CPU cand a inghetat. M-am uitat in partitia de swap cu hexdump si e plina cu stuff, non-zero, chestii care par ale lui Oracle. Si este asa pana la sfarsit. Deci daca nu e folosita, de ce are date in ea? Am creat un fisier de swap de 1.5 GB si l-am pus sa swapeze in asta, iar partitia de swap am dezactivat-o. Fisierul e gol si dupa cateva ore de functionare sub incarcare. _______________________________________________ RLUG mailing list [email protected] http://lists.lug.ro/mailman/listinfo/rlug
