Le mercredi 9 Novembre 2005 21:32, Rémi Goyard a écrit : > Salut, > > Voila, j'ai une machine serveur sous mandriva linux LE 2005. > Or, de temps en temps, parfois aprés un mois d'activité, parfois aprés 2 > jours, ca dépends ... la machine s'arrete ... du moins tout ne s'arrete > pas, la machine répond au PING, mais pas au SSH, par exemple, elle affiche > une page HTML, mais pas le site (connexion à la base de données MySQL > hébergée sur cette machine !). De plus, si je vais "devant" la machine le > serveur X est lancé, mais impossible de me logger, CTRL+ALT+F2 et là aussi > impossible de me logger (par contre le prompt de login s'affiche !). Le > seul moyen que j'ai trouvé pour retrouver un bon fonctionnement de ma > machine, est un RESET, or comme vous devez vous en doutez, cette solution > ne me conviens pas ... Essayant de comprendre cette panne, je suis allé, > aprés un reboot, voir les entrées dans /var/log/messages et le dernier > message est : > > Nov 8 04:52:34 theoserv1 kernel: [<c019c323>] shrink_slab+0x113/0x180 > Nov 8 04:52:34 theoserv1 kernel: [try_to_free_pages+226/416] > try_to_free_pages+0xe2/0x1a0 Nov 8 04:52:34 theoserv1 kernel: > [<c019d372>] try_to_free_pages+0xe2/0x1a0 Nov 8 04:52:34 theoserv1 kernel: > [__alloc_pages+213/992] __alloc_pages+0xd5/0x3e0 Nov 8 04:52:34 theoserv1 > kernel: [<c01968e5>] __alloc_pages+0xd5/0x3e0 Nov 8 04:52:34 theoserv1 > kernel: [__get_free_pages+30/64] __get_free_pages+0x1e/0x40 Nov 8 > 04:52:34 theoserv1 kernel: [<c0196c0e>] __get_free_pages+0x1e/0x40 Nov 8 > 04:52:34 theoserv1 kernel: [__pollwait+128/192] __pollwait+0x80/0xc0 Nov > 8 04:52:34 theoserv1 kernel: [<c01c7400>] __pollwait+0x80/0xc0 Nov 8 > 04:52:34 theoserv1 kernel: [tcp_poll+240/384] tcp_poll+0xf0/0x180 Nov 8 > 04:52:34 theoserv1 kernel: [<c0301bb0>] tcp_poll+0xf0/0x180 Nov 8 > 04:52:34 theoserv1 kernel: [sock_poll+39/48] sock_poll+0x27/0x30 Nov 8 > 04:52:34 theoserv1 kernel: [<c02d49c7>] sock_poll+0x27/0x30 Nov 8 > 04:52:34 theoserv1 kernel: [do_pollfd+144/160] do_pollfd+0x90/0xa0 Nov 8 > 04:52:34 theoserv1 kernel: [<c01c7d60>] do_pollfd+0x90/0xa0 Nov 8 > 04:52:34 theoserv1 kernel: [do_poll+93/192] do_poll+0x5d/0xc0 Nov 8 > 04:52:34 theoserv1 kernel: [<c01c7dcd>] do_poll+0x5d/0xc0 > Nov 8 04:52:34 theoserv1 kernel: [sys_poll+369/560] sys_poll+0x171/0x230 > Nov 8 04:52:34 theoserv1 kernel: [<c01c7fa1>] sys_poll+0x171/0x230 > Nov 8 04:52:34 theoserv1 kernel: [sysenter_past_esp+82/117] > sysenter_past_esp+0x52/0x75 Nov 8 04:52:34 theoserv1 kernel: [<c0102e5d>] > sysenter_past_esp+0x52/0x75 Nov 8 04:52:34 theoserv1 kernel: Code: 00 00 > 55 89 e5 53 8b 5d 08 8b 43 24 85 c0 74 06 ff 43 24 5b 5d c3 ff 43 24 f6 83 > 1c 01 00 00 0f 75 26 8d 53 08 8b 43 08 8b 4a 04 <89> 01 89 48 04 a1 3c 29 > 3a c0 89 50 04 89 43 08 c7 42 04 3c 29 > > Par contre ca me parle pas trop tout ca ... > Si quelqu'un avait une idée, ce serait super, ou alors y a t'il un moyen > d'avoir plus d'informations ou du moins d'en avoir de plus "lisibles" ?
Bonjour, Quelques suggestions : manque de mémoire du fait d'une partition swap abimée (refaire un mkswap), d'une mémoire défaillante, d'un processus saturant du fait d'un bogue, d'un disque dur défaillant, d'un autre composant défaillant, d'échauffement du cpu, une mise à jour qui s'est mal passée, d'une partition pleine, etc. Je mettrais sous surveillance accrue le cpu (lm_sensors), un memtest, e2fsck sur le disque, df, etc. Un log périodique de la quantité de mémoire utilisée serait intéressant. Taper Alt-Sys-h dans une console texte (après Ctrl-Alt-F2 par exemple) et ensuite taper une des commandes Alt-Sys- (Attention : le clavier devient qwerty). Cela peut peut-être éviter un reset brutal sans démontage. Voilà, ce sont quelques idées. -- Alain rpnpif
____________________________________________________ Want to buy your Pack or Services from Mandriva? Go to http://store.mandriva.com Join the Club : http://www.mandrivaclub.com ____________________________________________________
