benji, dimanche 3 février 2008, 07:59:25 CET > > Bonjour à tous, ’jour,
> j'ai un serveur sous debian etch qui a planté (ping mais plus > aucun service : ssh, apache ...), j'ai trouvé dans le syslog > des erreurs assez curieuses : > > Feb 2 12:01:45 ns3 kernel: BUG: unable to handle kernel paging > request at virtual address 08000030 > Feb 2 12:01:45 ns3 kernel: printing eip: > Feb 2 12:01:45 ns3 kernel: c018f041 > Feb 2 12:01:45 ns3 kernel: *pdpt = 00000000086c6001 > Feb 2 12:01:45 ns3 kernel: *pde = 000000000bb71067 > Feb 2 12:01:45 ns3 kernel: *pte = 0000000000000000 > Feb 2 12:01:45 ns3 kernel: Oops: 0000 [#1] > Feb 2 12:01:45 ns3 kernel: SMP > Feb 2 12:01:45 ns3 kernel: Modules linked in: > Feb 2 12:01:45 ns3 kernel: CPU: 1 > Feb 2 12:01:45 ns3 kernel: EIP: 0060:[dqput+14/353] Not > tainted VLI > Feb 2 12:01:45 ns3 kernel: EFLAGS: 00010206 (2.6.23.9-intel > #1) Feb 2 12:01:45 ns3 kernel: EIP is at dqput+0xe/0x161 > Feb 2 12:01:45 ns3 kernel: eax: 08000000 ebx: 08000000 > ecx: 00000000 edx: 00000000 > Feb 2 12:01:45 ns3 kernel: esi: 00000000 edi: c22ffeb4 > ebp: 0000003b esp: c22ffe58 > Feb 2 12:01:45 ns3 kernel: ds: 007b es: 007b fs: 00d8 > gs: 0000 ss: 0068 > Feb 2 12:01:45 ns3 kernel: Process kswapd0 (pid: 259, > ti=c22fe000 task=c2290550 task.ti=c22fe000) > Feb 2 12:01:45 ns3 kernel: Stack: c01d1a8a f7db69d4 c0180d7d > c22bc240 df101864 c018fa47 df101864 d7991770 > Feb 2 12:01:45 ns3 kernel: c01ccd23 df101864 df10199c > c0175797 c22ffeb4 df10186c df101864 c0175844 > Feb 2 12:01:45 ns3 kernel: ef6cb0d4 ef6cb0dc 00000000 > 00000080 c0175b41 00000080 00000080 f55576c8 > Feb 2 12:01:45 ns3 kernel: Call Trace: > Feb 2 12:01:45 ns3 kernel: [journal_start+134/178] > journal_start +0x86/0xb2 > Feb 2 12:01:45 ns3 kernel: [invalidate_inode_buffers+14/153] > invalidate_inode_buffers+0xe/0x99 > Feb 2 12:01:45 ns3 kernel: [dquot_drop+38/76] > dquot_drop+0x26/0x4c Feb 2 12:01:45 ns3 kernel: > [ext3_dquot_drop+54/76] ext3_dquot_drop +0x36/0x4c > Feb 2 12:01:45 ns3 kernel: [clear_inode+148/246] clear_inode > +0x94/0xf6 > Feb 2 12:01:45 ns3 kernel: [dispose_list+75/198] > dispose_list+0x4b/ 0xc6 > Feb 2 12:01:45 ns3 kernel: [prune_icache+370/388] > prune_icache +0x172/0x184 > Feb 2 12:01:45 ns3 kernel: [shrink_icache_memory+20/43] > shrink_icache_memory+0x14/0x2b > Feb 2 12:01:45 ns3 kernel: [shrink_slab+309/408] shrink_slab > +0x135/0x198 > Feb 2 12:01:45 ns3 kernel: [balance_pgdat+522/797] > balance_pgdat +0x20a/0x31d > Feb 2 12:01:45 ns3 kernel: [kswapd+252/254] kswapd+0xfc/0xfe > Feb 2 12:01:45 ns3 kernel: [autoremove_wake_function+0/51] > autoremove_wake_function+0x0/0x33 > Feb 2 12:01:45 ns3 kernel: [autoremove_wake_function+0/51] > autoremove_wake_function+0x0/0x33 > Feb 2 12:01:45 ns3 kernel: [schedule+871/1026] > __sched_text_start +0x367/0x402 > Feb 2 12:01:45 ns3 kernel: [autoremove_wake_function+0/51] > autoremove_wake_function+0x0/0x33 > Feb 2 12:01:45 ns3 kernel: [kswapd+0/254] kswapd+0x0/0xfe > Feb 2 12:01:45 ns3 kernel: [kthread+52/85] kthread+0x34/0x55 > Feb 2 12:01:45 ns3 kernel: [kthread+0/85] kthread+0x0/0x55 > Feb 2 12:01:45 ns3 kernel: [kernel_thread_helper+7/16] > kernel_thread_helper+0x7/0x10 > Feb 2 12:01:45 ns3 kernel: ======================= > Feb 2 12:01:45 ns3 kernel: Code: 80 25 78 c0 01 5b ba 64 00 > 00 00 a1 d8 40 8b c0 89 d1 99 f7 f9 0f af 05 6c 33 82 c0 c3 53 > 83 ec 10 89 c3 85 c0 0f 84 4e 01 00 00 <83> 78 30 00 75 3e c7 > 04 24 a0 f3 6a c0 e8 59 7a f9 ff c7 04 24 > Feb 2 12:01:45 ns3 kernel: EIP: [dqput+14/353] > dqput+0xe/0x161 SS:ESP 0068:c22ffe58 > > > J'ai cherché sur le net les causes de "BUG: unable to handle > kernel paging request at virtual address" mais pas grand chose > sur debian ou alors en rapport avec des périphériques ou > drivers que je n'utilise pas. > Quelqu'un pourrait m'aider à déchiffrer ça ? Ben, ce sont de jolies plantades du noyau. Il a des problèmes avec la mémoire (« paging request »), et cela se passe avec le swap (« Process kswapd »). Trois possibilités : — un bogue dans le noyau (peu probable) ; — un problème avec le disque qui contient la swap ; — un problème avec la mémoire. Je commencerais par un memtest86+ (pendant plusieurs heures, et un vrai « plusieurs », pas 2 ou 3, p.ex. pendant une nuit). J’essaierais aussi d’autres barrettes, ou une par une s’il y en a plusieurs, ou en les inversant. Certaines erreurs ne se produisent que (ou se produisent plus fréquemment) lorsque le PC est sous une forte charge, notamment en entrées-sorties. Essayer des programmes qui lisent et manipulent de gros fichiers (plus gros que la mémoire) est un autre test. -- Sylvain Sauvage

