On 04/03/11 11:15, Aldian wrote:
J'administre depuis peu un serveur Ubuntu que je n'éteins jamais. Mais les
rares fois où je l'éteins, et où je le redémarre, j'ai
quasi-systématiquement des erreurs de disques tellement graves que le
système me dit de lancer fsck manuellement et refuse de démarrer. Les
disques que j'utilise sont un peu vieillots, et l'outil SMART de Palimpsest
me dit qu'ils ont "quelques mauvais secteurs".
(snip)
D'où ma question: comment ce problème est-il géré d'habitude?

Le plus important est de monitorer les données SMART (souvent avec smartmontools, ça s'utilise en ligne de commande et permet simplement d'envoyer des mails d'alerte), et de changer le disque au moindre hoquet de SMART.

Il ne faut pas lancer de filesystem check sur un disque monté, par contre il est possible de programmer une étape de maintenance de temps en temps pendant laquelle le server est coupé (tout server qui nécessite un uptime ne permettant pas une coupure tous les mois doit être redondé), en général tard dans la nuit ou a tout moment où les stats du service indique une faible utilisation.

Certains filesystems permettent des checks "à chaud", ZFS et BTRFS en particulier, mais le support de ZFS sous linux n'est pas encore idéal, et BRTFS est encore un peu trop jeune pour être mis en prod (je ne sais même pas si cette feature a été ajoutée à BTRFS, je sais juste que c'était dans la wishlist).

XFS est souvent sélectionné dans ce genre de situation, car il est robuste et permet des filesystems check très rapide, diminuant ainsi le downtime pour maintenance.

Finalement, il est possible de créer un snapshot temporaire d'un volume LVM et de réaliser un fsck sur le snapshot alors que le volume d'origine est toujours monté et utilisé, mais bien sûr, cela nécessite d'utiliser LVM. Pour réaliser ce genre de choses, on peut s'inspirer de e2croncheck de Theodore Ts'o.
http://ftp.kernel.org/pub/linux/kernel/people/tytso/e2croncheck

Bonne continuation

Ju
--
Si l'oeuf tombe sur la pierre, ... malheur a l'oeuf
Si la pierre tombe sur l'oeuf, ... malheur a l'oeuf

--
Liste de diffusion ubuntu-fr [email protected]
Pour s'abonner ou se désabonner : 
https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte

Répondre à