Re: Machine en vrac

2009-12-13 Par sujet jerome moliere
Le 10 décembre 2009 17:38, Guy Roussin guy.rous...@teledetection.fr a
écrit :

 Y a un probleme sur les switchs ... des boucles ?
 Le spanning tree est il activé ?


 Il semble en définitive que le switch était bien en cause.. Une des sorties
(est ce le terme??) Gigabit était en cause,
les spécialistes réseaux l'ont désactivé en attendant de se rendre sur
place

Merci de votre mobilisation
Jerome


-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Machine en vrac

2009-12-10 Par sujet jerome moliere
Bonjour à tous,
je me permets de vous contacter avec un léger HS car dans ce cas il ne
s'agit pas d'une debian mais d'une RHEL 5.3 mais je pense que vos conseils
doivent s'appliquer à mon cas sans souci...
je m'occupe d'une infra de serveurs Jboss avec de nombreux environnements
(dev:recettes/homologuation/pre prod/prod) , les machines sont rackees dans
des chassis ..J'ai certaines machin es d'un certain chassis qui sont tres
capricieuses en ce moment:
- répondent très lent(ement au SSH
- affichent un top en 1 ou 2mn!!
 pourtant top montrent 1 CPU à 0.1% (octo cores à 16Go RAM), pas de swap
utilsié, environ 6Go RAM physique bouffée
- df -h ne montre aucun souci de place disque
- les connexions ssh petent spontanement!!!
- mon dernier top a son affichage freeze apres 4mn et la machine ne repond
plus mais ca pinge vite et la connexion ssh est a peu pres normale..

là je dois dire que je ne sais pas où regarder pour débloquer la
situation..je ne vois pas ce qu'il peut se passer
rien de particulier dans les logs /var/log et surtout pas récemment...

Vos conseils me seraient précieux..

-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet jerome moliere
Le 10 décembre 2009 11:51, Antoine Benkemoun antoine.benkem...@gmail.com a
écrit :

 Est-ce possible que ce soit un problème réseau entre ton poste et les
 serveurs en question ?



je ne me hasarderai pas à dire non mais disons que je me connecte en SSH via
mon poste sur le vlan bureautique ou via une machine sur le meme vlan et le
résultat est le même 

-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet François Cerbelle

jerome moliere a écrit :
Le 10 décembre 2009 11:51, Antoine Benkemoun 
antoine.benkem...@gmail.com mailto:antoine.benkem...@gmail.com a écrit :

Est-ce possible que ce soit un problème réseau entre ton poste et
les serveurs en question ?

je ne me hasarderai pas à dire non mais disons que je me connecte en SSH 
via mon poste sur le vlan bureautique ou via une machine sur le meme 
vlan et le résultat est le même 


Qu'est-ce que les machines malades ont en commun entre-elles et n'ont pas en commun avec celles qui 
fonctionnent ?
- Le chassis ? (toutes les machines de ce chassis ont ce problème ET aucune machine de ce chassis 
n'a pas le problème ?)

- Le switch (même raisonnement) ?
- l'alimentation electrique ?
- La masse et la terre ? (regarde si tu n'aurais pas une fuite de courant sur les chassis avec un 
voltmetre, tu peux aussi avec les mains, mais c'est moins agréable)

...

Le problème se pose t il quel que soit le poste client utilisé ?

Avec cette réflexion, cela devrait aider à mieux cibler le périmètre à examiner et les questions 
suivantes.


Fanfan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet Antoine Benkemoun
Est-ce possible que ce soit un problème réseau entre ton poste et les
serveurs en question ?

2009/12/10 jerome moliere jerome.moli...@gmail.com

 Bonjour à tous,
 je me permets de vous contacter avec un léger HS car dans ce cas il ne
 s'agit pas d'une debian mais d'une RHEL 5.3 mais je pense que vos conseils
 doivent s'appliquer à mon cas sans souci...
 je m'occupe d'une infra de serveurs Jboss avec de nombreux environnements
 (dev:recettes/homologuation/pre prod/prod) , les machines sont rackees dans
 des chassis ..J'ai certaines machin es d'un certain chassis qui sont tres
 capricieuses en ce moment:
 - répondent très lent(ement au SSH
 - affichent un top en 1 ou 2mn!!
  pourtant top montrent 1 CPU à 0.1% (octo cores à 16Go RAM), pas de swap
 utilsié, environ 6Go RAM physique bouffée
 - df -h ne montre aucun souci de place disque
 - les connexions ssh petent spontanement!!!
 - mon dernier top a son affichage freeze apres 4mn et la machine ne repond
 plus mais ca pinge vite et la connexion ssh est a peu pres normale..

 là je dois dire que je ne sais pas où regarder pour débloquer la
 situation..je ne vois pas ce qu'il peut se passer
 rien de particulier dans les logs /var/log et surtout pas récemment...

 Vos conseils me seraient précieux..

 --
 Jerome Moliere - Mentor/J
 http://romjethoughts.blogspot.com/
 auteur Eyrolles



Re: Machine en vrac

2009-12-10 Par sujet jerome moliere
Le 10 décembre 2009 12:09, Antoine Benkemoun antoine.benkem...@gmail.com a
écrit :

 A ta place, je commencerais pas regarder si je n'ai pas des erreurs CRC ou
 quelques chose dans ce genre là sur mes switchs. Ca sent le problème réseau
 je trouve.

 humm je ne voulais pas incriminer  le réseau mais il y a une semaine de
cela il y a eut une énorme migration vers un réseau unifié
avec changement de tous les switches..cette machine étant peu usitée en ce
moment Je l'ai regardé ce matin car elle posait problème avec une de ses
copines du même chassis en début de semaine...
Si le switch était en cause , je pourrai avoir une machine ok et pas l'autre
? sur le même chassis ?

Pour les propositions/conseils de Fanfan, je suis chez un client qui ne me
laisse pas d'accès physique aux machines,c ertaines étant mêmes sur un site
B' à 40km de fibre d'ici lol


-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet Kevin Hinault
Le 10 décembre 2009 11:49, jerome moliere jerome.moli...@gmail.com a écrit :

 - répondent très lent(ement au SSH
 - la connexion ssh est a peu pres normale..

Dans la lignée de François, il faut se poser les bonnes questions et
j'ajouterais :
Ais-je un ou plusieurs problèmes distinct ?

Pour tes problèmes SSH, cela fait furieusement penser à une erreur de
résolution dns du côté serveur. Quand sshd n'arrives pas à résoudre
(par le reverse) l'adresse IP du client alors on met un temps fou à se
connecter mais une fois la connexion effectuée, plus de résolution et
donc connexion normale.

-- 
Kévin

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet Jean-Yves Bossard
Bonjour la liste,

C'est pas toujours facile de faire un diag sans avoir les machines sous la main.
J'ai vu un comportement un peu identique à celui decrit sur des machines en 
Centos 5.3 sur lesquelles il y avait du JBoss.

Les lenteurs s'expliquaient par un mauvais paramétrage des pools de connexions 
des JBoss vers les bases de données.

As tu regardé les logs des JBoss ?
Peut être (si ce n'est pas déjà fait) peux tu voir si il y a un nombre élevé de 
TIME_WAIT et de CLOSE_WAIT sur ces machines et éventuellement sur celle où est 
hebergée la base de donnée.


Cordialement,

-- 
Jean-Yves Bossard
/***
Le club StarinuX sympa,convivial,dynamique !
Linux user registered as #363916
http://jeanyves.bossard.free.fr

- Mail Original -
De: François Cerbelle franc...@cerbelle.net
À: debian-user-french@lists.debian.org
Cc: debian-utilisateur debian-user-french@lists.debian.org
Envoyé: Jeudi 10 Décembre 2009 12:01:51 GMT +01:00 Amsterdam / Berlin / Berne / 
Rome / Stockholm / Vienne
Objet: Re: Machine en vrac

jerome moliere a écrit :
 Le 10 décembre 2009 11:51, Antoine Benkemoun 
 antoine.benkem...@gmail.com mailto:antoine.benkem...@gmail.com a écrit :
 Est-ce possible que ce soit un problème réseau entre ton poste et
 les serveurs en question ?
 
 je ne me hasarderai pas à dire non mais disons que je me connecte en SSH 
 via mon poste sur le vlan bureautique ou via une machine sur le meme 
 vlan et le résultat est le même 

Qu'est-ce que les machines malades ont en commun entre-elles et n'ont pas en 
commun avec celles qui 
fonctionnent ?
- Le chassis ? (toutes les machines de ce chassis ont ce problème ET aucune 
machine de ce chassis 
n'a pas le problème ?)
- Le switch (même raisonnement) ?
- l'alimentation electrique ?
- La masse et la terre ? (regarde si tu n'aurais pas une fuite de courant sur 
les chassis avec un 
voltmetre, tu peux aussi avec les mains, mais c'est moins agréable)
...

Le problème se pose t il quel que soit le poste client utilisé ?

Avec cette réflexion, cela devrait aider à mieux cibler le périmètre à examiner 
et les questions 
suivantes.

Fanfan

-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet jerome moliere
Le 10 décembre 2009 12:15, Jean-Yves Bossard jeanyves.boss...@free.fr a
écrit :

 Bonjour la liste,

 C'est pas toujours facile de faire un diag sans avoir les machines sous la
 main.

c'est diablement vrai !!!



 Humm dans le cas préssent les processus Jboss ne sont même pas lancés
j'ai 15.6Go RAM dispo , 124 process dont 1 seul actif (top)
les problèmes de Jboss n'expliqueraient pas des connexions SSH fermées sans
raison, des lenteurs à répondre (l'agent nagios gueule suite à des handshake
non aboutis) et tout cela sans aucune activité des procs de la machine!!!
la conf de Jboss je m'en charge comme aurait dit Nietchemaintenant mes
amis réseau et système là j'ai besoin d'aide!!! lol

je ne vois rien d'anormal dans les logs système,je ne connais que peu de
choses au réseau et en plus le cloisonnement des responsabilités chez mon
client m'empêchent de suivre la majorité de vos fort judicieux conseils

En tout cas je vous remercie de votre aide et de votre mobilisation


-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet Antoine Benkemoun
A ta place, je commencerais pas regarder si je n'ai pas des erreurs CRC ou
quelques chose dans ce genre là sur mes switchs. Ca sent le problème réseau
je trouve.

2009/12/10 jerome moliere jerome.moli...@gmail.com



 Le 10 décembre 2009 11:51, Antoine Benkemoun antoine.benkem...@gmail.coma 
 écrit :

 Est-ce possible que ce soit un problème réseau entre ton poste et les
 serveurs en question ?



 je ne me hasarderai pas à dire non mais disons que je me connecte en SSH
 via mon poste sur le vlan bureautique ou via une machine sur le meme vlan et
 le résultat est le même 


 --
 Jerome Moliere - Mentor/J
 http://romjethoughts.blogspot.com/
 auteur Eyrolles



Re: Machine en vrac

2009-12-10 Par sujet BmailDB
Le jeudi 10 décembre 2009 12:15, Kevin Hinault a écrit :

 Pour tes problèmes SSH, cela fait furieusement penser à une erreur
 de résolution dns du côté serveur. Quand sshd n'arrives pas à
 résoudre (par le reverse) l'adresse IP du client alors on met un
 temps fou à se connecter mais une fois la connexion effectuée, plus
 de résolution et donc connexion normale.

 --
 Kévin

Bonjour,

Je creuserais aussi vers des problèmes de dns.

Bertrand

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet jerome moliere

 Bonjour,

 Je creuserais aussi vers des problèmes de dns.

 certes mais comment expliquer qu'un less /var/log/messages plante ? qu'un
top se fige une fois sur 2 ?
pas besoin de requêtes pour ces 2 taches non?

merci du soutien en tout cas
-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet Kevin Hinault
Le 10 décembre 2009 15:37, jerome moliere jerome.moli...@gmail.com a écrit :
 certes mais comment expliquer qu'un less /var/log/messages plante ? qu'un
 top se fige une fois sur 2 ?
 pas besoin de requêtes pour ces 2 taches non?

Comme je disais, ce n'est pas forcément lié. Règles tes problèmes un à un.

-- 
Kévin

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet jerome moliere
Le 10 décembre 2009 15:42, Kevin Hinault hina...@gmail.com a écrit :

 Le 10 décembre 2009 15:37, jerome moliere jerome.moli...@gmail.com a
 écrit :
  certes mais comment expliquer qu'un less /var/log/messages plante ? qu'un
  top se fige une fois sur 2 ?
  pas besoin de requêtes pour ces 2 taches non?

 Comme je disais, ce n'est pas forcément lié. Règles tes problèmes un à un.


effectivement il y a un truc très louche niveau DNS mais je ne sais pas si
je peux creuser plus:
sur la même machine à très peu de temps d'intervalle (2 minutes) je fais 2
requêtes nslookup sur un nom de machine (avec nom court)
et :
1) connection timeout (en 1 minute)
2) réponse lente mais il me répond qu'il ne trouve pas la machine (pas
grave)

c'est étrange que la même requête parte en timeout ou échoue ce qui est 2
ccomportements distincts pour une même question, du ploymorphisme sur les
DNS ? je ne m'attendais pas à cela!!! lol

sur d'autres box du même vlan ou pas j'ai systématiquement des connection
timeout!!!

je vous remercie de la piste (que j'avais évoqué dans mon esprit mais
chassée trop hativement)

par contre je pense aussi qu'il y a d'autres merdes qui rodent que je ne
peux pas plus régler


Merci à vous
jerome

-- 
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


Re: Machine en vrac

2009-12-10 Par sujet BmailDB
Le jeudi 10 décembre 2009 16:10, jerome moliere a écrit :
 c'est étrange que la même requête parte en timeout ou échoue ce qui
 est 2 ccomportements distincts pour une même question, du
 ploymorphisme sur les DNS ? je ne m'attendais pas à cela!!! lol

 sur d'autres box du même vlan ou pas j'ai systématiquement des
 connection timeout!!!

 je vous remercie de la piste (que j'avais évoqué dans mon esprit
 mais chassée trop hativement)

 par contre je pense aussi qu'il y a d'autres merdes qui rodent que
 je ne peux pas plus régler


 Merci à vous
 jerome


Et un tcpdump ? Peut-être des infos à tirer de là ?
Bertrand

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: Machine en vrac

2009-12-10 Par sujet Guy Roussin

Y a un probleme sur les switchs ... des boucles ?
Le spanning tree est il activé ?

Guy

jerome moliere a écrit :



Le 10 décembre 2009 15:42, Kevin Hinault hina...@gmail.com 
mailto:hina...@gmail.com a écrit :


Le 10 décembre 2009 15:37, jerome moliere
jerome.moli...@gmail.com mailto:jerome.moli...@gmail.com a écrit :
 certes mais comment expliquer qu'un less /var/log/messages
plante ? qu'un
 top se fige une fois sur 2 ?
 pas besoin de requêtes pour ces 2 taches non?

Comme je disais, ce n'est pas forcément lié. Règles tes problèmes
un à un.


effectivement il y a un truc très louche niveau DNS mais je ne sais 
pas si je peux creuser plus:
sur la même machine à très peu de temps d'intervalle (2 minutes) je 
fais 2 requêtes nslookup sur un nom de machine (avec nom court)

et :
1) connection timeout (en 1 minute)
2) réponse lente mais il me répond qu'il ne trouve pas la machine (pas 
grave)


c'est étrange que la même requête parte en timeout ou échoue ce qui 
est 2 ccomportements distincts pour une même question, du 
ploymorphisme sur les DNS ? je ne m'attendais pas à cela!!! lol


sur d'autres box du même vlan ou pas j'ai systématiquement des 
connection timeout!!!


je vous remercie de la piste (que j'avais évoqué dans mon esprit mais 
chassée trop hativement)


par contre je pense aussi qu'il y a d'autres merdes qui rodent que je 
ne peux pas plus régler



Merci à vous
jerome

--
Jerome Moliere - Mentor/J
http://romjethoughts.blogspot.com/
auteur Eyrolles


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org