re,

> Salut,
>
> Alors c'est simple, dans le sens premier du terme:
> - effectivement les 3 serveurs sur le même switch
> - pas de vlan taggé, un seul global untag
> - pas sur le switch en question
> - 1 lien par serveur vers le switch (3 liens total sur un switch qui en
> a actuellement une quinzaine)
> - aucune techno software style aggregation ni HA
> - c'est un nouveau déploiement, mais qui fonctionne sans problèmes sur
> quelques autres installations du même type (web + mysql)
> - j'ai le problème depuis 3 jours, et c'est suite à une migration depuis
> une ancienne infrastructure (qui commencait à montrer des symptomes
> similaires, je n'ai malheuresement pas pu tester ni faire de captures
> sur cette ancienne installation)
>


> - coté flux:
> - aucun équipement de filtrage à ce niveau
> les autres équipements n'interagissent pas avec les 3 serveurs en
> question, et fonctionnent d'eux même très bien.
> - Lorsque le problème survient, comme j'avais tenté de l'expliquer,
> c'est uniquement les connexions entre un serveur web et le serveur mysql
> qui font ce "bégaiement" TCP. toutes les autres communications entrantes
> et sortantes du serveur web et mysql fonctionnent (ssh sur les 2
> serveurs, le http qui marche sur le web sans problème, mysql qui
> fonctionne sans problème avec l'autre serveur).
>
Le fait que tu sois en ssh ne prouve pas le fait qu'il n'y ait pas de pb
de cnx. ça m'arrive de perdre ma cnx wifi et pourtant ma cnx ssh
refonctionne souvent le temps que le wifi revienne (parfois ok ça
déconnecte :) )
le mieux c'est de faire un ping TCP à partir de tes serveurs web à
destination de ton serveur MySQL, avec hping par exemple :
hping3 [ip] -p 3306 -S

> - la table arp n'a pas plus de 10 entrées et je controle le réseau local
> de bout en bout, donc pas de connexion sauvage ou de conflit d'IP.
>
Ne le prend pas mal, tu l'as sûrement fait mais une re-vérif des configs,
c'est possible ? (ça arrive à tout le monde et le plus souvent plus c'est
gros et moins on le voit :) )
d'autant plus que c'est une nouvelle install,... (une piste est une piste
c'est tjrs ça de pris)

> N'ayant aucune piste, j'ai déjà vérifié tous ces élements jusqu'au trucs
> les plus absurdes sans rien trouver.
>
> J'ajoute que lorsque le problème arrive, un netstat sur le serveur MySQL
> montre tout un tas de connexions venant du serveur web en état
> "SYN_RECV" prouvant bien que le serveur est en train d'attendre que le
> client accepte la connexion. Le client de son côté a envoyé le SYN
> initial, recu le ACK du serveur, mais au lieu de répondre, il attend 3
> secondes et retransmet le SYN. Simultanément, le meme serveur accepte
> les connexions de l'autre serveur web sans broncher.
>
c'est quoi qui fait les cnx vers le MySQL : du php ? python ? perl ?
avec le ping tcp (hping), tu devrais voir des pb de cnx en même temps que
ton pb. Dans le cas où que le ping TCP ne pose pas de pb, mais que ton
serv web a du mal à se connecter, il faudra regarder la partie logicielle
(config, voir avec les developpeurs de l'appli ...)

400 req/s : il y a du cache ou à chaque fois tu as des cnx vers le MySQL ?
pour voir s'il faut travailler du côté des descripteurs de socket.

> Je n'ai par ailleurs trouvé aucun élement ou serveur qui pourrait
> expliquer ce déclenchement du problème à intervalles si réguliers.
>
> J'avoue que c'est le genre de problème interessant à comprendre mais ca
> serait bien plus agréable si on me foutait pas autant la pression pour
> que ca "marche" derrière :)
>
comme d'habitude :)


> Gabriel
>

--
Christophe VIAUD


---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à