On 22.04.2016 11:00, Holger Baumhof wrote:
Hallo alle zusammen,

ich hab mal eine hochkarätige Frage: vielleicht ist ja ein
"Switchversteher" dabei.

Mein Netz ist mit Hilfe eines Cisco SG300-10 segmentiert seit ca. 1,5
Jahren.
Alles läuft super mit unseren >160 Rechnern.

Vor 3 Wochen hatte ich aber plötzlich das Problem, dass die _manche_
(nicht alle!) Clients zwar beim PXE Boot eine IP bekamen, aber linbo
bekam keine und zeigte OFFLINE an.
Es war aber auch nicht nur ein Segment betroffen.

Das ganze wurde erst behoben, nachdem ich den Cisco rebootet hatte.

"Einmal ist keinmal" dachte ich mir (oder besser: hoffte ich).
Gestern trat es aber wieder auf.
Also rebootete ich den Cisco und schaute in die Logdateien.
Da fand ich sehr viele solche Einträge:

Error   %ARP-E-ARPTBL: ARP Table Overflow

Heute hab ich mal nach dem Fehler im Netz gesucht.
Dabei fand ich diese Seite:
https://www.experts-exchange.com/questions/28201862/Cisco-SG300-Switch-Layer-3-Mode-ARP-Table-Overflow-Errors.html

Dort heißt es eigentlich, dass das Problem mit einer neueren Firmware
behoben wurde: aber ich habe schon eine sehr neue (1.4.0.88)

Jetzt habe ich mal, wie im Tread vorgeschlagen, das ARP Entry Age Out
heruntergesetzt auf 600 (von 60000) und hoffe, dass das auf Lange sicht
hilft.

Hat noch jemand so ein Problem schon gehabt?
Wird meine Aktion Helfen?

Viele Grüße

Holger





Wir hatten etwas ähnliches. Wenn auch nicht mit linuxmuster.net. Sondern mit Phantosys. Vor ca. 1 Jahr verhungerten in nicht reproduzierbarem Maße immer wieder Clients beim PXE Boot. Es lies sich nicht auf einzelne Clients begrenzen. Mal funktionierte ein ganzer Raum. Eine Stunde später gar keiner mehr. Dann wieder die Hälfte. Manchmal half ein Reboot, manchmal 20 (kein Witz!).

Wir vermuteten zuerst eine zu hohe Netzlast. PXE ist Broadcast. Und wenn morgens 500 PCs auf einmal angehen, kann das u.U. eng werden. Also einzelne Netze mit VLAN isoliert. Brachte keine Besserung. Außerdem trat der Fehler auch am Nachmittag auf, wenn nichts mehr los war.

Firmware aller Switche (HP) geupdatet. Keine Besserung.
Irgendwann war es weniger geworden. Aber nicht komplett weg. Aber zumindest in einem Rahmen dass man sagen kann "Boote halt 2x neu, in 80% der Fälle gehts".

Als es wieder schlimmer wurde, sind wir dem Thema auf den Grund gegangen mit Wireshark. Die tl;dr Version.

Client broadcastet nach DHCP.
Server offeriert IP an Client.
Client fordert offerierte IP vom Server.
Server gibt offerierte IP an Client.
Client nimmt offerierte IP vom Server.

Client broadcastet nach PXE.
Server offeriert TFTP an Client.
Client fordert TFTP von Server.
Server gibt TFTP an Client.
Client macht gar nix.


Ich meine auch, dass wir ähnlich wie bei dir ARP Packet Storm auf den Switchen verzeichnet haben. Das müsste ich aber in alten Aufzeichnungen raussuchen. Bin mir da nicht mehr so sicher.

Die Ursache des Problems haben wir leider nicht finden können. Mit dem Austausch Ende letzten Jahres der alten 100Mbit auf jetzt Gbit Switche, hat sich das Problem erledigt.

Ich müsste irgendwo noch die Wireshark Logs davon haben. Und auch ein Video des Fehlerbildes am Monitor des Clients. Bei Interesse such ich das raus.

--
Freundliche Grüße

Im Auftrag
Ulf Weikert
Systemadministrator
Berufsbildende Schulen Haarentor der Stadt Oldenburg
Ammerländer Heerstr. 33-39 | 26129 Oldenburg
-----------------------------------------
Encryptet 'Signal' Call:
+49 441 77915-17

Tel.
+49 441 77915-17

E-Mail:
[email protected]

Besuchen Sie uns im Internet unter www.bbs-haarentor.de
Schulprogramm unter: http://www.bbs-haarentor.de/index.php?id=323

Diese E-Mail enthält vertrauliche und/oder rechtlich geschützte Informationen. Wenn Sie nicht der richtige Adressat sind oder diese E-Mail irrtümlich erhalten haben,
informieren Sie bitte sofort den Absender und vernichten Sie diese Mail.
Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieser Mail ist nicht gestattet.
_______________________________________________
linuxmuster-user mailing list
[email protected]
https://mail.lehrerpost.de/mailman/listinfo/linuxmuster-user

Antwort per Email an