On 22.04.2016 11:00, Holger Baumhof wrote:
Hallo alle zusammen,
ich hab mal eine hochkarätige Frage: vielleicht ist ja ein
"Switchversteher" dabei.
Mein Netz ist mit Hilfe eines Cisco SG300-10 segmentiert seit ca. 1,5
Jahren.
Alles läuft super mit unseren >160 Rechnern.
Vor 3 Wochen hatte ich aber plötzlich das Problem, dass die _manche_
(nicht alle!) Clients zwar beim PXE Boot eine IP bekamen, aber linbo
bekam keine und zeigte OFFLINE an.
Es war aber auch nicht nur ein Segment betroffen.
Das ganze wurde erst behoben, nachdem ich den Cisco rebootet hatte.
"Einmal ist keinmal" dachte ich mir (oder besser: hoffte ich).
Gestern trat es aber wieder auf.
Also rebootete ich den Cisco und schaute in die Logdateien.
Da fand ich sehr viele solche Einträge:
Error %ARP-E-ARPTBL: ARP Table Overflow
Heute hab ich mal nach dem Fehler im Netz gesucht.
Dabei fand ich diese Seite:
https://www.experts-exchange.com/questions/28201862/Cisco-SG300-Switch-Layer-3-Mode-ARP-Table-Overflow-Errors.html
Dort heißt es eigentlich, dass das Problem mit einer neueren Firmware
behoben wurde: aber ich habe schon eine sehr neue (1.4.0.88)
Jetzt habe ich mal, wie im Tread vorgeschlagen, das ARP Entry Age Out
heruntergesetzt auf 600 (von 60000) und hoffe, dass das auf Lange sicht
hilft.
Hat noch jemand so ein Problem schon gehabt?
Wird meine Aktion Helfen?
Viele Grüße
Holger
Wir hatten etwas ähnliches. Wenn auch nicht mit linuxmuster.net. Sondern
mit Phantosys. Vor ca. 1 Jahr verhungerten in nicht reproduzierbarem
Maße immer wieder Clients beim PXE Boot. Es lies sich nicht auf einzelne
Clients begrenzen. Mal funktionierte ein ganzer Raum. Eine Stunde später
gar keiner mehr. Dann wieder die Hälfte. Manchmal half ein Reboot,
manchmal 20 (kein Witz!).
Wir vermuteten zuerst eine zu hohe Netzlast. PXE ist Broadcast. Und wenn
morgens 500 PCs auf einmal angehen, kann das u.U. eng werden. Also
einzelne Netze mit VLAN isoliert. Brachte keine Besserung. Außerdem trat
der Fehler auch am Nachmittag auf, wenn nichts mehr los war.
Firmware aller Switche (HP) geupdatet. Keine Besserung.
Irgendwann war es weniger geworden. Aber nicht komplett weg. Aber
zumindest in einem Rahmen dass man sagen kann "Boote halt 2x neu, in 80%
der Fälle gehts".
Als es wieder schlimmer wurde, sind wir dem Thema auf den Grund gegangen
mit Wireshark. Die tl;dr Version.
Client broadcastet nach DHCP.
Server offeriert IP an Client.
Client fordert offerierte IP vom Server.
Server gibt offerierte IP an Client.
Client nimmt offerierte IP vom Server.
Client broadcastet nach PXE.
Server offeriert TFTP an Client.
Client fordert TFTP von Server.
Server gibt TFTP an Client.
Client macht gar nix.
Ich meine auch, dass wir ähnlich wie bei dir ARP Packet Storm auf den
Switchen verzeichnet haben. Das müsste ich aber in alten Aufzeichnungen
raussuchen. Bin mir da nicht mehr so sicher.
Die Ursache des Problems haben wir leider nicht finden können. Mit dem
Austausch Ende letzten Jahres der alten 100Mbit auf jetzt Gbit Switche,
hat sich das Problem erledigt.
Ich müsste irgendwo noch die Wireshark Logs davon haben. Und auch ein
Video des Fehlerbildes am Monitor des Clients. Bei Interesse such ich
das raus.
--
Freundliche Grüße
Im Auftrag
Ulf Weikert
Systemadministrator
Berufsbildende Schulen Haarentor der Stadt Oldenburg
Ammerländer Heerstr. 33-39 | 26129 Oldenburg
-----------------------------------------
Encryptet 'Signal' Call:
+49 441 77915-17
Tel.
+49 441 77915-17
E-Mail:
[email protected]
Besuchen Sie uns im Internet unter www.bbs-haarentor.de
Schulprogramm unter: http://www.bbs-haarentor.de/index.php?id=323
Diese E-Mail enthält vertrauliche und/oder rechtlich geschützte
Informationen.
Wenn Sie nicht der richtige Adressat sind oder diese E-Mail irrtümlich
erhalten haben,
informieren Sie bitte sofort den Absender und vernichten Sie diese Mail.
Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieser Mail ist
nicht gestattet.
_______________________________________________
linuxmuster-user mailing list
[email protected]
https://mail.lehrerpost.de/mailman/listinfo/linuxmuster-user