Frage Fehlerbehebung bei einem "langsamen" Netzwerk


Wir alle hatten eine Beschwerde, dass das "Netzwerk" irgendwann "langsam" ist: könnte in einem Raum (Switch) oder einem Computer lokalisiert sein, könnte nur Internet sein (DNS? Browser-Problem?), Könnte nur eine Anwendung sein (lange laufenden SQL-Abfragen? AV-Scan läuft?).

Wenn Sie offensichtliche System- und / oder Anwendungsprobleme ausgeschlossen haben, wie gehen Sie dann vor, um ein Netzwerk auf Langsamkeit oder fehlerhaftes Verhalten zu testen? Arbeiten Sie sich die OSI-Schichten hoch? Wenn ja, wie geht es um die Überprüfung jeder Schicht? Was tun Sie, um sicherzustellen, dass das physische Netzwerk in einer unbekannten Umgebung in Ordnung ist? Was ist mit zu vielen Sendungen oder einem Broadcast-Sturm? Schicht 3 und höher? Traceroute? Irgendwelche anderen Tipps, Methoden, Ideen? Benötige Features und Tools (Port-Mirroring, SNMP, Überwachung, etc.) für alle Netzwerkgrößen?


20
2018-06-23 13:04


Ursprung


Duplikat? serverfault.com/questions/88/... - Joril
möglicherweise, aber ich dachte, dass ein Wiki ein bisschen mehr Langlebigkeit haben und mehr Leuten eine Chance geben würde, beizutragen. - WuckaChucka
Zunächst muss ich überzeugt werden, dass es das "Internet" ist! Meistens ist es dann nicht das "Internet". Die meisten Luser, mit denen ich zu tun habe, sagen, dass das Internet herunterfällt, selbst wenn sie versuchen, auf einen lokalen Dateiserver zuzugreifen. - tony roth
Es ist, weil alle Ihre Benutzer gerade Video-Feeds der Weltmeisterschaft streamen! - BillN


Antworten:


tcpdump und wireshark sind deine Freunde.

Ich finde, dass das Aufspüren von Paketen auf dem Draht eines "langsamen" Netzwerks gegenüber einem "guten" Netzwerk normalerweise ein Problem feststellt.

Es gibt viele Arten von "langsam".

Mit einem Tool wie SmokePing können Sie die Latenz zu lokalen und Internet-Sites verfolgen. (SmokePing kann so konfiguriert werden, dass ICMP-Latenz sowie Service-Latenz von TCP-Diensten verfolgt werden)

Ihre Switches sollten Broadcast-Pakete und Unicast-Pakete verfolgen. Zeichnen Sie dieses Verhältnis auf.

Ich möchte auch Traceroutes überwachen (Überprüfung der Domain-Namen von ISP-Hops zwischen mir 'wichtigen' Sites).

Ich hoffe, dass diese Kommentare helfen.


9



Beim Packen von Paketen, was sind einige Dinge, nach denen Sie suchen, oder "verräterische Zeichen", dass es ein Problem gibt? - WuckaChucka
Suchen Sie nach einer großen Anzahl von TCP-Retransmissions und / oder TCP-Resets. Achten Sie auch auf einen hohen Prozentsatz des Broadcast-Verkehrs. - joeqwerty
Ausgezeichnet. Ich würde das fast in eine separate Antwort bringen. - WuckaChucka
Wenn Sie netmon 3+ von MS verwenden können, gehen Sie zu Microsoft Research und laden Sie den tcp analysator herunter research.microsoft.com/de-de/downloads/... Es ist ziemlich cool für das Debuggen von Netzwerkproblemen. auch gibt es bei Bedarf eine 32bit Version. - tony roth
+1 für SmokePing. Zusammen mit Dingen wie IPSLA in Cisco-Routern und -Switches kann dies sehr hilfreich sein, um zu verstehen, ob ein langsames Netzwerk oder eine langsame Anwendung vorhanden ist. - Christopher Cashell


Es ist schwierig, spezifische Antworten zu geben, da 90% dieses Jobs Erfahrung sind, die Ihnen beibringt, wo Sie nach welcher Art von Problem suchen, und die anderen 90% wissen, wo Sie bei Google nach Hinweisen suchen können.

Normalerweise probiere ich den Papiersack aus, um den Kunden dazu zu bringen, das Problem zu demonstrieren (meistens, um Fingerprobleme und Probleme auszuschließen, die der Kunde vielleicht hat, um sein Problem zu beschreiben) und dann das Problem auf einem anderen Computer zu reproduzieren. Wenn Sie das tun, bekommen Sie oft einen Einblick, wo Sie suchen müssen.

Vergessen Sie nicht das korrigierende Problem eines Neustarts, besonders für Windows-Systeme, auch heute noch. Früher war es so sehr, dass ich die Leute fragte: "Hast du einen Neustart gemacht? Probiere es aus und lass es mich wissen, wenn das Problem weiterhin besteht" - das hat einen sehr großen Prozentsatz der Probleme behoben, über die ich gefragt wurde.

Es gibt häufig auch niedrig hängende Früchte bei DNS-Auflösungsproblemen und Grundkonnektivität (ACLs auf Routern, Luftlücken im Netzwerk, Pings / Tracerouten / mtrs zu entfernten Standorten usw.).

Bei Diensten, die Sie direkt steuern, kann das Ausführen von Nagios oder etwas, das sicherstellen soll, dass der Dienst tatsächlich ausgeführt wird, häufig dazu führen, dass Sie Probleme beheben, bevor Kunden Ihnen etwas mitteilen. Sie möchten wahrscheinlich auch Statistiken sammeln, entweder direkt über Munin oder etwas, oder über SNMP zu etwas wie Cacti.

Ich versuche normalerweise, Cacti gegen mindestens alle meine Core-Switches und Firewalls laufen zu lassen; Wenn möglich, führe ich Kakteen gegen alles, was ich kann. In diesen Fällen suche ich normalerweise nach Dingen wie Portfehlerzählungen oder übermäßigem Verkehr. Firewall-Diagramme von einigen Geräten können die CPU-Auslastung und gleichzeitige Sitzungen anzeigen. Sie erfahren, mit welchen Grenzwerten Ihr Firewall-Gerät Probleme hat.

Ihre Firewall kann sich möglicherweise an einem Syslog-Gerät anmelden. Wenn ja, logge alles ein, was du kannst, und schaue nach Hinweisen. Dies wird einfacher, wenn Sie etwas wie syslog-ng oder rsyslog oder splunk ausführen, mit dem Sie Ihre Protokolle etwas aufteilen können, anstatt mit einer monolithischen Datei zu arbeiten.

Ich versuche auch, nfsen zumindest gegen das Innere meiner Firewall und den Uplink zum Internetprovider zu betreiben, wo es möglich ist. So können Sie in die Vergangenheit zurückkehren, um sich die Sitzungen anzusehen, um zu sehen, wer was macht. Dies kann manchmal zu interessanten Verhaltensweisen führen.


6





Hier sind ein paar nützliche Tools zur Fehlerbehebung bei Latenz und anderen Netzwerkproblemen:

  • das OSI-Modusl - fange von unten an und arbeite dich hoch
  • ping - überprüfen Sie Ihre RTT (d. h. Latenz)
  • HTTP-Ping - nützlich, wenn Ihre Firewall normale ICMPs blockiert
  • ping -r 9 - nützlich zum Identifizieren von asymmetrischen Routing-Situationen
  • Traceroute - wie kommen meine Pakete dorthin und wie reagieren die Router auf dem Weg? Beachten Sie, dass Router diese Pakete häufig mit niedriger Priorität verarbeiten, sodass die tatsächliche Leistung möglicherweise besser ist.
  • Wireshark - braucht etwas Fachwissen, aber Sie können nicht viel niedrigeres Niveau bekommen
  • SpeedGuide.net TCP / IP Analyzer - Überprüfen Sie die TCP-Einstellungen Ihres PCs
  • SG TCP-Optimierer - (Nur Windows) Vorschläge zur Optimierung der NIC-Einstellungen
  • IP Huhn - Was ist Ihre Quell-IP-Adresse (nicht NAT)?
  • http://downforeveryoneorjustme.com/ - könnte sein es ist Sie...
  • Bandbreite Geschwindigkeitstest - Überprüfen Sie Ihre Download- / Upload-Geschwindigkeiten
  • Netzwerk-Tools - Führen Sie Tools / Tests von außerhalb Ihres Netzwerks aus
  • Überprüfen Sie Ihre Netzwerkports auf Fehler / CRCs / etc. -
  • Überprüfen Sie Ihr Netzwerk auf Überlastung (Bandbreitenüberwachung) und Broadcast-Stürme
  • Auf Unicast-Flooding prüfen - Wireshark verwenden und Unicast-Datenverkehr überwachen, der nicht für Ihre Workstation bestimmt ist.
  • verifizieren Sie, dass Ihre Spanning-Tree-Root-Bridge richtig platziert ist

5





Wenn Sie ein drahtloses Netzwerk betreiben, ist eine der häufigen Verzögerungen die Kanalinterferenz. Eine Reihe von SSIDs in einem Bereich kann den Netzwerkverkehr wirklich verlangsamen. (Denke: die Demo des iPhone 4 auf der WWDC '10).

Die Behebung dieses Problems ist relativ einfach, wenn Sie mit einer Software die drahtlosen Verkehrsmuster in der Umgebung anzeigen können. Es gibt ein kostenloses und webbasiertes Programm unter: http://meraki.com/tools/stumbler. (Offenlegung: Ich arbeite für Meraki)

Um Interferenzen zu reduzieren, ist es am besten, auf den Kanälen 1, 6 oder 11 zu sein. Die Verwendung von 802.11n-Geräten mit der 5-GHz-Frequenz könnte ebenfalls hilfreich sein.


4





Ich beginne immer mit der Überwachung der Layer 2-Sachen Kakteen. Das gibt Ihnen eine gute Menge an Daten, die Sie verwenden können, um nach Mustern zu suchen, und Sie können Ihre Cacti-Diagramme vergleichen, wenn alles gut funktioniert, oder wenn die Benutzer Langsamkeit sehen.

Es wird wahrscheinlich nicht das genaue Problem finden, aber es wird Ihnen einen guten Ausgangspunkt geben, um das Problem einzugrenzen.


1



Alles, wonach Sie in den Kakteen suchen? - WuckaChucka


Ich beginne am äußersten Router und arbeite mich nach unten, und ich messe Leistung auf die primitivste Weise: Verwenden Sie eine Bandbreiten-Test-Site oder eine bekannte externe FTP-Site, die Ihnen Ihre Upload- / Download-Geschwindigkeit gibt und bis zu Ihnen weitergeht Finde die Ebene, in der das Problem liegt.

Sobald Sie wissen, wo das Problem liegt, stellen Sie Ihre ausgefallenen Tools und Monitore bereit. Aber verschwende keine Zeit damit, dieses Zeug auf jeder Ebene zu machen. Es wird ewig dauern.


1



Wie sieht es aber mit der internen Anwendungsleistung aus? - WuckaChucka
@wuckachucka: Normalerweise, wenn es ein Problem mit dem Code gibt, wird es überall in den Logs angezeigt, daher ist die Fehlersuche nicht so schlecht. Sie wissen auch, wo Sie anfangen sollen (die Anwendung). Das größte Problem bei der Fehlerbehebung im Netzwerk ist das Problem zu finden. Wenn Sie ungünstige Port-Geschwindigkeiten oder schlechte MTUs oder andere physikalische Probleme haben, sind diese ein kompletter Bastard für die Fehlersuche über Logs, und der Höhlenmenschen-Ansatz hat dort viele Vorteile. - Satanicpuppy


Sie müssen auch Ihre Server und die Desktop / Client-Umgebung kennen und nicht einfach davon ausgehen, dass der Benutzer korrekt ist, wenn er sagt "das Netzwerk ist langsam". Sie müssen jedes Problem methodisch lösen. Wie andere bereits gesagt haben, sollten Sie den Fehler zunächst sehen und idealerweise reproduzieren können und dann von dort aus arbeiten, wie es für das Szenario sinnvoll ist.

Eine gute Verwaltung und Überwachung des Netzwerks und der Server kann Ihnen jedoch viel Zeit sparen, da Sie nicht versuchen, während des Betriebs eine Instrumentierung zu erstellen ebenfalls versuchen, die Symptome zu mildern oder zu beheben, und sich mit beschwerenden Benutzern / Kunden zu befassen.

Die Antworten für tcpdump und wireshark sind nicht falsch, diese können wichtige Teile Ihres Toolkits sein. Aber wenn Sie nicht sicher sind, dass es sich tatsächlich um das Netzwerk handelt, sollten Sie nicht das erste sein, wonach Sie suchen.


1





Langsames Netzwerk ist ein häufiges Phänomen. Langsame Netzwerkgeschwindigkeit kann durch eine Reihe von Dingen verursacht werden. Die Problembehandlung bei langsamen Netzwerken ist eine der häufigsten und mühsamsten Aufgaben im täglichen Netzwerkmanagement.

Laut Analyse sind die Hauptgründe für ein langsames Netzwerk:

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

Wie können wir schnell die Ursache für ein langsames Netzwerk herausfinden? Es ist eine gute Idee, Pakete mit einem Netzwerkanalysator (Ax3soft Unicorn, wireshark und so weiter) zu erfassen und zu analysieren.

Sie lesen auch den Artikel "Gründe für das langsame Netzwerk finden" und klicken auf die URL (http://www.ids-sax2.com//Unicorn/Tutorials/Find-Reasons-for-Slow-Network-with-Ax3soft-Unicorn.htm) um es zu besuchen.


0