====== Analyse der System Performance High Load Average, Low CPU ====== Auf einem Linux System steigt urplötzlich die Load Average ohne das aber geleichzeitig die CPU Last ansteigt. Auch ist ein signifikanter Anstieg von I/O Zeiten nicht zu beobachten. ==== Analyse: ==== Top Kommando: top ... load average: 124.63, 99.59, 107.64 Tasks: 2886 total, 6 running, 2880 sleeping, 0 stopped, 0 zombie Cpu(s): 1.5%us, 1.2%sy, 0.0%ni, 97.2%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st ... Load Historie mit Sar auswerten: sar -q .. 02:20:01 PM 8 4179 117.76 116.14 108.70 02:30:01 PM 4 4229 124.02 122.32 115.39 .. Status D (Uninterruptible sleep (usually IO)) der wartenden Prozesse untersuchen: ps auxf | awk '{if($8=="D") print $0;}' Ein Prozess im Status "D" kann nicht abgebrochen werden. Zitat: //... Frequently the most effective manner to do this without hitting the power switch is to pull the power chord. ..// Über lsof püfen, was für Dateien von diesen Prozessen geöffnet sind: lsof Kontrolle von /var/log/messages auf Fehler bzgl. dem obigen Verzeichnis Pfad oder ähnlichen I/O Meldungen: cat /var/log/messages Eine mögliche Ursache kann in einem "defekten" NFS Mounts liegen, die Prozesse wollen auf den NFS Mount zugreifen und die Prozesse warten lange auf eine Antwort. ==== Quellen ==== * https://blogs.oracle.com/ksplice/entry/disown_zombie_children_and_the * https://openvz.org/Processes_in_D_state