web-dev-qa-db-fra.com

Quel processus utilise tout mon disque IO

Si j'utilise "top", je peux voir quel processeur est occupé et quel processus utilise tout mon processeur.

Si j'utilise "iostat -x", je peux voir quel lecteur est occupé.

Mais comment puis-je voir quel processus utilise tout le débit du disque?

115
Party King

Vous recherchez iotop (en supposant que vous ayez un noyau> 2.6.20 et Python 2.5). Sinon, vous envisagez de vous connecter au système de fichiers. I recommande l'ancien.

159
phresus

Pour savoir quels processus de l'état 'D' (en attente d'une réponse du disque) sont en cours d'exécution:

while true; do date; ps aux | awk '{if($8=="D") print $0;}'; sleep 1; done

ou

watch -n1 -d "ps axu | awk '{if (\$8==\"D\") {print \$0}}'"

Wed Aug 29 13:00:46 CLT 2012
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:00:47 CLT 2012
Wed Aug 29 13:00:48 CLT 2012
Wed Aug 29 13:00:49 CLT 2012
Wed Aug 29 13:00:50 CLT 2012
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:00:51 CLT 2012
Wed Aug 29 13:00:52 CLT 2012
Wed Aug 29 13:00:53 CLT 2012
Wed Aug 29 13:00:55 CLT 2012
Wed Aug 29 13:00:56 CLT 2012
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:00:57 CLT 2012
root       302  0.0  0.0      0     0 ?        D    May28   3:07  \_ [kdmflush]
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:00:58 CLT 2012
root       302  0.0  0.0      0     0 ?        D    May28   3:07  \_ [kdmflush]
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:00:59 CLT 2012
root       302  0.0  0.0      0     0 ?        D    May28   3:07  \_ [kdmflush]
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:01:00 CLT 2012
root       302  0.0  0.0      0     0 ?        D    May28   3:07  \_ [kdmflush]
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:01:01 CLT 2012
root       302  0.0  0.0      0     0 ?        D    May28   3:07  \_ [kdmflush]
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]
Wed Aug 29 13:01:02 CLT 2012
Wed Aug 29 13:01:03 CLT 2012
root       321  0.0  0.0      0     0 ?        D    May28   4:25  \_ [jbd2/dm-0-8]

Comme vous pouvez le constater, jdb2/dm-0-8 (processus de journal ext4) et kdmflush bloquent constamment votre Linux.

Pour plus de détails, cette URL pourrait être utile: Problème Linux Wait-IO

15
quentinxue

atop fonctionne également bien et s’installe facilement même sur les anciens systèmes CentOS 5.x qui ne peuvent pas exécuter iotop. Appuyez sur d pour afficher les détails du disque, ? pour aider.

ATOP - mybox                           2014/09/08  15:26:00                           ------                            10s elapsed
PRC |  sys    0.33s |  user   1.08s |                | #proc    161  |  #zombie    0 |  clones    31 |                | #exit         16  |
CPU |  sys   4% |  user     11% |  irq       0%  | idle    306%  |  wait     79% |               |  steal     1%  | guest     0%  |
cpu |  sys   2% |  user      8% |  irq       0%  | idle     11%  |  cpu000 w 78% |               |  steal     0%  | guest     0%  |
cpu |  sys   1% |  user      1% |  irq       0%  | idle     98%  |  cpu001 w  0% |               |  steal     0%  | guest     0%  |
cpu |  sys   1% |  user      1% |  irq       0%  | idle     99%  |  cpu003 w  0% |               |  steal     0%  | guest     0%  |
cpu |  sys   0% |  user      1% |  irq       0%  | idle     99%  |  cpu002 w  0% |               |  steal     0%  | guest     0%  |
CPL |  avg1    2.09 |  avg5    2.09 |  avg15   2.09  |               |  csw    54184 |  intr   33581 |                | numcpu     4  |
MEM |  tot     8.0G |  free   81.9M |  cache   2.9G  | dirty   0.8M  |  buff  174.7M |  slab  305.0M |                |               |
SWP |  tot     2.0G |  free    2.0G |                |               |               |               |  vmcom   8.4G  | vmlim   6.0G  |
LVM |  Group00-root |  busy     85% |  read       0  | write  30658  |  KiB/w      4 |  MBr/s   0.00 |  MBw/s  11.98  | avio 0.28 ms  |
DSK |          xvdb |  busy     85% |  read       0  | write  23706  |  KiB/w      5 |  MBr/s   0.00 |  MBw/s  11.97  | avio 0.36 ms  |
NET |  transport    |  tcpi    2705 |  tcpo    2008  | udpi      36  |  udpo      43 |  tcpao     14 |  tcppo     45  | tcprs      1  |
NET |  network      |  ipi     2788 |  ipo     2072  | ipfrw      0  |  deliv   2768 |               |  icmpi      7  | icmpo     20  |
NET |  eth0    ---- |  pcki    2344 |  pcko    1623  | si 1455 Kbps  |  so  781 Kbps |  erri       0 |  erro       0  | drpo       0  |
NET |  lo      ---- |  pcki     423 |  pcko     423  | si   88 Kbps  |  so   88 Kbps |  erri           0 |  erro       0  | drpo       0  |
NET |  eth1    ---- |  pcki  22 |  pcko      26  | si    3 Kbps  |  so    5 Kbps |  erri       0 |  erro       0  | drpo       0  |

  PID                   RDDSK                    WRDSK                   WCANCL                    DSK                   CMD        1/1
 9862                      0K                   53124K                       0K                    98%                   Java
  358                      0K                     636K                       0K                     1%                   jbd2/dm-0-8
13893                      0K                     192K                      72K                     0%                   Java
 1699                      0K                      60K                       0K                     0%                   syslogd
 4668                      0K                      24K                       0K                     0%                   zabbix_agentd

Cela montre clairement Java pid 9862 est le coupable.

9
Steve Kehlet

TL; DR

Si vous pouvez utiliser iotop, faites-le. Sinon, cela pourrait aider.


Utilisez top, puis utilisez ces raccourcis:

d 1 = set refresh time from 3 to 1 second

1   = show stats for each cpu, not cumulated

Cela doit montrer les valeurs > 1.0 wa pour au moins un noyau - s’il n’ya pas d’attente sur le disque, il n’ya tout simplement pas de charge IO et il n’est pas nécessaire de chercher plus loin. Des charges importantes commencent habituellement > 15.0 wa.

x       = highlight current sort column 
< and > = change sort column
R       = reverse sort order

Choisissez 'S', la colonne d'état du processus. Inversez l'ordre de tri afin que les processus 'R' (en cours d'exécution) apparaissent en haut. Si vous pouvez repérer des processus 'D' (en attente de disque), vous avez un indicateur de ce que votre coupable pourrait être.

4
sjas

Pour les utilisateurs de KDE, vous pouvez utiliser 'ctrl-échap' pour appeler un moniteur d'activité du système. Il existe des tableaux d'activités d'E/S avec l'identifiant et le nom du processus.

Je n'ai pas l'autorisation de télécharger une image en raison du statut de nouvel utilisateur, mais vous pouvez consulter l'image ci-dessous. Il a une colonne pour IO lire et écrire.

3
Patrick

Avez-vous envisagé lsof (liste des fichiers ouverts)?

2
apolinsky

iotop avec le drapeau -a:

-a, --accumulated     show accumulated I/O instead of bandwidth
2
Chris Godwin