当前所在位置:珠峰网资料 >> 计算机 >> 计算机等级考试 >> 正文
Linux下谁在切换我们的进程
发布时间:2010/10/11 11:44:34 来源:城市学习网 编辑:ziteng
  我们在做Linux服务器的时候经常会需要知道谁在做进程切换,什么原因需要做进程切换。 因为进程切换的代价很高,我给出一个LMbench测试出来的数字:
  Context switching – times in microseconds – smaller is better
  ————————————————————————-
  Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K
  ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw
  ——— ————- —— —— —— —— —— ——- ——-
  my174.cm4 Linux 2.6.18- 6.1100 7.0200 6.1100 8.7400 7.7200 8.96000 9.62000
  在我的很高端的服务器上,进程切换的开销在8us左右, 这个相对于高性能的服务器是不可接受的, 所以我们要在一个时间片内尽可能的多做事情,而不是把时间浪费在无谓的切换上。
  好奇害死猫,我们来调查下谁在切换我们的进程:
  view sourceprint?[root@my174 admin]# dstat 1
  ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
  usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw
  0   0 100   0   0   0|   0     0 | 796B 1488B|   0     0 |1004   128
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   114
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   128
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   114
  0   0 100   0   0   0|   0   320k| 280B  728B|   0     0 |1008   143
  ...
  我们可以看到 csw的数目是 120/S, 但是dstat或者vmstat类似的工具并没有告诉我们谁在干坏事。好吧!我们自己动手行吧。
  祭出我们可爱的systemtap!
  view sourceprint?[root@my174 admin]# cat >cswmon.stp
  #! /usr/bin/env stap
  #
  #
  global csw_count
  global idle_count
  probe scheduler.cpu_off {
  csw_count[task_prev, task_next]++
  idle_count+=idle
  }
  function fmt_task(task_prev, task_next)
  {
  return sprintf("%s(%d)->%s(%d)",
  task_execname(task_prev),
  task_pid(task_prev),
  task_execname(task_next),
  task_pid(task_next))
  }
  function print_cswtop () {
  printf ("%45s %10s\n", "Context switch", "COUNT")
  foreach ([task_prev, task_next] in csw_count- limit 20) {
  printf("%45s %10d\n", fmt_task(task_prev, task_next), csw_count[task_prev, task_next])
  }
  printf("%45s %10d\n", "idle", idle_count)
  delete csw_count
  delete idle_count
  }
  probe timer.s($1) {
  print_cswtop ()
  printf("--------------------------------------------------------------\n")
  }
  CTRL+D
  这个脚本会每隔设定的时间打印出TOP 20切换最多的进程和他的pid, 我们来看下结果把:
  view sourceprint?[root@my174 admin]# stap cswmon.stp 5
  Context switch      COUNT
  swapper(0)->systemtap/11(908)        500
  systemtap/11(908)->swapper(0)        498
  swapper(0)->fct1-worker(2492)         50
  fct1-worker(2492)->swapper(0)         50
  swapper(0)->fct0-worker(2191)         50
  fct0-worker(2191)->swapper(0)         50
  swapper(0)->bond0(3432)         50
  bond0(3432)->swapper(0)         50
  stapio(879)->swapper(0)         26
  swapper(0)->stapio(879)         25
  stapio(879)->swapper(0)         19
  swapper(0)->stapio(879)         17
  swapper(0)->watchdog/9(31)          5
  watchdog/9(31)->swapper(0)          5
  swapper(0)->mysqld(18346)          5
  mysqld(18346)->swapper(0)          5
  swapper(0)->watchdog/13(43)          5
  watchdog/13(43)->swapper(0)          5
  swapper(0)->watchdog/14(46)          5
  watchdog/14(46)->swapper(0)          5
  idle        859
  --------------------------------------------------------------
  ...
  我们可以看到进程从哪里切换到哪里,并且发生了多少次, 最后一行,我打印出来idle的次数,也就是说这时候系统没啥事情做,就切换到idle(0)这个进程去休息去了。
  通过上面的调查,我们会很清楚的了解到我们系统的开销发生在那里,方便我们定位问题。
广告合作:400-664-0084 全国热线:400-664-0084
Copyright 2010 - 2017 www.my8848.com 珠峰网 粤ICP备15066211号
珠峰网 版权所有 All Rights Reserved