linux 系统诊断命令概述一、【mpstat 命令】

307 阅读 0 评论 203 点赞

我是靠谱客的博主复杂羊，这篇文章主要介绍linux 系统诊断命令概述一、【mpstat 命令】，现在分享给大家，希望可以做个参考。

概述

安装

yum install -y sysstat

常用命令

mpstat 命令， CPU 单个核或整体CPU的信息。
vmstat 命令
iostat 命令，块设备以及分区的IO信息。
sar 收集，报告和存储系统活动信息。
pidstat 报告进程，线程的IO，CPU和内存使用情况。

其他命令

tapestat 报告磁带设备的信息。
cifsiostat 报告CIFS的信息。
sadc sar的后端，用来收集系统活动数据。
sa1 以二进制的形式收集和存储系统活动数据。
sa2 负责写入日常活动报告的统计信息。
sadf 以不同的格式（CSV，XML，JSON等）显示sar收集的数据

一、【mpstat 命令】

mpstat 可以显示每个核心的统计


[root@vm-1 ~]# mpstat -P ALL 5 2
Linux 2.6.9-67.ELsmp (oraclerac1)       12/20/2008
 
10:42:38 PM  CPU   %user   %nice %system %iowait    %irq   %soft   %idle    intr/s
10:42:43 PM  all    6.89    0.00   44.76    0.10    0.10    0.10   48.05   1121.60
10:42:43 PM    0    9.20    0.00   49.00    0.00    0.00    0.20   41.60    413.00
10:42:43 PM    1    4.60    0.00   40.60    0.00    0.20    0.20   54.60    708.40
 
10:42:43 PM  CPU   %user   %nice %system %iowait    %irq   %soft   %idle    intr/s
10:42:48 PM  all    7.60    0.00   45.30    0.30    0.00    0.10   46.70   1195.01
10:42:48 PM    0    4.19    0.00    2.20    0.40    0.00    0.00   93.21   1034.53
10:42:48 PM    1   10.78    0.00   88.22    0.40    0.00    0.00    0.20    160.48
 
Average:     CPU   %user   %nice %system %iowait    %irq   %soft   %idle    intr/s
Average:     all    7.25    0.00   45.03    0.20    0.05    0.10   47.38   1158.34
Average:       0    6.69    0.00   25.57    0.20    0.00    0.10   67.43    724.08
Average:       1    7.69    0.00   64.44    0.20    0.10    0.10   27.37    434.17

–P ALL 选项指示该命令显示所有 CPU 的统计信息，而不只是特定 CPU 的统计信息。
参数 5 2 指示该命令每隔 5 秒运行一次，共运行 2 次。

列名	说明
%user	用户进程所使用 CPU 的百分比。用户进程是用于应用程序（如 Oracle 数据库）的非内核进程。
%nice	使用 nice 命令对进程进行降级时 CPU 的百分比。nice 命令用来更改进程的优先级。
%system	内核进程使用的 CPU 百分比
%iowait	等待进行 I/O 所使用的 CPU 时间百分比
%irq	用于处理系统中断的 CPU 百分比
%soft	用于软件中断的 CPU 百分比
%idle	显示 CPU 的空闲时间
%intr/s	显示每秒 CPU 接收的中断总数

常见诊断：

%idle 数字过低时，CPU 响应能力不足。
%iowait 数字较高时，当前负载下 I/O 子系统出现了某些问题

二、【vmstat 命令】


[root@vm-1 ~]# vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 0  0      0 661960  71048 253216    0    0     0     0   13   34  0  0 100  0  0
 0  0      0 661960  71048 253216    0    0     0     0   15   22  0  0 100  0  0
 0  0      0 661960  71048 253216    0    0     0     0   13   22  0  0 100  0  0
 0  0      0 661960  71048 253216    0    0     0     0   12   26  0  0 100  0  0 

(1) 进程procs： 
		r：在运行队列中等待的进程数 。
		b：在等待io的进程数 。
(2) Linux 内存监控内存memoy： 
		swpd：现时可用的交换内存（单位KB）。 
		free：空闲的内存（单位KB）。
		buff: 缓冲去中的内存数（单位：KB）。
		cache：被用来做为高速缓存的内存数（单位：KB）。
(3) Linux 内存监控swap交换页面:
		si: 从磁盘交换到内存的交换页数量，单位：KB/秒。
		so: 从内存交换到磁盘的交换页数量，单位：KB/秒。
(4) Linux 内存监控 io块设备:
		bi:  发送到块设备的块数，单位：块/秒。
		bo: 从块设备接收到的块数，单位：块/秒。
(5) Linux 内存监控system系统： 
    	in: 每秒的中断数，包括时钟中断。
		cs: 每秒的环境（上下文）转换次数。
(6) Linux 内存监控cpu中央处理器：
		cs：用户进程使用的时间 。以百分比表示。
		sy：系统进程使用的时间。 以百分比表示。
		id：中央处理器的空闲时间 。以百分比表示。

常见诊断：

假如 r ，经常大于4 ，且 id 经常小于40，表示中央处理器的负荷很重
假如 bi，bo 长期不等于0，表示物理内存容量太小

列名	说明
r	表示运行队列(就是说多少个进程真的分配到CPU)，我测试的服务器目前CPU比较空闲，没什么程序在跑，当这个值超过了CPU数目，就会出现CPU瓶颈了。这个也和top的负载有关系，一般负载超过了3就比较高，超过了5就高，超过了10就不正常了，服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高。
b	表示阻塞的进程, 这个不多说，进程阻塞，大家懂的。
swpd	虚拟内存已使用的大小，如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。
free	空闲的物理内存的大小，我的机器内存总共8G，剩余3415M。
buff	Linux/Unix系统是用来存储，目录里面有什么内容，权限等的缓存，我本机大概占用300多M
cache	cache直接用来记忆我们打开的文件,给文件做缓冲，我本机大概占用300多M(这里是Linux/Unix的聪明之处，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用。)
si	每秒从磁盘读入虚拟内存的大小，如果这个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。我的机器内存充裕，一切正常。
so	每秒虚拟内存写入磁盘的大小，如果这个值大于0，同上。
bi	块设备每秒接收的块数量，这里的块设备是指系统上所有的磁盘和其他块设备，默认块大小是1024byte，我本机上没什么IO操作，所以一直是0，但是我曾在处理拷贝大量数据(2-3T)的机器上看过可以达到140000/s，磁盘写入速度差不多140M每秒
bo	块设备每秒发送的块数量，例如我们读取文件，bo就要大于0。bi和bo一般都要接近0，不然就是IO过于频繁，需要调整。
in	每秒CPU的中断次数，包括时间中断
cs	每秒上下文切换次数，例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源，也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换，导致CPU干正经事的时间少了，CPU没有充分利用，是不可取的。
us	用户CPU时间，我曾经在一个做加密解密很频繁的服务器上，可以看到us接近100,r运行队列达到80(机器在做压力测试，性能表现不佳)。
sy	系统CPU时间，如果太高，表示系统调用时间长，例如是IO操作频繁。
id	空闲CPU时间，一般来说，id + us + sy = 100,一般我认为id是空闲CPU使用率，us是用户CPU使用率，sy是系统CPU使用率。
wt	等待IO CPU时间。

三、【iostat 命令】

传送门 https://blog.csdn.net/snake1900/article/details/107321627

常见诊断：

若 %iowait 的值过高，表示硬盘存在I/O瓶颈
若 %idle 的值高但系统响应慢时，有可能是CPU等待分配内存，此时应加大内存容量
若 %idle 的值持续低于1，则系统的CPU处理能力相对较低，表明系统中最需要解决的资源是 CPU

最后

以上就是复杂羊最近收集整理的关于linux 系统诊断命令概述一、【mpstat 命令】的全部内容，更多相关linux内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：# linux 监控命令
浏览次数：307 次浏览
发布日期：2024-07-03 03:30:01

linux 系统诊断命令概述一、【mpstat 命令】

概述

一、【mpstat 命令】

常见诊断：

二、【vmstat 命令】

常见诊断：

三、【iostat 命令】

常见诊断：

最后

评论列表共有 0 条评论

发表评论取消回复

linux 系统诊断命令概述一、【mpstat 命令】

概述

一、【mpstat 命令】

常见诊断：

二、【vmstat 命令】

常见诊断：

三、【iostat 命令】

常见诊断：

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复