iostat
$ yum -y install sysstat #下載拓展包
用法:iostat [ 選項 ] [ <時間間隔> [ <次數> ] ]
常用選項參數:
-c: 只顯示系統CPU統計信息,即單獨輸出avg-cpu結果,不包括device結果
-d: 單獨輸出Device結果,不包括cpu結果
-k/-m:輸出結果以kB/mB為單位,而不是以扇區(qū)數為單位
-x:輸出更詳細的io設備統計信息
interval/count:每次輸出間隔時間,count表示輸出次數,不帶count表示循環(huán)輸出
rrqm/s: 每秒對該設備的讀請求被合并次數,文件系統會對讀取同塊(block)的請求進行合并
wrqm/s: 每秒對該設備的寫請求被合并次數
r/s: 每秒完成的讀次數
w/s: 每秒完成的寫次數
rkB/s: 每秒讀數據量(kB為單位)
wkB/s: 每秒寫數據量(kB為單位)
avgrq-sz:平均每次IO操作的數據量(扇區(qū)數為單位)
avgqu-sz: 平均等待處理的IO請求隊列長度
await: 平均每次IO請求等待時間(包括等待時間和處理時間,毫秒為單位)
svctm: 平均每次IO請求的處理時間(毫秒為單位)
%util: 采用周期內用于IO操作的時間比率,即IO隊列非空的時間比率
## mpstat
是實時系統監(jiān)控工具。其報告與CPU的一些統計信息,這些信息存放在/proc/stat文件中。在多CPU系統里,其不但能查看所有CPU的平均狀況信息,而且能夠查看特定CPU的信息。
# 用法:mpstat [-P {cpu|ALL}] [internal [count]]
-P {cpu l ALL} 表示監(jiān)控哪個CPU, cpu在[0,cpu個數-1]中取值
internal 相鄰的兩次采樣的間隔時間
count 采樣的次數,count只能和delay一起使用
--------------------------------------------------------------
$ mpstat -P ALL 5 2
表示每5秒產生一個報告,總共產生2個
CPU 處理器ID
%usr 在internal時間段里,用戶態(tài)的CPU時間(%),不包含 nice值為負進程
%nice 在internal時間段里,nice值為負進程的CPU時間(%)
%sys 在internal時間段里,核心時間(%)
%iowait 在internal時間段里,硬盤IO等待時間(%)
%irq 在internal時間段里,硬中斷時間(%)
%soft 在internal時間段里,軟中斷時間(%)
%steal 顯示虛擬機管理器在服務另一個虛擬處理器時虛擬CPU處在非自愿等待下花費時間的百分比
%guest 顯示運行虛擬處理器時CPU花費時間的百分比
%gnice
%idle 在internal時間段里,CPU除去等待磁盤IO操作外的因為任何原因而空閑的時間閑置時間(%)
vmstat
vmstat命令是最常見的Linux/Unix監(jiān)控工具,可以展現給定時間間隔的服務器的狀態(tài)值,包括服務器的CPU使用率,內存使用,虛擬內存交換情況,IO讀寫情況。這個命令是我查看Linux/Unix最喜愛的命令,一個是Linux/Unix都支持,二是相比top,我可以看到整個機器的CPU,內存,IO的使用情況,而不是單單看到各個進程的CPU使用率和內存使用率(使用場景不一樣)。
(1)用法
用法: vmstat [選項參數]
或: vmstat [選項參數] [數字] [數字]
(2)功能
功能: 報告虛擬內存的統計信息,關于進程、內存、I/O等系統整體運行狀態(tài)。
(3)選項參數:
1) -d: 顯示磁盤相關統計信息。
2) -a: 顯示活躍和非活躍內存
3) -f: 顯示從系統啟動至今的fork數量。
4) -p: 顯示指定磁盤分區(qū)統計信息
5) -s: 顯示內存相關統計信息及多種系統活動數量。
6) -m: 顯示slabinfo
$ vmstat 2 5 每二秒顯示一次系統內存的統計信息,總共5次
1.Procs(進程)
r: 運行隊列中進程數量,這個值也可以判斷是否需要增加CPU。(長期大于1)
b: 等待IO的進程數量。
2.Memory(內存)
swpd: 使用虛擬內存大小,如果swpd的值不為0,但是SI,SO的值長期為0,這種情況不會影響系統性能。
free: 空閑物理內存大小。
buff: 用作緩沖的內存大小。
cache: 用作緩存的內存大小,如果cache的值大的時候,說明cache處的文件數多,如果頻繁訪問到的文件都能被cache處,那么磁盤的讀IO bi會非常小。
3.Swap
si: 每秒從交換區(qū)寫到內存的大小,由磁盤調入內存。
so: 每秒寫入交換區(qū)的內存大小,由內存調入磁盤。
4.IO(現在的Linux版本塊的大小為1kb)
bi: 每秒讀取的塊數
bo: 每秒寫入的塊數
注意: 隨機磁盤讀寫的時候,這2個值越大(如超出1024k),能看到CPU在IO等待的值也會越大。
5.system(系統)
in: 每秒中斷數,包括時鐘中斷。
cs: 每秒上下文切換數。
注意:上面2個值越大,會看到由內核消耗的CPU時間會越大。
6.CPU(以百分比表示)
us: 用戶進程執(zhí)行時間百分比(user time) us的值比較高時,說明用戶進程消耗的CPU時間多,但是如果長期超50%的使用,那么我們就該考慮優(yōu)化程序算法或者進行加速。
sy: 內核系統進程執(zhí)行時間百分比(system time) sy的值高時,說明系統內核消耗的CPU資源多,這并不是良性表現,我們應該檢查原因。
id: 空閑時間百分比
wa: IO等待時間百分比 wa的值高時,說明IO等待比較嚴重,這可能由于磁盤大量作隨機訪問造成,也有可能磁盤出現瓶頸(塊操作)。
st:來自于一個虛擬機偷取的CPU時間的百分比
## sar
是目前 Linux 上最為全面的系統性能分析工具之一,可以從多方面對系統的活動進行報告,包括:文件的讀寫情況、系統調用的使用情況、磁盤I/O、CPU效率、內存使用狀況、進程活動及IPC有關的活動等。
# 語法:sar [options] [-A] [-o file] t [n]
其中:
t為采樣間隔,n為采樣次數,默認值是1;
-o file表示將命令結果以二進制格式存放在文件中,file 是文件名。
-A:所有報告的總和
-u:輸出CPU使用情況的統計信息
-v:輸出inode、文件和其他內核表的統計信息
-d:輸出每一個塊設備的活動信息
-r:輸出內存和交換空間的統計信息
-b:顯示I/O和傳送速率的統計信息
-a:文件讀寫情況
-c:輸出進程統計信息,每秒創(chuàng)建的進程數
-R:輸出內存頁面的統計信息
-y:終端設備活動情況
-w:輸出系統交換活動信息
# 要判斷系統瓶頸問題,有時需幾個 sar 命令選項結合起來
懷疑CPU存在瓶頸,可用 sar -u 和 sar -q 等來查看
懷疑內存存在瓶頸,可用 sar -B、sar -r 和 sar -W 等來查看
懷疑I/O存在瓶頸,可用 sar -b、sar -u 和 sar -d 等來查看
sar cpu資源監(jiān)控
$ sar -u -o test 10 3
每10秒采樣一次,連續(xù)采樣3次,觀察CPU 的使用情況,并將采樣結果以二進制形式存入當前目錄下的文件test中,需鍵入如下命令:
CPU:all 表示統計信息為所有 CPU 的平均值。
%user:顯示在用戶級別(application)運行使用 CPU 總時間的百分比。
%nice:顯示在用戶級別,用于nice操作,所占用 CPU 總時間的百分比。
%system:在核心級別(kernel)運行所使用 CPU 總時間的百分比。
%iowait:顯示用于等待I/O操作占用 CPU 總時間的百分比。
%steal:管理程序(hypervisor)為另一個虛擬進程提供服務而等待虛擬 CPU 的百分比。
%idle:顯示 CPU 空閑時間占用 CPU 總時間的百分比。
- 若 %iowait 的值過高,表示硬盤存在I/O瓶頸
- 若 %idle 的值高但系統響應慢時,有可能是 CPU 等待分配內存,此時應加大內存容量
- 若 %idle 的值持續(xù)低于1,則系統的 CPU 處理能力相對較低,表明系統中最需要解決的資源是CPU,如果要查看二進制文件test中的內容,需鍵入如下sar命令:
##### sar inode、文件和其他內核表監(jiān)控
# 每10秒采樣一次,連續(xù)采樣3次,觀察核心表的狀態(tài),需鍵入如下命令:
$ sar -v 10 3
#輸出內容:
dentunusd:目錄高速緩存中未被使用的條目數量
file-nr:文件句柄(file handle)的使用數量
inode-nr:索引節(jié)點句柄(inode handle)的使用數量
pty-nr:使用的pty數量
sar 內存和交換空間監(jiān)控
每10秒采樣一次,連續(xù)采樣3次,監(jiān)控內存分頁:
$ sar -r 10 3
輸出項說明:
kbmemfree:這個值和free命令中的free值基本一致,所以它不包括buffer和cache的空間.
kbmemused:這個值和free命令中的used值基本一致,所以它包括buffer和cache的空間.
%memused:這個值是kbmemused和內存總量(不包括swap)的一個百分比.
kbbuffers和kbcached:這兩個值就是free命令中的buffer和cache.
kbcommit:保證當前系統所需要的內存,即為了確保不溢出而需要的內存(RAM+swap).
%commit:這個值是kbcommit與內存總量(包括swap)的一個百分比.
##### sar 內存分頁監(jiān)控
# 每10秒采樣一次,連續(xù)采樣3次,監(jiān)控內存分頁:
$ sar -B 10 3
# 輸出項說明:
pgpgin/s:表示每秒從磁盤或SWAP置換到內存的字節(jié)數(KB)
pgpgout/s:表示每秒從內存置換到磁盤或SWAP的字節(jié)數(KB)
fault/s:每秒鐘系統產生的缺頁數,即主缺頁與次缺頁之和(major + minor)
majflt/s:每秒鐘產生的主缺頁數.
pgfree/s:每秒被放入空閑隊列中的頁個數
pgscank/s:每秒被kswapd掃描的頁個數
pgscand/s:每秒直接被掃描的頁個數
pgsteal/s:每秒鐘從cache中被清除來滿足內存需要的頁個數
%vmeff:每秒清除的頁(pgsteal)占總掃描頁(pgscank+pgscand)的百分比
sar I/O和傳送速率監(jiān)控
每10秒采樣一次,連續(xù)采樣3次,報告緩沖區(qū)的使用情況,需鍵入如下命令:
$ sar -b 10 3
輸出項說明
tps:每秒鐘物理設備的 I/O 傳輸總量
rtps:每秒鐘從物理設備讀入的數據總量
wtps:每秒鐘向物理設備寫入的數據總量
bread/s:每秒鐘從物理設備讀入的數據量,單位為 塊/s
bwrtn/s:每秒鐘向物理設備寫入的數據量,單位為 塊/s
##### sar 設備使用情況監(jiān)控
# 每10秒采樣一次,連續(xù)采樣3次,報告設備使用情況,需鍵入如下命令:
$ sar -d 10 3 –p
#輸出說明
參數-p可以打印出sda,hdc等磁盤設備名稱,如果不用參數-p,設備節(jié)點則有可能是dev8-0,dev22-0
tps:每秒從物理磁盤I/O的次數.多個邏輯請求會被合并為一個I/O磁盤請求,一次傳輸的大小是不確定的.
rd_sec/s:每秒讀扇區(qū)的次數.
wr_sec/s:每秒寫扇區(qū)的次數.
avgrq-sz:平均每次設備I/O操作的數據大小(扇區(qū)).
avgqu-sz:磁盤請求隊列的平均長度.
await:從請求磁盤操作到系統完成處理,每次請求的平均消耗時間,包括請求隊列等待時間,單位是毫秒(1秒=1000毫秒).
svctm:系統處理每次請求的平均時間,不包括在請求隊列中消耗的時間.
%util:I/O請求占CPU的百分比,比率越大,說明越飽和.
1. avgqu-sz 的值較低時,設備的利用率較高。
2. 當%util的值接近 1% 時,表示設備帶寬已經占滿。