理解cpu負(fù)載和linux性能監(jiān)控

概述

兩個(gè)術(shù)語:

  • System load/CPU Load:是衡量Linux系統(tǒng)中CPU使用率過高或利用率不足的指標(biāo); CPU正在執(zhí)行或處于等待狀態(tài)的進(jìn)程數(shù)。
  • Load average:是在給定的1分鐘,5分鐘和15分鐘的時(shí)間內(nèi)計(jì)算出的平均系統(tǒng)負(fù)載。

平均負(fù)載是指其(內(nèi)核)執(zhí)行隊(duì)列中被標(biāo)記為正在運(yùn)行或不間斷的進(jìn)程的運(yùn)行平均值。
幾乎所有類似Unix的系統(tǒng)僅統(tǒng)計(jì)處于運(yùn)行或等待狀態(tài)的進(jìn)程。 但在Linux中,還包括處于不間斷睡眠狀態(tài)的進(jìn)程,等待其他系統(tǒng)資源(例如磁盤I / O等)的進(jìn)程等。

查看負(fù)載的命令

uptime

$ uptime
 14:36:49 up 197 days, 20:42,  1 user,  load average: 8.64, 8.54, 8.35
  • load average over the last 1 minute is 8.64
  • load average over the last 5 minutes is 8.54
  • load average over the last 15 minutes is 8.35

平均較高的負(fù)載意味著系統(tǒng)過載。 許多進(jìn)程正在等待CPU時(shí)間。

top

image.png

load average: 1.22, 1.12, 1.26

cat proc

$ cat /proc/loadavg
8.40 8.58 8.40 13/3894 81951

查看cpu

使用nproc或者lscpu命令。

$ nproc
80

$ lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                80
On-line CPU(s) list:   0-79
Thread(s) per core:    2
Core(s) per socket:    20
Socket(s):             2
NUMA node(s):          2
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 85
Model name:            Intel(R) Xeon(R) Gold 6248 CPU @ 2.50GHz
Stepping:              7
CPU MHz:               3200.195
CPU max MHz:           3900.0000
CPU min MHz:           1000.0000
BogoMIPS:              5000.00
Virtualization:        VT-x
L1d cache:             32K
L1i cache:             32K
L2 cache:              1024K
L3 cache:              28160K
NUMA node0 CPU(s):     0-19,40-59
NUMA node1 CPU(s):     20-39,60-79
Flags:                 fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch epb cat_l3 cdp_l3 intel_pt tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm cqm mpx rdt_a avx512f avx512dq rdseed adx smap clflushopt clwb avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local dtherm ida arat pln pts hwp hwp_act_window hwp_epp hwp_pkg_req

負(fù)載和cpu的對(duì)應(yīng)

為了進(jìn)一步了解系統(tǒng)負(fù)載,我們將采取一些假設(shè)。 假設(shè)我們的平均負(fù)載如下:

$ uptime
23:16:49 up  10:49,  5 user,  load average: 1.00, 0.40, 3.35

在單core系統(tǒng)上

  • CPU的利用率為100%。 在過去1分鐘內(nèi),CPU(1.00)上有1個(gè)進(jìn)程正在運(yùn)行。
  • CPU閑置率平均為60%; 最近5分鐘內(nèi)沒有進(jìn)程在等待CPU時(shí)間(0.40)。
  • CPU平均超負(fù)荷235%; 最近15分鐘內(nèi),有2.35個(gè)進(jìn)程在等待CPU時(shí)間(3.35)。

在雙core系統(tǒng)上

  • 一個(gè)CPU平均100%處于空閑狀態(tài),另一個(gè)CPU正在使用。 最近1分鐘內(nèi)沒有進(jìn)程在等待CPU時(shí)間(1.00)。
  • CPU的閑置率平均為160%; 沒有進(jìn)程正在等待CPU時(shí)間。 (5分鐘內(nèi))(0.40)。
  • CPU平均超負(fù)荷了135%; 1.35個(gè)進(jìn)程正在等待CPU時(shí)間。 (3.35)在過去15分鐘內(nèi)。

備注:以上的cpuinfo和load信息,來自不同的機(jī)器,不是一臺(tái)機(jī)器的信息,不要聯(lián)系起來看。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容