最近在完成一個(gè)比較大的多線程C++離線服務(wù)程序后,發(fā)現(xiàn)經(jīng)常會(huì)出現(xiàn)卡住的情況,表現(xiàn)為CPU利用率100%左右,一直沒找到代碼原因,就采用了一個(gè)笨到方法,每小時(shí)重啟一次服務(wù)……
這樣做仍然會(huì)有好多數(shù)據(jù)進(jìn)不了庫,不是治本的方法,前幾天決定徹底解決這個(gè)問題,搜索發(fā)現(xiàn)了gdb的一個(gè)強(qiáng)大的功能,gdb attach(如何定位死循環(huán)或高CPU使用率(linux) - Sonic4x),記錄一下。
找出線程
找出CPU利用率高的進(jìn)程(例如http_xxx)的所有線程,進(jìn)行排序
ps xH -e -o pid,tid,pcpu,cmd --sort=pcpu | grep 'http_xxx'
得到結(jié)果:
2233 2245 1.2 http_xxx
2233 2237 80.9 http_xxx
找到線程2237的CPU占用率高。
用gdb找出調(diào)用棧
gdb,attach pid,info threads顯示所有線程
gdb>attach 2233
gdb>info threads
結(jié)果如下,可以發(fā)現(xiàn)2237的編號(hào)為4
4 Thread 0xac1fcb70 (LWP 2237)? 0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1
...
* 1 Thread 0xb78496d0 (LWP 2238 ?0x006e0422 in __kernel_vsyscall ()
使用thread切換線程,使用bt顯示線程棧
gdb>thread 4
gdb>bt
可以定位到某個(gè)函數(shù)到某行代碼了,就找到原因了。