Faiss優(yōu)化:針對(duì)OMP_NUM_THREADS環(huán)境變量設(shè)置的測(cè)試驗(yàn)證

前言

記錄一下Faiss在項(xiàng)目使用中的一些優(yōu)化,對(duì)OMP_NUM_THREADS 環(huán)境變量參數(shù)的測(cè)試驗(yàn)證~

   OMP_NUM_THREADS 用于控制線程并發(fā)數(shù).

   測(cè)試條件:?jiǎn)蝹€(gè)循環(huán)請(qǐng)求,持續(xù)時(shí)間大于15m;
   基礎(chǔ)數(shù)據(jù):200w
   軟件環(huán)境:docker; ubuntu 16.04 ;python2.7; faiss:1.4.0-cpu
   檢索服務(wù)功能: (漢明距離計(jì)算 + 歐式距離計(jì)算 )

結(jié)論:

    測(cè)試總結(jié)如下:
        * CPU=1 & OMP_NUM_THREADS=1時(shí),
         - 1m,5m,15m load average 分布為 31.54,41.16,43.43;
         - CPUs(%) 用戶空間占比:32.1;內(nèi)核空間占比:2.4;空閑占比:65.2;
         - faiss 檢索耗時(shí)大約在5-6ms左右;
         - 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分在12ms左右;
    * CPU=3 & OMP_NUM_THREADS=1時(shí),
         - 1m,5m,15m load average 分布為 49.17,48.70,50.54;
         - CPUs(%) 用戶空間占比:39.5;內(nèi)核空間占比:4.2;空閑占比:30.3;
         - faiss 檢索耗時(shí)大約在5-7ms左右;
         - 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分耗時(shí)在12ms左右;
    * CPU=3 & OMP_NUM_THREADS=10時(shí),
         - 1m,5m,15m load average 分布為 41.33,43.90,55.87;
         - CPUs(%) 用戶空間占比:20.7;內(nèi)核空間占比:2.3;空閑占比:58.0;
         - faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在10-90ms左右;
         - 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在14-92ms左右;
    * CPU=1 & OMP_NUM_THREADS=10時(shí),
         - 1m,5m,15m load average 分布為 67.77,61.89,61.07;
         - CPUs(%) 用戶空間占比:20.6;內(nèi)核空間占比:2.9;空閑占比:18.2;
         - faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在5-80ms左右;
         - 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在13-99ms左右;

    最終結(jié)論:
        a: OMP_NUM_THREADS=1時(shí),faiss檢索耗時(shí)較穩(wěn)定;
        b: OMP_NUM_THREADS=10時(shí),faiss檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大;
        b: OMP_NUM_THREADS=1時(shí), 多核CPU相較于單核CPU,負(fù)載略高,利用率略高,空閑占比較低;
        c: OMP_NUM_THREADS=10時(shí), 多核CPU相較于單核CPU,負(fù)載較低,利用率較低,空閑占比較高;
        d: 優(yōu)化方向:OMP_NUM_THREADS=1 + 多進(jìn)程

測(cè)試結(jié)果統(tǒng)計(jì):

* CPU=1 & OMP_NUM_THREADS=1

CPU=1 & OMP_NUM_THREADS=1 內(nèi)存情況

CPU=1 & OMP_NUM_THREADS=1 faiss 檢索時(shí)間

CPU=1 & OMP_NUM_THREADS=1 檢索服務(wù)整體響應(yīng)時(shí)間

* CPU=3 & OMP_NUM_THREADS=1

CPU=3 & OMP_NUM_THREADS=1 內(nèi)存情況

CPU=3 & OMP_NUM_THREADS=1 faiss 檢索時(shí)間

CPU=3 & OMP_NUM_THREADS=1 檢索服務(wù)整體響應(yīng)時(shí)間

* CPU=3 & OMP_NUM_THREADS=10

CPU=3 & OMP_NUM_THREADS=10 內(nèi)存情況

CPU=3 & OMP_NUM_THREADS=10 faiss 檢索時(shí)間

CPU=3 & OMP_NUM_THREADS=10 檢索服務(wù)整體響應(yīng)時(shí)間

* CPU=1 & OMP_NUM_THREADS=10

CPU=1 & OMP_NUM_THREADS=10 內(nèi)存情況

CPU=1 & OMP_NUM_THREADS=10 faiss 檢索時(shí)間

CPU=1 & OMP_NUM_THREADS=10 檢索服務(wù)整體響應(yīng)時(shí)間
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容