前言
記錄一下Faiss在項(xiàng)目使用中的一些優(yōu)化,對(duì)OMP_NUM_THREADS 環(huán)境變量參數(shù)的測(cè)試驗(yàn)證~
OMP_NUM_THREADS 用于控制線程并發(fā)數(shù).
測(cè)試條件:?jiǎn)蝹€(gè)循環(huán)請(qǐng)求,持續(xù)時(shí)間大于15m;
基礎(chǔ)數(shù)據(jù):200w
軟件環(huán)境:docker; ubuntu 16.04 ;python2.7; faiss:1.4.0-cpu
檢索服務(wù)功能: (漢明距離計(jì)算 + 歐式距離計(jì)算 )
結(jié)論:
測(cè)試總結(jié)如下:
* CPU=1 & OMP_NUM_THREADS=1時(shí),
- 1m,5m,15m load average 分布為 31.54,41.16,43.43;
- CPUs(%) 用戶空間占比:32.1;內(nèi)核空間占比:2.4;空閑占比:65.2;
- faiss 檢索耗時(shí)大約在5-6ms左右;
- 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分在12ms左右;
* CPU=3 & OMP_NUM_THREADS=1時(shí),
- 1m,5m,15m load average 分布為 49.17,48.70,50.54;
- CPUs(%) 用戶空間占比:39.5;內(nèi)核空間占比:4.2;空閑占比:30.3;
- faiss 檢索耗時(shí)大約在5-7ms左右;
- 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分耗時(shí)在12ms左右;
* CPU=3 & OMP_NUM_THREADS=10時(shí),
- 1m,5m,15m load average 分布為 41.33,43.90,55.87;
- CPUs(%) 用戶空間占比:20.7;內(nèi)核空間占比:2.3;空閑占比:58.0;
- faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在10-90ms左右;
- 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在14-92ms左右;
* CPU=1 & OMP_NUM_THREADS=10時(shí),
- 1m,5m,15m load average 分布為 67.77,61.89,61.07;
- CPUs(%) 用戶空間占比:20.6;內(nèi)核空間占比:2.9;空閑占比:18.2;
- faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在5-80ms左右;
- 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在13-99ms左右;
最終結(jié)論:
a: OMP_NUM_THREADS=1時(shí),faiss檢索耗時(shí)較穩(wěn)定;
b: OMP_NUM_THREADS=10時(shí),faiss檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大;
b: OMP_NUM_THREADS=1時(shí), 多核CPU相較于單核CPU,負(fù)載略高,利用率略高,空閑占比較低;
c: OMP_NUM_THREADS=10時(shí), 多核CPU相較于單核CPU,負(fù)載較低,利用率較低,空閑占比較高;
d: 優(yōu)化方向:OMP_NUM_THREADS=1 + 多進(jìn)程
測(cè)試結(jié)果統(tǒng)計(jì):
* CPU=1 & OMP_NUM_THREADS=1

CPU=1 & OMP_NUM_THREADS=1 內(nèi)存情況

CPU=1 & OMP_NUM_THREADS=1 faiss 檢索時(shí)間

CPU=1 & OMP_NUM_THREADS=1 檢索服務(wù)整體響應(yīng)時(shí)間
* CPU=3 & OMP_NUM_THREADS=1

CPU=3 & OMP_NUM_THREADS=1 內(nèi)存情況

CPU=3 & OMP_NUM_THREADS=1 faiss 檢索時(shí)間

CPU=3 & OMP_NUM_THREADS=1 檢索服務(wù)整體響應(yīng)時(shí)間
* CPU=3 & OMP_NUM_THREADS=10

CPU=3 & OMP_NUM_THREADS=10 內(nèi)存情況

CPU=3 & OMP_NUM_THREADS=10 faiss 檢索時(shí)間

CPU=3 & OMP_NUM_THREADS=10 檢索服務(wù)整體響應(yīng)時(shí)間
* CPU=1 & OMP_NUM_THREADS=10

CPU=1 & OMP_NUM_THREADS=10 內(nèi)存情況

CPU=1 & OMP_NUM_THREADS=10 faiss 檢索時(shí)間

CPU=1 & OMP_NUM_THREADS=10 檢索服務(wù)整體響應(yīng)時(shí)間