特征工程--特征變換

1、特征尺度變換

1.1什么是特征尺度變換

是一種電腦視覺的算法用來偵測與描述影像中的局部性特征,它在空間尺度中尋找極值點,并提取出其位置、尺度、旋轉(zhuǎn)不變量;其應用范圍包含物體識別、機器人地圖感知與導航、影像縫合、3D模型建立、手勢辨識、影像追蹤和動作比對。支持常見的尺度變化函數(shù) log2,log10,In,abs,sqrt。支持稠密或稀疏

1.2如何使用特征尺度變換

阿里數(shù)加平臺提供在畫布區(qū)拖拽式的方式進行配置,以算法參數(shù)的方式提供給用戶,要想使用每個組件,須先了解每個參數(shù)的含義

2、特征異常平滑

2.1什么是特征異常平滑

將輸入特征中含有異常的數(shù)據(jù)平滑到一定區(qū)間,支持稀疏和稠密(特征平滑組件只是將異常取值的特征值修正成正常值,本身不過濾或刪除任何記錄,輸入數(shù)據(jù)維度和條數(shù)都不變)

2.2如何使用特征異常平滑

特征異常平滑分為 Zscore平滑、百分位平滑、閾值平滑

3、異常檢測模塊

3.1什么是異常檢測模塊

顧名思義,異常檢測就是檢測異常的;分為針對連續(xù)值特征的異常(按箱線圖最大值和最小值檢測異常特征),針對枚舉值特征的異常(按照枚舉特征的取值頻率,按照閾值過濾異常特征)

3.2如何使用異常檢測模塊

阿里數(shù)加平臺提供在畫布區(qū)拖拽式的方式進行配置,以算法參數(shù)的方式提供給用戶,要想使用每個組件,須先了解每個參數(shù)的含義

4、one-hot編碼

4.1什么是one-hot編碼

one-hot編碼,也稱獨熱編碼,對于每一個特征,如果它有m個可能值,那么經(jīng)過獨熱編碼后,就變成了m個二元特征。并且,這些特征互斥,每次只有一個激活。因此,數(shù)據(jù)會變成稀疏的,輸出結(jié)果也是k:v的稀疏結(jié)構(gòu)

4.2如何使用one-hot編碼

二值化

5、特征離散

5.1什么是特征離散

顧名思義,特征離散就是離散特征的,分為“支持稠密或稀疏的數(shù)值類特征離散”和“支持等頻離散和等距離離散”

5.2如何使用特征離散

直接選擇離散方法和離散區(qū)間即可

6、主成分分析(PCA)

6.1什么是主成分分析

PCA利用主成分分析方法,實現(xiàn)降維和降噪的功能;目前支持稠密數(shù)據(jù)格式

6.2如何使用主成分分析

我也不是很清楚,等清楚之后再補

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容