數(shù)據(jù)轉(zhuǎn)換處理之規(guī)格化:十基數(shù)變換規(guī)格化算法

規(guī)格化就是將一個(gè)屬性取值范圍投射到一個(gè)特定范圍之內(nèi),以消除數(shù)值型屬 性因大小不一而造成挖掘結(jié)果的偏差。規(guī)劃化處理常常用于神經(jīng)網(wǎng)絡(luò)、基于距離 計(jì)算的最近鄰分類和聚類挖掘的數(shù)據(jù)預(yù)處理。對(duì)于神經(jīng)網(wǎng)絡(luò),采用規(guī)格化后的數(shù) 據(jù)不僅有助于確保學(xué)習(xí)結(jié)果的正確性,而且也會(huì)幫助提高學(xué)習(xí)的速度。對(duì)于基于 距離計(jì)算的挖掘,規(guī)格化方法可以幫助消除因?qū)傩匀≈捣秶煌绊懲诰蚪Y(jié)果 的公正性。介紹三種規(guī)格化方法

  • <a href="http://www.itdecent.cn/p/f59c051551e1">最大最小規(guī)格化方法</a>
  • <a href="http://www.itdecent.cn/p/92318a6c3a65">零均值規(guī)格化方法</a>
  • <a href="http://www.itdecent.cn/p/890c36ff8f34">十基數(shù)變換規(guī)格化方法</a>

十基數(shù)變換規(guī)格化方法

  • 該方法通過移動(dòng)屬性 值的小數(shù)位置來達(dá)到規(guī)格化的目的。
    <b>所移動(dòng)的小數(shù)位數(shù)取決于屬性絕對(duì)值的最大值</b>。屬性的值可以通過以下計(jì)算公式獲得其映射值v':
十基數(shù)變換規(guī)格化算法.png
  • 示例
    假設(shè)屬性A的取值范圍是從 -986 到 917。屬性A絕對(duì)值的最大值
    為986。采用十基數(shù)變換規(guī)格化方法,就是將屬性A的每個(gè)值除以 1000(即j = 3 ) 即可,因此-986 映射為 -0.986。

  • 代碼實(shí)現(xiàn)
    待續(xù)......

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容