引例:預(yù)測房子的價格,可能有兩個特征,frontage和depth。我真正關(guān)心的是房子的占地面積,這決定了我擁有的土地的大小,因此我們可以自己構(gòu)造一個特征,即frongtage*depth,表示房子的占地面積,用x表示。

與特征選擇密切相關(guān)的一個概念就是多項式回歸。對于一個房價預(yù)測問題,可能有不同的模型進行建模,如建立二次函數(shù)模型、三次函數(shù)模型等。如何將這些模型對應(yīng)到線性回歸模型中呢。

對于上圖,我們想用三次函數(shù)來擬合房價數(shù)據(jù),則要進行參數(shù)的轉(zhuǎn)換,,這樣就轉(zhuǎn)換為一個多變量線性回歸模型。在此時,特征縮放就會變得很重要。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?實際上特征的選擇有很多,你也可以不選擇三次模型,憑借數(shù)據(jù)特征和對不同函數(shù)圖像的了解程度,有不同的特征可供選擇。不過有很多算法可以自動根據(jù)數(shù)據(jù)選擇適合的特征。

平方根函數(shù)擬合數(shù)據(jù)