機(jī)器學(xué)習(xí)的概念:
大數(shù)據(jù)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),這三者是不同但有重合的領(lǐng)域
而人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的關(guān)係是這樣的:
人工智能>=機(jī)器學(xué)習(xí)>=深度學(xué)習(xí),三者是在同一個框架、類似父類和子類的關(guān)係吧?
然後,這次是‘機(jī)器學(xué)習(xí)特訓(xùn)營’,想當(dāng)然是聚焦在機(jī)器學(xué)習(xí)這一塊
機(jī)器學(xué)習(xí)中,主要的框架為
【過去數(shù)據(jù)】—》透過【機(jī)器訓(xùn)練】—》得到【算法模型】
再用得出來的【算法模型】加上【未來數(shù)據(jù)】來預(yù)測未來。
接著,機(jī)器學(xué)習(xí)主要分為:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)又分為「分類」、「回歸」
非監(jiān)督則是「聚類」
而在用廣告投放數(shù)據(jù)來預(yù)測銷量的案例中
主要有兩個變量:預(yù)算、銷量
透過python 中的matplotlib.pyplot 來先可視化過去數(shù)據(jù)
得知整個數(shù)據(jù)大概是以線性增長的分佈
因此用線性回歸的方式來訓(xùn)練數(shù)據(jù)、以及預(yù)測
程式碼為:
x = data['TV'].values.reshape(-1,1)
y = data['sales'].values.reshape(-1,1)
reg = LinearRegression()
reg.fit(x,y)
#假設(shè)y = ax+b
print('a = {:.5}'.format(reg.coef_[0][0]))#0行0列
print('b = {:.5}'.format(reg.intercept_[0]))