本文由 meelo 原創(chuàng),請務必以鏈接形式注明 本文地址,簡書同步更新地址
一對一的項目輔導是優(yōu)達學城納米學位的一大亮點。本文將簡要介紹優(yōu)達學城機器學習工程師納米學位的6個項目。項目覆蓋了機器學習的主要領域,包括回歸分析、分類、聚類、增強學習及深度學習。
項目 0: 預測泰坦尼克號乘客生還率
這個項目需要你手動地實現(xiàn)一個簡單的機器學習模型——決策樹。
1912年泰坦尼克號在第一次航行中與冰山碰撞沉沒,泰坦尼克號乘客生還數(shù)據(jù)集記錄了之中891個乘客的性別、年齡、社會階級、配偶數(shù)量等數(shù)據(jù)以及他們是否存活。項目需要你觀察每一個特征與乘客存活之間的聯(lián)系,選擇合適的特征與閾值進行分類。

你將從一個簡單的算法開始入手,逐漸增加它的復雜度,直到你能夠在給定的數(shù)據(jù)條件下,以至少80%的準確度預測乘客的生還情況。
決策樹每次選擇一個特征把數(shù)據(jù)分割成越來越小的子集。如果分割結果的子集中的數(shù)據(jù)比之前更同質(zhì),預測就會更加準確。計算機來幫助我們做這件事回避手動更徹底,更精確。
項目 1: 預測波士頓房價
這個項目使用決策樹來預測波士頓的房價,你需要完成機器學習的整個流程。這包括數(shù)據(jù)探索、建立模型、參數(shù)選擇、模型評估。
波士頓房價數(shù)據(jù)集于1978年美國波士頓地區(qū),總共包含506個樣本,特征包括房屋平均房間數(shù)、學生與老師的比例、房主凈資產(chǎn)超過地區(qū)平均水平的比例。
項目探討了決策樹的深度以及樣本個數(shù)對于模型性能的影響,并采用網(wǎng)格搜索來確定模型的參數(shù)。

項目最后探討了模型是否能夠應用于真實世界中。
項目 2: 構建學生干預系統(tǒng)
隨著技術在教學活動中的作用日益增加,越來越多的數(shù)據(jù)被應用到教學成果的檢驗和預測中。學生行為記錄、成績、與老師同學的互動記錄等數(shù)據(jù),都已經(jīng)開始發(fā)揮價值。教育者正尋求新的方法來預測教學成果的成敗,以便提前采取有效的干預措施,并確認不同干預手段的效果。
數(shù)據(jù)的特征
school,sex,age,address,famsize,Pstatus,Medu,Fedu,Mjob,Fjob,reason,guardian,traveltime,studytime,failures,schoolsup,famsup,paid,activities,nursery,higher,internet,romantic,famrel,freetime,goout,Dalc,Walc,health,absences,passed
這個項目根據(jù)學生學習情況、課外活動情況、家庭情況預測學生是否能夠通過期末考試,是一個分類的問題。項目需要使用3種不同的分類器來處理數(shù)據(jù),并衡量不同方法的優(yōu)缺點。
項目數(shù)據(jù)的部分變量是類別變量,比如父母的工作為服務業(yè)、醫(yī)療業(yè)等,需要轉(zhuǎn)換成2進制變量。
項目 3: 創(chuàng)建客戶細分
在這個項目中,我們將獲得一批非結構化的數(shù)據(jù),你要了解數(shù)據(jù)的模式,發(fā)現(xiàn)他們適合的自然類別。首先你將學到處理無標簽數(shù)據(jù)的實用方法,然后你將選擇一個數(shù)據(jù)集來實踐學到的技能,目標是發(fā)現(xiàn)數(shù)據(jù)集中自有的自然類別。
項目使用的數(shù)據(jù)是批發(fā)客戶數(shù)據(jù)集,數(shù)據(jù)集包含批發(fā)客戶在生鮮、牛奶、雜貨、清潔紙、冷凍、熟食的消費金額。這個項目是一個聚類的問題。
項目首先使用主成分分析法將數(shù)據(jù)映射到2維。然后根據(jù)Tukey's Method for identfying outliers清除異常點。最后使用K均值或者高斯混合模型聚類。項目將使用silhouette分數(shù)來選擇聚類的個數(shù)。
項目討論了對客戶細分之后,可以采取差異化的服務策略。同時應用A/B測試分析差異化的服務策略是否有好的效果。

項目 4: 訓練智能出租車學會駕駛
在不遠的將來,智能車將可以在無人駕駛的情況下,從任意地點接送乘客。在這個項目中,你將通過強化學習訓練智能車學會自動駕駛。
項目需要你實現(xiàn)Q學習算法,讓出租車在當前十字路口的紅綠燈、其它汽車的狀況和目的地做出最優(yōu)決策。在不給出具體規(guī)則,只有不同狀態(tài)下決策的得失,Q學習算法會學會遵守紅綠燈規(guī)則和其它交通規(guī)則并在最短的時間內(nèi)到達目的地。
項目需要你為Q學習算法選擇合適的參數(shù)。并分析算法是否找到了最優(yōu)的策略。

項目 5: 畢業(yè)項目
在本項目中,你將充分應用之前學到的知識,使用機器學習算法和技術解決你選擇的問題。首先確定你想要解決的問題,探討可能的解決方案和需要關注的性能指標。然后,通過可視化和數(shù)據(jù)探索分析,進一步發(fā)現(xiàn)解決問題最合適的算法和特征。
項目可以從給定了6個方向(深度學習、機器人運動規(guī)劃、醫(yī)療保健、計算機視覺、教育、投資和貿(mào)易)選擇一個題目,或者是從kaggle上選擇一個競賽。
不像之前的項目會提供部分代碼,只需要你根據(jù)提示補全。畢業(yè)項目需要你從零開始,根據(jù)所學的知識完成這個項目。因此畢業(yè)項目所需要花費的時間也會大大增加。

我分享了300元學費紅包給你,快來學Google、亞馬遜、Facebook官方的機器學習、數(shù)據(jù)分析、前端開發(fā)課程。在這領取: https://cn.udacity.com/referral-invitation/?referral_recipient_amount_off=300&referral_recipient_coupon_code=75BE8D13