從開始學(xué)習(xí)R語言,到今天,已經(jīng)過去5個多月了,從最初的新鮮,到后來的初探R語言的神奇,到如今竟然已經(jīng)到達(dá)第五關(guān)了。
感謝猴子老師搭建的學(xué)習(xí)平臺和學(xué)習(xí)闖關(guān)模式,回頭想想,如果當(dāng)時沒有參加《從零學(xué)會大數(shù)據(jù)核心:數(shù)據(jù)分析》系列課程,恐怕現(xiàn)在R語言已經(jīng)與我形同陌路了。
這5個多月,我學(xué)習(xí)了什么?

各關(guān)學(xué)習(xí)內(nèi)容:




各關(guān)實踐和輸出如下:
第一關(guān):訂學(xué)習(xí)計劃。這關(guān)明確學(xué)習(xí)目的,和訂立學(xué)習(xí)計劃。
第二關(guān):以一種獨立的姿態(tài)開始R語言之旅
主要是《R語言實戰(zhàn)》的第一二章的學(xué)習(xí)。在敲代碼中不斷地碰壁,不斷地遇到“Error”的提示,也只能硬著頭皮往前(后來發(fā)現(xiàn),硬著頭皮往前是學(xué)習(xí)中的常態(tài))。解決之道主要是通過網(wǎng)絡(luò)搜索答案和自己在代碼框中“折騰”。這一關(guān),主要是熟悉了R語言的一些基本操作,還看不到R語言能做出的成果
第三關(guān):循序漸進(jìn)的R語言第二程
這一關(guān)還是繼續(xù)《R語言實戰(zhàn)》的學(xué)習(xí),第三和第四章的學(xué)習(xí)就需要拿例子還做練習(xí)了,和第一關(guān)一樣,用書中的代碼,但常常還是碰到問題,于是又請教高手,又查閱網(wǎng)絡(luò)。這次發(fā)現(xiàn)了百度和谷歌搜索信息結(jié)果的差別,同一個搜索關(guān)鍵詞,谷歌中的搜索結(jié)果明顯就更有用,最終幫我解決了問題。這關(guān)練習(xí)是有輸出圖形的,雖然還初級。但是可定制的因素非常多,以此看出,R語言在不同人手中,呈現(xiàn)的結(jié)果差別可以是大得驚人的。這點和office中的作圖是有很大區(qū)別的,office中的數(shù)據(jù)圖繪制圖形化界面,但樣式相對來說較少。
第四關(guān):
泰坦尼克事件探秘
HADLEY WICKHAM<R for Data Science>13.1-13.3(翻譯)
在Kaggle上見到了世界各地的數(shù)據(jù)分析高手的比拼,實戰(zhàn)作業(yè)就是以戲劇化的泰坦尼克事件做練習(xí),以train樣本預(yù)測test樣本中各人的存亡結(jié)果。開始是一頭霧水,同樣是在網(wǎng)絡(luò)上找范例,跟著一步步地敲代碼,從當(dāng)時的傳說中推導(dǎo)可能的存亡規(guī)律,再到數(shù)據(jù)中印證,再去預(yù)測,再優(yōu)化條件,再預(yù)測,從最初的Kaggle排名6000+躍升至3000+。
第五關(guān):SQL學(xué)習(xí)
這一關(guān)學(xué)習(xí)SQL,書本是《深入淺出SQL》,不象前幾關(guān)學(xué)習(xí)二章內(nèi)容,因為是學(xué)習(xí)一本書,因此這是學(xué)習(xí)時間最長的一關(guān),但也是不可或缺的一步,因為SQL是打下R語言和數(shù)據(jù)庫連接的一關(guān)。
同時這關(guān)還對泰坦尼克事件預(yù)測做了進(jìn)一步優(yōu)化,當(dāng)完成文章在知乎上提交后,很悲催的,竟然消失了。不過優(yōu)化內(nèi)容花了很長時間,也是跟著一位大牛的預(yù)測一步步做的練習(xí)。意義就在于反復(fù)地練習(xí),熟悉R語言的預(yù)測語句,揣摩預(yù)測形成的各判斷如何落實為一個個語句。經(jīng)過這次優(yōu)化,Kaggle排名上升到2000+。
專欄文章分析
應(yīng)社群要求,第一關(guān)就開始將每一次的學(xué)習(xí)回顧和作業(yè)發(fā)布在知乎上,同時部分文章我也在簡書上發(fā)表了。(這里吐個槽,有一篇知乎文章莫名其妙地消失了,之前和之后都沒有知乎通知,最近在知乎上寫的文章提交后也莫名消失了,投訴后沒有任何回音,非常沒有安全感。)
目前可見的知乎主頁的訪問數(shù)是264次,簡書上三篇文章的閱讀量是197次,點贊數(shù)和評論不多,基本上是鼓勵為主。從簡書上可以看出單篇文章閱讀量,最大的是第三關(guān):《循序漸進(jìn)的R語言第二程》。閱讀量主要跟標(biāo)題有關(guān),入門的文章看來吸引力不大,而“第二程”可能給出的信息是進(jìn)階的程度,因此引來了更多的閱讀量。
反思
R語言學(xué)習(xí)中最有收獲的還是在有明確目標(biāo)的實踐中,從第三關(guān)開始,我們就有具體的案例著手練習(xí),所有的書上的知識點要變成可用的語句,才能出來想要的結(jié)果。這個過程中會不斷地學(xué),不斷地用,然后再回去學(xué)。
R語言學(xué)習(xí)的周期還是不短的,目前學(xué)習(xí)還只是入門,希望之后用更多的實踐去倒逼輸入,數(shù)據(jù)分析能力不斷升級!