Automated data collection with R(Preface)

Automated data collection with R

A practical guide to web scraping and text mining
關(guān)于R語言數(shù)據(jù)自動(dòng)化處理,如爬蟲,還有一些網(wǎng)頁相關(guān)基礎(chǔ)。

參考書就是Automated data collection with R
先是介紹一下本書的緒論和資源:

首先,怎么判斷你的需求,是否需要爬蟲來解決問題:

  • 該任務(wù)是否經(jīng)常需要重復(fù)執(zhí)行,比如更新你的數(shù)據(jù)庫?

  • 你是否希望其他人能夠重復(fù)你的數(shù)據(jù)收集過程?

  • 你是否經(jīng)常處理在線數(shù)據(jù)?

  • 這個(gè)任務(wù)在規(guī)模上和復(fù)雜度上如何?

  • 如果這個(gè)任務(wù)可以手動(dòng)做,你是否有足夠的人手資源或時(shí)間

  • 你是否愿意通過編程來自動(dòng)化你的分析

作者介紹了一些R的實(shí)用網(wǎng)站:

新手快速入門之QuickR:https://www.statmethods.net/

R bloggers: 非常有趣的R topics,收集了所有關(guān)于R的博客:http://www.r-bloggers.com/

recent advances in web technologies:關(guān)于R與其網(wǎng)站應(yīng)用的一些更新:https://cran.r-project.org/web/views/WebTechnologies.html

整本書的website在:http://www.r-datacollection.com/ 包含本書配套的教程,代碼,blog等等。blog會(huì)經(jīng)常更新,推送一些實(shí)戰(zhàn)資源。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容