1、淺談數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘 2、Hadoop/MapReduce購物籃分析:關(guān)聯(lián)規(guī)則挖掘 3、Spark購物籃分析 過程分析:
一 馬爾科夫模型 ? 每個狀態(tài)只依賴之前有限個狀態(tài)– N階馬爾科夫:依賴之前n個狀態(tài)– 1階馬爾科夫(即《中文分詞基礎(chǔ)》中的二元模型):僅僅依賴...
準(zhǔn)備數(shù)據(jù) 建表: 導(dǎo)入數(shù)據(jù): 實驗: inner join left join right join full outer join left ...
查詢?nèi)w學(xué)生的學(xué)號與姓名 查詢選修了課程的學(xué)生姓名 ----hive的group by 和集合函數(shù) 查詢學(xué)生的總?cè)藬?shù) 計算1號課程的學(xué)生平均成績...
測試數(shù)據(jù) 創(chuàng)建分桶表 設(shè)置變量,設(shè)置分桶為true, 設(shè)置reduce數(shù)量是分桶的數(shù)量個數(shù) 加載數(shù)據(jù) 檢查剛剛加載的數(shù)據(jù) 創(chuàng)建測試數(shù)據(jù)表 //結(jié)...
創(chuàng)建表 查看剛剛創(chuàng)建的表 造測試數(shù)據(jù) 加載測試數(shù)據(jù) 由于是內(nèi)部表上圖紅色路徑中的元數(shù)據(jù)在drop表的同時也會被清除 第一步,先求個用戶的月總金額...
參考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...
YARN:資源(linux資源隔離機(jī)制:運(yùn)算資源---運(yùn)算程序jar/配置文件/CPU/內(nèi)存/IO--從linux中開辟出諸如內(nèi)存、處理器的co...
1、mapTask調(diào)用InputFormat再調(diào)用RecourReader的read()方法來讀取數(shù)據(jù),獲得key、value,mapreduc...