1、淺談數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘 2、Hadoop/MapReduce購(gòu)物籃分析:關(guān)聯(lián)規(guī)則挖掘 3、Spark購(gòu)物籃分析 過程分析:
一 馬爾科夫模型 ? 每個(gè)狀態(tài)只依賴之前有限個(gè)狀態(tài)– N階馬爾科夫:依賴之前n個(gè)狀態(tài)– 1階馬爾科夫(即《中文分詞基礎(chǔ)》中的二元模型):僅僅依賴...
準(zhǔn)備數(shù)據(jù) 建表: 導(dǎo)入數(shù)據(jù): 實(shí)驗(yàn): inner join left join right join full outer join left ...
查詢?nèi)w學(xué)生的學(xué)號(hào)與姓名 查詢選修了課程的學(xué)生姓名 ----hive的group by 和集合函數(shù) 查詢學(xué)生的總?cè)藬?shù) 計(jì)算1號(hào)課程的學(xué)生平均成績(jī)...
測(cè)試數(shù)據(jù) 創(chuàng)建分桶表 設(shè)置變量,設(shè)置分桶為true, 設(shè)置reduce數(shù)量是分桶的數(shù)量個(gè)數(shù) 加載數(shù)據(jù) 檢查剛剛加載的數(shù)據(jù) 創(chuàng)建測(cè)試數(shù)據(jù)表 //結(jié)...
創(chuàng)建表 查看剛剛創(chuàng)建的表 造測(cè)試數(shù)據(jù) 加載測(cè)試數(shù)據(jù) 由于是內(nèi)部表上圖紅色路徑中的元數(shù)據(jù)在drop表的同時(shí)也會(huì)被清除 第一步,先求個(gè)用戶的月總金額...
參考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...
YARN:資源(linux資源隔離機(jī)制:運(yùn)算資源---運(yùn)算程序jar/配置文件/CPU/內(nèi)存/IO--從linux中開辟出諸如內(nèi)存、處理器的co...
1、mapTask調(diào)用InputFormat再調(diào)用RecourReader的read()方法來(lái)讀取數(shù)據(jù),獲得key、value,mapreduc...