Hadoop離線數(shù)據(jù)分析平臺實(shí)戰(zhàn)——410事件分析
項(xiàng)目進(jìn)度
| 模塊名稱 | 完成情況 |
|---|---|
| 用戶基本信息分析(MR)? | 完成 |
| 瀏覽器信息分析(MR) | 完成 |
| 地域信息分析(MR) | 完成 |
| 外鏈信息分析(MR) | 完成 |
| 用戶瀏覽深度分析(Hive) | 完成 |
| 訂單分析(Hive) | 未完成 |
| 事件分析(Hive) | 未完成 |
模塊介紹
事件分析我們主要只是分析事件的觸發(fā)次數(shù),
通過查看事件的觸發(fā)次數(shù)我們可以得到事件轉(zhuǎn)換率或者用戶會此類事件的興趣所在之處以及不喜之處。
計(jì)算規(guī)則
計(jì)算event事件中,計(jì)算category和action分組后的記錄個(gè)數(shù),不涉及到任何的去重操作。
最終數(shù)據(jù)保存:stats_event。涉及到所有列。
涉及到其他表有dimension_platform、dimension_date、dimension_event。
代碼步驟
- hive自定義函數(shù)定義
- hive中創(chuàng)建hbase對應(yīng)的外部表
- hive腳步編寫
- sqoop腳步編寫
- 測試
參考:..\代碼\transformer\hive\en\statsEvent.hql