- 用戶行為日志
- 電商常用術(shù)語(yǔ)
- 項(xiàng)目需求
- 數(shù)據(jù)處理流程以及技術(shù)架構(gòu)
- 需求實(shí)現(xiàn)
- 提交到服務(wù)器運(yùn)行
- 擴(kuò)展
用戶行為日志
什么是用戶行為日志
每一次訪問(wèn)的行為(訪問(wèn)、搜索)產(chǎn)生的日志:
歷史行為數(shù)據(jù) <===歷史訂單
====> 推薦為什么要記錄用戶行為日志
千人千面,方便做推薦,
利用nginx、ajax用戶行為日志生成渠道
日志字段說(shuō)明:
第2個(gè)字段:url ====> 頁(yè)面ID
第14字段: ip ====> 地市 : 省份、城市
第18字段:time用戶行為日志分析意義何在
refer:引流
項(xiàng)目需求:
- 統(tǒng)計(jì)頁(yè)面的瀏覽量
- 統(tǒng)計(jì)各個(gè)省份的瀏覽量
- 統(tǒng)計(jì)頁(yè)面的訪問(wèn)量

image.png
代碼實(shí)現(xiàn)過(guò)程:
讀取日志,寫出一個(gè)LogParser類,
- 統(tǒng)計(jì)頁(yè)面的瀏覽量
只需要將每一個(gè)記錄加一即可
- 統(tǒng)計(jì)各個(gè)省份的瀏覽量
- 拿到 ip, 再通過(guò) ip解析源代碼得到 country、province 、city
- 寫map,寫reduce
- 統(tǒng)計(jì)頁(yè)面的訪問(wèn)量
- 拿到pageId
- 寫map,寫reduce