最近我們對我們平臺的用戶進(jìn)行了一個用戶標(biāo)簽提取,這中間的主要流程如下圖3-1所示: 一、梳理做用戶畫像需要的數(shù)據(jù)用戶畫像是基于業(yè)務(wù)數(shù)據(jù)而進(jìn)行的,...
在前一篇文章中我制定了用戶畫像的計劃,第一部分就是數(shù)據(jù)建模。以“一面APP”為例。 一、一面產(chǎn)品介紹 為了更好地理解如何為一個產(chǎn)品做數(shù)據(jù)建模,我...
最近準(zhǔn)備研究下用戶畫像,先制定一個計劃,在簡書上記錄下,希望得到同道中人一起討論。 一、目的 用戶畫像的目的是通過分析用戶行為,最終為每個用戶打...
一、HDFS分布式文件系統(tǒng)的shell操作 HDFS的shell操作基本和Linux的shell命令差不多,我這邊重點介紹幾個常用的文件操作的命...
一、hadoop的部署安裝 1、安裝JDK:下載jdk,解壓,配置環(huán)境變量 2、安裝hadoop:下載安裝包,解壓 利用tar -zxvf把ha...
一、為什么需要hadoop? 在數(shù)據(jù)量很大的情況下,單機(jī)的處理能力無法勝任,必須采用分布式集群的方式進(jìn)行處理,而用分布式集群的方式處理數(shù)據(jù),實現(xiàn)...
一、zookeeper簡介 zookeeper是一個分布式應(yīng)用程序協(xié)調(diào)服務(wù),分布式應(yīng)用程序可以基于它實現(xiàn)同步服務(wù)。具體來講zookeeper可以...