背景 用戶訪問APP內(nèi)頁面的順序是不固定的,為了專注于研究用戶轉(zhuǎn)化,只需要研究符合正常產(chǎn)品流程的用戶行為即可,則需要對(duì)用戶的操作日志記錄做清洗,只保留符合產(chǎn)品使用流程的訪問記...
背景 用戶訪問APP內(nèi)頁面的順序是不固定的,為了專注于研究用戶轉(zhuǎn)化,只需要研究符合正常產(chǎn)品流程的用戶行為即可,則需要對(duì)用戶的操作日志記錄做清洗,只保留符合產(chǎn)品使用流程的訪問記...
背景 需要對(duì)用戶的訪問日志記錄進(jìn)行轉(zhuǎn)化分析,由于日志記錄沒有業(yè)務(wù)session,需要物理地對(duì)訪問記錄進(jìn)行session切分,規(guī)則是30分鐘內(nèi)的用戶操作為一個(gè)會(huì)話(sessio...
有三個(gè)表,分別是區(qū)域(district),城市(city)和訂單(order)。區(qū)域中有兩個(gè)字段分別是區(qū)域ID(disid)和區(qū)域名稱(disname);城市有兩個(gè)字段分別是...
前言 近幾年網(wǎng)絡(luò)直播平臺(tái)異?;馃?,各大平臺(tái)為了搶占市場(chǎng)拉攏名氣主播不斷在燒錢,這在一方面就催生出主播這么一個(gè)看似不出力但很賺錢的行業(yè),所以就想通過數(shù)據(jù)挖掘出一些有價(jià)值的信息看...
數(shù)據(jù)加載、存儲(chǔ)于文件格式 讀寫文本格式的數(shù)據(jù) pandas 提供了一些用于將表格型數(shù)據(jù)讀取為 DataFrame 對(duì)象的函數(shù),其中 read_csv 和 read_table...
數(shù)據(jù)規(guī)整化:清理、轉(zhuǎn)化、合并、重塑 合并數(shù)據(jù)集 pandas.merge 可根據(jù)一個(gè)或多個(gè)鍵將不同 DataFrame 中的行連接起來。pandas.concat 可以沿著一...
NumPy 基礎(chǔ):數(shù)組和矢量計(jì)算 NumPy 的 ndarray : 一種多維數(shù)組對(duì)象 創(chuàng)建ndarray 數(shù)組創(chuàng)建函數(shù) ndarray的數(shù)據(jù)類型 調(diào)用astype無論如何都...