一、中文面試 1.遇到的最大的挫折2.大學(xué)中最成功的事3.大學(xué)中最失敗的事,如果再給你一次機(jī)會,你會怎么改進(jìn)4.優(yōu)缺點5.對自己的評價6.別人對自己的評價7.為什么選擇汽車行...
一、中文面試 1.遇到的最大的挫折2.大學(xué)中最成功的事3.大學(xué)中最失敗的事,如果再給你一次機(jī)會,你會怎么改進(jìn)4.優(yōu)缺點5.對自己的評價6.別人對自己的評價7.為什么選擇汽車行...
一、Hive數(shù)據(jù)類型 1.基本數(shù)據(jù)類型 整數(shù)類型:tinyint/smallint/int/bigint 浮點數(shù)類型: float/double 布爾類型: boolean ...
學(xué)習(xí)目標(biāo) Hive是構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫,它的本質(zhì)是就是一個數(shù)據(jù)庫 ① Hive和一般意義上的數(shù)據(jù)庫有什么區(qū)別② 如何搭建數(shù)據(jù)庫③ 創(chuàng)建的過程是什么④ 如何把數(shù)據(jù)...
阿里數(shù)據(jù)分析師面試 一面 幫助了解簡歷,基本是自己在說,學(xué)校,專業(yè),實習(xí)經(jīng)歷,收獲及感悟。最后可以問兩個問題:1.阿里數(shù)據(jù)分析師的主要職責(zé)及所需的工作技能?2.入職后有沒有相...
1.which.min(x) 返回x中最小值的下標(biāo) which.max(x)2.sort(x, na.last=TRUE, decreasing=FALSE)3.seq(f...
邏輯是服飾內(nèi)衣首單購買在2015年1月1日到2015年6月30日的用戶,首單后至今無類目復(fù)購,且全京東訂單大于5單,最后購買的時間在2016年1月1日到2016年4月30日。...
ARCH模型(Autoregressive conditional heteroskedasticity model) 按照英文直譯是 自回歸條件異方差模型。粗略地說,該模型...
基本概念 用戶畫像 人口屬性: 性別,年齡,婚否,教育程度, 行為屬性: 瀏覽行為,購物行為,購物車行為 靜態(tài)數(shù)據(jù)動態(tài)數(shù)據(jù) 用戶畫像的用途 統(tǒng)計分析精準(zhǔn)營銷數(shù)據(jù)挖掘,關(guān)聯(lián)...
一、Hadoop兩大核心組成 1.HDFS 分布式文件系統(tǒng):存儲2.MapReduce: 并行計算 二、HDFS基本概念 block 塊:固定大小為64M的邏輯單元,HDFS...
Kmeans聚類 K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對象組成的...
一. 首頁 1.認(rèn)知用戶:近90天有店鋪訪問,收藏,加入購物車,并近180天沒有購買的用戶群體2.現(xiàn)有用戶:近90天有購買行為的用戶3.沉默用戶:近180天有購買行為,但近9...
一般來說爬蟲類框架抓取Ajax動態(tài)頁面都是通過一些第三方的webkit庫去手動執(zhí)行html頁面中的js代碼, 最后將生產(chǎn)的html代碼交給spider分析。本篇文章則是通過瀏...
一、描述性統(tǒng)計分析 基本描述性統(tǒng)計 summary( ) 比fivenum 多一個均值 fivenum( ) 最大最小值外加三個分位數(shù) Hmisc::describe( ...
「簡書」作為一款「寫作軟件」在誕生之初就支持了 Markdown,Markdown 是一種「電子郵件」風(fēng)格的「標(biāo)記語言」,我們強(qiáng)烈推薦所有寫作者學(xué)習(xí)和掌握該語言。為什么?可以...