偏統(tǒng)計理論知識 1. 撲克牌54張,平均分成2份,求這2份都有2張A的概率。 M表示兩個牌堆各有2個A的情況:M=4(25!25!)N表示兩個牌堆完全隨機的情況:N=27!2...
偏統(tǒng)計理論知識 1. 撲克牌54張,平均分成2份,求這2份都有2張A的概率。 M表示兩個牌堆各有2個A的情況:M=4(25!25!)N表示兩個牌堆完全隨機的情況:N=27!2...
數(shù)據(jù)分析框架 海盜指標(biāo) AARRR 獲取用戶(Acquisition) 提高活躍度(Activation) 提高留存率(Retention) 獲取營收(Revenue) 自傳...
1.查詢多列數(shù)據(jù)的最大值 CASE WHEN 方式 轉(zhuǎn)換行格式后使用MAX函數(shù) 使用GREATEST函數(shù) 2.排序 跳過位次排序 連續(xù)排序 分組排序
注:MySQL8 中支持窗口函數(shù)(window functions) 在WHERE子句中引用別名列:將含有別名的列放入內(nèi)嵌視圖 在SELECT語句里使用條件邏輯:CASE表達(dá)...
操作環(huán)境(ubuntu16.04) 啟動服務(wù) ./zkServer.sh start 客戶端連接 ./zkCli.sh -server 127.0.0.1:2181 創(chuàng)建節(jié)點...
優(yōu)化數(shù)據(jù)訪問 是否向數(shù)據(jù)庫請求了不需要的數(shù)據(jù) MySQL是否在掃描額外的記錄 MySQL使用三種方式應(yīng)用WHERE條件 索引中使用WHERE 在存儲引擎層完成 使用索引覆蓋掃...
索引 存儲引擎用于快速找到記錄的一種數(shù)據(jù)結(jié)構(gòu)(索引的基本功能)在MySQL中,存儲引擎先在索引中找對對應(yīng)值,根據(jù)匹配的索引記錄找到對應(yīng)的數(shù)據(jù)行。 索引類型 B-Tree索引1...
創(chuàng)建數(shù)據(jù)庫 use DATABASE_NAME 查看所有數(shù)據(jù)庫 show dbs 插入數(shù)據(jù) db.DATABASE_NAME.insert({"name":"value"})...
HBase數(shù)據(jù)模型 表 行(由行鍵標(biāo)識) 列族 列限定符 單元格 時間戳 HBase功能組件 庫函數(shù):鏈接到每個客戶端 Master主服務(wù)器:負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)...
HDFS最核心的概念 “塊” 默認(rèn)64MB 支持面向大規(guī)模數(shù)據(jù)存儲 降低分布式節(jié)點的尋址開銷 HDFS兩大組件 名稱節(jié)點 (管家)FsImage(維護(hù)文件系統(tǒng)樹及元數(shù)據(jù))...
Hadoop Hadoop 是一個開源的,可運行于大規(guī)模集群上的分布式計算平臺 Hadoop 兩大核心 HDFS MapReduce Hadoop 項目結(jié)構(gòu)
大數(shù)據(jù)的概念 4V 數(shù)據(jù)量大(Volumn) 數(shù)據(jù)類型繁多(Variety) 結(jié)構(gòu)化數(shù)據(jù)(10%) 非結(jié)構(gòu)化數(shù)據(jù)(90%) 處理速度快(Velocity) 價值密度低(Val...
shell shell是一個程序,接受從鍵盤輸入的命令,然后把命令傳遞給操作系統(tǒng)去執(zhí)行。 一些命令 ls 列出目錄內(nèi)容 ls -l 長格式輸出 file 確定文件類...