團(tuán)隊(duì)內(nèi)部要分享HBase的知識(shí),之前研究了一段時(shí)間,知識(shí)比較零散,這一次就系統(tǒng)化的整理一番,之后在想到Hbase的時(shí)候,看著一篇就夠了。 阿里陶系技術(shù)部招人,目前大把機(jī)會(huì),H...
團(tuán)隊(duì)內(nèi)部要分享HBase的知識(shí),之前研究了一段時(shí)間,知識(shí)比較零散,這一次就系統(tǒng)化的整理一番,之后在想到Hbase的時(shí)候,看著一篇就夠了。 阿里陶系技術(shù)部招人,目前大把機(jī)會(huì),H...
鏈接1[https://learnku.com/docs/python-guide/2018]鏈接2[https://pythonguidecn.readthedocs.io...
假設(shè)有字典列表: 要求price的最大值與最小值 最原始的方法: 剛學(xué)Python時(shí)會(huì)這么寫(xiě)... 先使用列表推導(dǎo)式(list comprehension), 再使用內(nèi)置函數(shù)...
當(dāng)當(dāng)閱讀器:http://e.dangdang.com/pc/reader/index.html?id=1901212551[http://e.dangdang.com/pc...
第 1 章 引言 第 2 章 分布式架構(gòu)理論及典型實(shí)踐 第 3 章 當(dāng)前主流的 IT 架構(gòu)分析 第 4 章 新一代銀行 IT 架構(gòu)分析 第 5 章 新一代銀行 IT 架構(gòu)實(shí)踐...
第4章 Matplotlib數(shù)據(jù)可視化 Matplotlib 是建立在 NumPy 數(shù)組基礎(chǔ)上的多平臺(tái)數(shù)據(jù)可視化程序庫(kù),最初被設(shè)計(jì)用于完善 SciPy 的生態(tài)環(huán)境。John ...
小紅書(shū)如何實(shí)現(xiàn)高效推薦[https://www.sohu.com/a/331433673_308467] flink入門(mén)-流式計(jì)算概念[https://zhuanlan.zh...
第一部分:機(jī)器學(xué)習(xí)基礎(chǔ) (解決簡(jiǎn)單問(wèn)題)一、機(jī)器學(xué)習(xí)概覽二、一個(gè)完整的機(jī)器學(xué)習(xí)項(xiàng)目三、分類(lèi)四、訓(xùn)練模型五、支持向量機(jī)六、決策樹(shù)七、集成學(xué)習(xí)和隨機(jī)森林八、降維 第二部分:神經(jīng)網(wǎng)...
第12章 元數(shù)據(jù)第13章 計(jì)算管理第14章 存儲(chǔ)和成本管理第15章 數(shù)據(jù)質(zhì)量第16章 數(shù)據(jù)應(yīng)用 第12章 元數(shù)據(jù) 12.1 元數(shù)據(jù)概述 12.1.1 元數(shù)據(jù)定義 按照傳統(tǒng)的定...
第8章 大數(shù)據(jù)領(lǐng)域建模綜述第9章 數(shù)據(jù)整合及管理體系第10章 維度設(shè)計(jì)(重點(diǎn)?。┑?1章 事實(shí)表設(shè)計(jì) 第8章 大數(shù)據(jù)領(lǐng)域建模綜述 8.1 為什么需要數(shù)據(jù)建模 隨著DT時(shí)代互聯(lián)...
第1章 總述第2章 日志采集第3章 數(shù)據(jù)同步第4章 離線(xiàn)數(shù)據(jù)開(kāi)發(fā)第5章 實(shí)時(shí)技術(shù)第6章 數(shù)據(jù)服務(wù)第7章 數(shù)據(jù)挖掘 第1章 總述 2014年,馬云提出,“人類(lèi)正從IT時(shí)代走向D...
百度百科[https://baike.baidu.com/item/%E7%BB%B4%E5%BA%A6%E5%BB%BA%E6%A8%A1/3676887?fr=aladd...
Hive調(diào)優(yōu)集錦[https://blog.csdn.net/zhanglong_4444/article/details/117264381]Hive/HiveSQL常用優(yōu)...
第5章 數(shù)據(jù)讀取與保存 本章對(duì)于工程師和數(shù)據(jù)科學(xué)家都較為實(shí)用。工程師會(huì)了解到更多的輸出格式,有利于找到非常適合用于下游處理程序的格式。數(shù)據(jù)科學(xué)家則可能更關(guān)心數(shù)據(jù)的現(xiàn)有的組織形...
推薦序譯者序序前言第1章 Spark數(shù)據(jù)分析導(dǎo)論第2章 Spark下載與入門(mén)第3章 RDD基礎(chǔ)第4章 鍵值對(duì)操作第5章 數(shù)據(jù)讀取與存儲(chǔ)第6章 Spark編程進(jìn)階第7章 在集群...
什么是機(jī)器學(xué)習(xí) 機(jī)器學(xué)習(xí)在許多方面都可以看作是數(shù)據(jù)科學(xué)能力延伸的主要手段。機(jī)器學(xué)習(xí)是用數(shù)據(jù)科學(xué)的計(jì)算能力和算法能力去彌補(bǔ)統(tǒng)計(jì)方法的不足,其最終結(jié)果是為那些目前既沒(méi)有高效的理論...
Python 數(shù)據(jù)類(lèi)型 Python 的用戶(hù)往往被其易用性所吸引,其中一個(gè)易用之處就在于動(dòng)態(tài)輸入。靜態(tài)類(lèi)型的語(yǔ)言(如 C 或 Java)往往需要明確地聲明每一個(gè)變量的數(shù)據(jù)類(lèi)型...
NumPy 和它的 ndarray 對(duì)象,為 Python 多維數(shù)組提供了高效的存儲(chǔ)和處理方法。Pandas 是在 NumPy 基礎(chǔ)上建立的新程序庫(kù),提供了一種高效的 Dat...