Lightgbm支持兩種形式的調(diào)用接口:原生形式和sklearn接口的形式。 原生形式 sklearn接口的形式 導(dǎo)入包 2.加載boston房價數(shù)據(jù) 3.切分?jǐn)?shù)據(jù)集 4.創(chuàng)...
1 分組聚合的原因 SQL中分組函數(shù)和聚合函數(shù)之前的文章已經(jīng)介紹過,單說這兩個函數(shù)有可能比較好理解,分組函數(shù)就是group by,聚合函數(shù)就是COUNT、MAX、MIN、AV...
HIVE是一個數(shù)據(jù)倉庫,該倉庫基于hadoop框架,可以將存在hdfs上的結(jié)構(gòu)化數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表。HIVE可以使用類SQL語句來處理結(jié)構(gòu)化數(shù)據(jù)(查詢數(shù)據(jù)),也即是把...
窗口函數(shù) 窗口函數(shù)也稱為OLAP(Online Analytical Processing)函數(shù),意思是對數(shù)據(jù)庫數(shù)據(jù)進行實時分析處理,窗口函數(shù)在Oracle和SQL Serv...
1 準(zhǔn)備知識 HDFS:hadoop集群分布式文件系統(tǒng),用來存儲海量數(shù)據(jù)。HDFS采用分而治之的設(shè)計思想,將文件切分為文件塊進行存儲,存儲數(shù)據(jù)的節(jié)點為datanode,存儲這...
1 阿里云服務(wù)器選配 首先附上官網(wǎng)鏈接:阿里云官網(wǎng)[https://www.aliyun.com/] 點擊上邊鏈接,注冊后登陸官網(wǎng),選擇產(chǎn)品選項,然后選擇云服務(wù)器ECS,就進...
1 前言 在講述Hadoop集群搭建之前,首先要了解Hadoop和集群兩個名詞,Hadoop是由Apache基金會開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),簡單理解就是大數(shù)據(jù)技術(shù)應(yīng)用的基礎(chǔ)。...
1 前言 SQL進階主要介紹謂詞、CASE表達(dá)式、嵌套子查詢、連接(以列為單位對表進行連接)和UNION運算(表為單位)。 SQL進階在如下兩個表web_city和city_...
1 前言 SQL函數(shù)主要介紹內(nèi)建函數(shù),其實跟Excel中的內(nèi)建函數(shù)類似,后續(xù)Python中也是類似。有時候?qū)W習(xí)語言,真的沒有那么難,都是相通的,難點在于如何去應(yīng)用。這個沒有捷...
1 前言 數(shù)據(jù)庫(DB)是按照數(shù)據(jù)結(jié)構(gòu)存儲數(shù)據(jù)的倉庫,數(shù)據(jù)庫管理系統(tǒng)(DBMS)是操縱和管理數(shù)據(jù)庫的一套軟件,可分為關(guān)系型的數(shù)據(jù)庫管理系統(tǒng)和非關(guān)系型的數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫管...
1 前言 Excel中圖表大約有十多種,每種圖表類型按照顯示形式又可分為若干個子類型。如柱狀圖可以分為標(biāo)準(zhǔn)柱狀圖、堆積柱狀圖、和百分比堆積柱狀圖。Excel圖表也是數(shù)據(jù)可視化...
1 引言 Excel是數(shù)據(jù)分析師的基礎(chǔ)入門工具,在日常工作過程中,用好Excel函數(shù)可以節(jié)省很多時間,起到事半功倍的效果。 介紹函數(shù)之前,需要強調(diào)幾個概念: 相對引用、絕對引...
Excel是數(shù)據(jù)分析人員的基礎(chǔ)工具,Excel的功能也是非常強大,比如說制作報表、小工具開發(fā)、游戲制作,數(shù)據(jù)計算等等。所以說學(xué)好Excel,對自己的工作也是非常有幫助的。 認(rèn)...