spark
1、RDD <--> DataFrame 2、RDD <-> DataSet 3、DataFrame <-> DataSet
決策樹算法 ??數(shù)據(jù)集是某學(xué)校男性女性的身高體重信息。數(shù)據(jù)說明: height 身高 、weight 體重 、category 0男1女 、ra...
DriverProgram 就是程序員所設(shè)計(jì)的 Spark 程序,在 Spark 程序中必須定義 SparkContext,它是開發(fā) Spark...
Apache Maven is a software project management and comprehension tool. Ba...
知識點(diǎn) 線性回歸 最小二乘法 隨機(jī)梯度下降 邏輯回歸 正則化 保序回歸 spark官方提供的回歸、分類算法:Linear models (SVM...
用途:數(shù)據(jù)挖掘、日志分析、商務(wù)智能、搜索引擎..... 官網(wǎng)介紹:The Apache? Hadoop? project develops op...
使用的數(shù)據(jù)集是tpch工具生成的數(shù)據(jù)集,存放在hive中,關(guān)于相關(guān)的細(xì)節(jié),請看http://www.itdecent.cn/p/154069c...
我的hadoop版本:hadoop-2.6.0-cdh5.7.0我的scala版本:2.11.8我的hive版本:hive-1.1.0-cdh5...