色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

登錄注冊寫文章

PySpark介紹

PySpark介紹

當要分析的資料大到一臺電腦沒辦法處理（可能是檔案過大沒辦法載入單臺電腦的記憶體、或是單臺運算時間太長）的時候，通常有兩種解決方法。1.購買一臺昂貴的超級電腦(96核CPU, 1TB Memory…) 2.購買多臺較便宜的一般電腦來分工處理原本的工作。

第一種的解法，對于開發(fā)人員來說的好處是程式碼完全不用改直接丟上去跑。但對于企業(yè)來說為了少數工作花好幾百萬的經費購買超級電腦非常的不劃算，而且假設剛好你的資料量又超過1TB這時候原本的超級電腦就不能使用了，要再買更高級的超級電腦，也就是擴充性不佳
利用多臺電腦打造一個運算群集(背后可能是1000臺16核心48GB的電腦這樣的等級)，此時你要多少運算資源都可以動態(tài)的調整，比方說某一個工作要100核心以及2TB的Memory， Spark都可以很快的配置資源，并且這個運算叢集是可以給全公司的人來使用，平均分攤下來的成本較低。而且這樣的群集的已很容易地增加以及減少里面的電腦數量。

Spark官方網站提到Spark的好處有

速度快

Spark比起Hadoop在運算上快了許多，主要是把資料暫存在記憶體以及把資料處理的部份優(yōu)化(ex:減少shuffle)

容易使用

Spark提供Scala,Python,R,Java的API介面，讓開發(fā)者可以利用自己擅長的開發(fā)語言來開發(fā)。主流上是使用Scala, Python這兩種

廣泛應用

可以在Spark上面使用SQL、即時串流(Streaming)、Spark的機器學習套件(MLlib)、圖論(計算圖形中任兩點的最短路徑)的套件

下圖為Spark python語言API工具PySpark簡要學習指南：

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成，瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發(fā)布，文章內容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內容

Apache Spark 2.2.0 中文文檔 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
草里有只羊閱讀 18,544評論 0贊 85
Apache Spark 2.2.0 中文文檔 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
Joyyx閱讀 8,479評論 0贊 16

Apache Spark 2.2.0 中文文檔 - Spark Streaming 編程指南 ...
Spark Streaming 編程指南概述一個入門示例基礎概念依賴初始化 StreamingConte...
草里有只羊閱讀 4,329評論 0贊 11
知癡不失
zhi—chi—shi—，呀呀學語謂之懵懂。我很感謝我的語文啟蒙老師施老師，現(xiàn)在的她已七十有余，在別人都用柳市話...
沉淀的回味閱讀 754評論 1贊 3
2017-11-13
別把興趣變成職業(yè)。只是興趣的時候，不需要任何人點頭。你愛怎么唱歌、煮菜、愛怎么設計你家、或投資股票，都是你自己的事...
吃肉肉不長肉閱讀 282評論 0贊 0

友情鏈接更多精彩內容

贊1贊

贊賞

手機看全文

贵阳市| 遂溪县| 抚松县| 浮梁县| 墨脱县| 花莲县| 方山县| 萨嘎县| 奉贤区| 玉树县| 名山县| 和林格尔县| 上思县| 左权县| 错那县| 唐河县| 永泰县| 长岭县| 辽源市| 项城市| 临西县| 武川县| 河曲县| 深圳市| 锡林浩特市| 甘谷县| 奇台县| 沈阳市| 伊宁市| 襄汾县| 武穴市| 资阳市| 洛浦县| 伊吾县| 印江| 定州市| 曲周县| 凤翔县| 赤壁市| 平凉市| 山丹县|

<strike id="k8kwc"><td id="k8kwc"></td></strike><bdo id="k8kwc"><dd id="k8kwc"></dd></bdo>