色呦呦国产,亚洲91av

MMLSpark ，即?Microsoft Machine Learning for Apache Spark ，是微軟開源的一個(gè)針對(duì) Apache Spark 的深度學(xué)習(xí)和數(shù)據(jù)可視化的庫(kù)。作為專門為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用計(jì)算引擎，Apache Spark 為用戶提供了創(chuàng)建可擴(kuò)展 ML 的有力平臺(tái)。新發(fā)布的 MMLSpark 能夠?qū)⒅T如深度學(xué)習(xí)等前沿機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于更大的數(shù)據(jù)集，并為用戶提供能夠應(yīng)對(duì)諸如文本、分類數(shù)據(jù)等多種類型數(shù)據(jù)的 API , 大大提高數(shù)據(jù)分析師使用 Apache Spark 的工作效率及實(shí)驗(yàn)速度。

lightGBM官網(wǎng)上提示用它可以在Spark上運(yùn)行l(wèi)ightGBM模型。下面記錄一個(gè)我的實(shí)踐過程。

首要條件（環(huán)境）：scala2.11+spark2.4.0+python3.7。我是pyspark在jupyter上進(jìn)行實(shí)驗(yàn)的。

1.配置好python的pyspark，注意直接安裝可能會(huì)和spark2.4.0里面的pyspark版本不一致，建議直接將spark里的：

拷貝進(jìn)pip的site-package里。同時(shí)還需要安裝py4j。

2.啟動(dòng)pyspark，嘗試過官網(wǎng)的安裝mml的方法，沒有一個(gè)安裝成功的，各種問題報(bào)錯(cuò)。于是我嘗試用pip install mmlspark，發(fā)現(xiàn)會(huì)安裝到一個(gè)舊版本的mml，啟動(dòng)pyspark，import mmlspark很多方法都用不了。但是可以在這個(gè)地方下載到j(luò)ar包：然后執(zhí)行下面的操作，解壓jar包把里面的mmlspark文件夾替換至pip site-package里面的mmlspark。替換后即可正常工作。

mmlspark:https://repo1.maven.org/maven2/com/microsoft/ml/spark/mmlspark_2.11/

lightgbmlib:https://repo1.maven.org/maven2/com/microsoft/ml/lightgbm/lightgbmlib/

3.根據(jù)官方的實(shí)例代碼進(jìn)行測(cè)試。示例、數(shù)據(jù)集可以去kaggle找，因?yàn)殒溄涌赡苓B不上去。

能成功運(yùn)行就代表可以在spark上跑LightGBM了。

但是注意，應(yīng)該是要用spark dataframe。通過在pyspark里編寫代碼運(yùn)行即可。也可以使用spark-submit來提交py文件到分布式集群里進(jìn)行運(yùn)行。

如果是在集群上，同樣的方法即可。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

MMLSpark+Spark：pyspark+lightGBM應(yīng)用實(shí)踐

MMLSpark+Spark：pyspark+lightGBM應(yīng)用實(shí)踐

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

MMLSpark+Spark：pyspark+lightGBM應(yīng)用實(shí)踐

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av