val trainedTrees = trees.map(s=>growTree(getRandomSubsample(data, subSampleSize/numSamples.toDouble, seed), maxHeight, numColumns))
確實沒實現(xiàn)并行,因為driver去解析生成這個dag的時候,會迭代去執(zhí)行它,而不是將trees的操作全部觸發(fā),雖然trees里面每個元素是獨立存在的。
運行類似于: array.foreach{
action operator
}
程序只會在遇到action算子的時候去觸發(fā)dag,trees里面的操作會一個一個執(zhí)行...
異常點檢測算法isolation forest的分布式實現(xiàn)無監(jiān)督領域有一個準度和效率雙佳的異常點檢測算法,我在實踐中使用過幾次,效果奇好,就是最近幾年非常流行的isolation forest(孤立森林)。該算法在sklearn中有...