本文共計2680字,預計閱讀時長七分鐘 聚類算法 一、本質(zhì) 將數(shù)據(jù)劃分到不同的類里,使相似的數(shù)據(jù)在同一類里,不相似的數(shù)據(jù)在不同類里 二、分類算法...
本文共計2458字,預計閱讀時長六分鐘 HBase總結(jié) 一、本質(zhì) HBase是一個開源的非關(guān)系型分布式數(shù)據(jù)庫(NoSQL),運行于HDFS文件系...
本文共計2960字,預計閱讀時長十分鐘 推薦算法(一)--CB算法 一、推薦的本質(zhì) 推薦分為非個性化和個性化,非個性化推薦比如各類榜單,而本系列...
一句話表述 企業(yè)在市場中與用戶、供應商、其他合作伙伴的關(guān)系,主要體現(xiàn)在 資金流 物流 信息流 三種類別 主體(具體產(chǎn)品或服務) 連接(連接用戶與...
一、MaxCompute是什么? MaxCompute(原ODPS,Open Data Processing Service)是一項大數(shù)據(jù)計算服...
本文共計2584字,預計閱讀時長二十分鐘 神經(jīng)網(wǎng)絡與深度學習 前言 1.神經(jīng)元的構(gòu)成: 2.樹突:神經(jīng)元接收信號的部位,多個 3.軸突:神經(jīng)元輸...
本文共計1234字,預計閱讀時長八分鐘 回歸算法 一、回歸的本質(zhì) 發(fā)現(xiàn)y和x的規(guī)律,以預測新情況下的y值 二、回歸算法的分類 1. 線性回歸(L...
分類算法之決策樹 一、原理 決策樹是一種非參數(shù)的監(jiān)督學習方法,它主要用于分類和回歸。決策樹的目的是構(gòu)造一種模型,使之能夠從樣本數(shù)據(jù)的特征屬性中,...
在數(shù)據(jù)開發(fā)的工作中,經(jīng)常會遇到各種各樣的問題,但往往又不是特別復雜的業(yè)務流程,如果用java處理起來總感覺顯得有些笨重,這個時候我會更青睞p...