美林TempoAI? VS? 第四范式先知AutoML
人工智能是當今關(guān)注度極高的一門新興技術(shù),人工智能已連續(xù)兩年(2017/
2018)列入我國政府工作報告,成為國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃的重點之一。Gartner預測,到2020年,超過40%的數(shù)據(jù)科學任務(wù)將實現(xiàn)自動化,人人都是數(shù)據(jù)科學家。業(yè)務(wù)人員和決策者可以運用人工智能工具自動化、智能化地實現(xiàn)數(shù)據(jù)價值發(fā)現(xiàn),提高企業(yè)的生產(chǎn)力和競爭力。
人工智能分析工具的自動化、智能化將是未來十年的大趨勢。市場上的AI分析工具種類繁多,各有所長。最為大家所熟識的就是:SAS,RapidMiner,Alteryx,IBM,Anaconda,DataRobot等。但這都是國外的,我們來看看中國市場,商用AI分析工具有:第四范式,星環(huán),阿里等,但近幾年明顯感受到身邊有越來越多的同行在用美林數(shù)據(jù)的AI分析工具,TempoAI就像一匹黑馬,在眾多AI分析工具中殺出來。
國內(nèi)的AI分析工具在自動化、智能化上做的比較好的,就是第四范式和美林數(shù)據(jù)這兩家廠商。所以,本文就兩款工具人工智能分析工具美林數(shù)據(jù)TempoAI(下文簡稱TempoAI)和第四范式先知AutoML(下文簡稱AutoML)做詳細對比,讓大家更多了解這個低調(diào)的工具。如果你正在尋找一款合適的人工智能分析工具,希望我的文章能給您的選型帶來幫助。
一、產(chǎn)品介紹
Tempo是一款集數(shù)據(jù)接入、數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)可視化、數(shù)據(jù)應用于一體的軟件產(chǎn)品。它秉持“智能、互動、增值”的設(shè)計理念,面向企業(yè)級用戶提供自助式數(shù)據(jù)探索與深度分析能力,幫助用戶快速發(fā)現(xiàn)數(shù)據(jù)價值,助力企業(yè)商業(yè)成功!Tempo包括BI、AI兩大產(chǎn)品線,BI與AI可拆分可聯(lián)合。TempoAI分為建模、洞察、部署三大模塊。

AutoML是一個大規(guī)模分布式人工智能應用開發(fā)的全流程平臺?;诟采w機器學習全流程閉環(huán)系統(tǒng),從原始數(shù)據(jù)到模型訓練,從模型訓練到模型應用,再到模型自學習。AutoML是單獨的AI分析工具。分為學習圈、監(jiān)控面板、計劃任務(wù)三個模塊。

二、 技術(shù)架構(gòu)
TempoAI與Hadoop大數(shù)據(jù)體系無縫鏈接,與包括但不限于CDH、HDP、華為FI、中興DAP、H3C
DataEngine、星環(huán)等,通過簡單配置即可支持Kerberos認證,安全連接大數(shù)據(jù)平臺。
AutoML兼容主流的Hadoop商業(yè)發(fā)行版,實現(xiàn)大數(shù)據(jù)框架下的分布式存儲、資源管理、分布式計算。支持公有云、私有云、私有部署等多種安裝部署方式。
三、企業(yè)級應用能力
TempoAI和AutoML這兩款分析工具的定位都是面向企業(yè)級應用?;谄髽I(yè)級應用的訴求,兩家都各有自己的策咯。
TempoAI在數(shù)據(jù)權(quán)限、角色權(quán)限、成果權(quán)限、協(xié)同開發(fā)、模型復用、系統(tǒng)集成等方面做了大量的針對性設(shè)計,更符合企業(yè)級用戶對分析工具從安全、協(xié)同、共享、融合等方面的需要。
AutoML提供用戶權(quán)限、用量額度管理、模型版本管理與運維等企業(yè)級功能,滿足IT管理與數(shù)據(jù)安全的需求。
四、數(shù)據(jù)源接入能力
TempoAI支持本地上傳文件、HDFS、mpala,Sparksql,Hive,Presto等大數(shù)據(jù)引擎、GP,GBase等MPP 數(shù)據(jù)庫、Csv,Excel,Json三種非結(jié)構(gòu)數(shù)據(jù)、接口數(shù)據(jù)、Oracle,SQL Server,MySQL,Teradata關(guān)系數(shù)據(jù)庫、Kafka流式數(shù)據(jù)、ES等20余種類型數(shù)據(jù)源接入。


AutoML支持本地文件上傳、HDFS、FTP,Teradata、Oracle、MySQL等關(guān)系數(shù)據(jù)庫,Hive,GP。其中支持上傳的數(shù)據(jù)源包括CSV、TXT、TSV、parquet、orc5種。共支持13種數(shù)據(jù)源接入。
目前來看TempoAI的數(shù)據(jù)源接入能力是優(yōu)于AutoML的。

五、算法豐富度
在算法豐富度上,TempoAI明顯優(yōu)于AutoML。本人使用了這兩種工具進行挖掘模型訓練,例如我訓練一個分類模型,Tempo可供選擇的單算法有18種此外還有集成算法和自動化算法可供選擇。

但是用AutoML的通用方案探索,只能選擇三種算法。

TempoAI支持數(shù)據(jù)預處理、特征工程、統(tǒng)計分析、分類、回歸、聚類、關(guān)聯(lián)規(guī)則、推薦、時間序列、綜合評價、文本分析、深度學習、集成學習等13種分析類型,共計120多種算法;其中分類算法共18種、回歸算法共12種、聚類算法共8種、時間序列算法共7種。
AutoML支持數(shù)據(jù)處理、特征工程、分類、聚類、自定義腳本等6種分析類型,共計18種算法;如常見的分類算法共10種、聚類算法共1種、特征工程算法3共種。
六、可擴展性
TempoAI支持SQL、R、Python、JAVA、Scala的擴展編程節(jié)點;支持企業(yè)將自研算法集成到平臺進行節(jié)點化管理和應用;支持單機和集群部署;支持Windows和Linux平臺;支持主流Hadoop大數(shù)據(jù)平臺部署。
AutoML不支持用戶自己編程補充自動建模,建模過程完全交給后臺,用戶的自主擴展控制性比較差;支持Hadoop大數(shù)據(jù)平臺部署。
七、自動化智能化水平
從兩家廠商的宣傳來看,貌似AutoML的自動化水平更高一些,只需4步:上傳行為數(shù)據(jù)、上傳反饋數(shù)據(jù)、模型訓練、模型利用,就可以完成AI模型從構(gòu)建到應用的全過程。且模型訓練的過程幾乎不用人為干預。但是通過實際使用發(fā)現(xiàn),沒有人為干預很難訓練出有效的模型,到最后還是需要人工去調(diào)整一些特征提取規(guī)則、算法和參數(shù)。很多同行反饋,還是TempoAI這種自動化建模的方式更符合企業(yè)級AI分析的需求。
如下圖,AutoML運行了7小時57分鐘,最終還是失敗了,而在TempoAI中,這種情況運行十幾秒就會提示有問題,通過及時調(diào)整,3分鐘就能成功構(gòu)建一個效果還不錯的模型出來。

八、模型部署應用
TempoAI全面支撐模型的部署與應用,應用模式包括:調(diào)度、異步服務(wù)、同步服務(wù)(支持本地服務(wù))、流服務(wù)四種,滿足工程化的不同訴求。并且模型結(jié)果與TempoBI的無縫融合,實現(xiàn)挖掘結(jié)果的快速可視化與內(nèi)部共享。
AutoML的模型應用包括兩種:在線模型預估和批量模型預估。其中在線模型預估對應于TempoAI的同步服務(wù),批量模型預估對應與TempoAI的異步服務(wù)。
TempoAI在模型部署應用的靈活性這方面強于AutoML。
九、統(tǒng)一監(jiān)控功能
AutoML提供監(jiān)控面板功能,能夠?qū)ζ脚_業(yè)務(wù)指標模型指標及監(jiān)控指標進行統(tǒng)一監(jiān)控及管理。

TempAI目前的調(diào)度及服務(wù)管理在監(jiān)控功能相對比較薄弱,只實現(xiàn)了部分監(jiān)控管理功能。

十、自研專利算法
AutoML提供了自主研發(fā)的算法供用戶使用,如HE-TreeNet、線性分型分類器等,這些算法彌補了LR以及GBDT的局限性,使模型能更達到更好的預測效果。
TempoAI提供了自主研發(fā)的視覺聚類、L1/2稀疏迭代分類、L1/2稀疏迭代回歸算法、信息抽取、稀疏時間序列等算法,實現(xiàn)大數(shù)據(jù)高級分析,準確性和響應速度等性能明顯優(yōu)于同類經(jīng)典算法,能更快速、更直觀的洞悉數(shù)據(jù)特征,發(fā)現(xiàn)企業(yè)業(yè)務(wù)和流程中潛在、隱藏的規(guī)律和價值。
十一、定制開發(fā)
TempoAI能夠根據(jù)用戶需求進行定制化開發(fā),打造更符合行業(yè)/企業(yè)用戶特色的大數(shù)據(jù)分析產(chǎn)品。
AutoML傾向于做通用產(chǎn)品,定制開發(fā)需要看客戶的等級。
十二、學習資料
兩個工具都有比較豐富的基礎(chǔ)的學習文檔和教學視頻資料,畢竟都是中國的廠商,所以在資料這方面還是很方便的。此外,美林TempoAI還有免費為其用戶開放微課堂視頻課程,介紹一些算法和分析方案,還是很不錯的!
另外,這兩個工具都是可以免費申請試用的,但AutoML只能免費試用14天且試用功能很有限。TempoAI試用期有30天,且試用過程種有任何問題都會有專人負責解答,服務(wù)體驗還是很好的。
最后,適合自己企業(yè)需求的工具才是最好的工具。大家不妨嘗試試用一下!一定會有收獲的哦!試用鏈接