【嵌牛導(dǎo)讀】:由于最近在看語(yǔ)音識(shí)別的相關(guān)內(nèi)容,看到幾個(gè)很不錯(cuò)的人工智能深度學(xué)習(xí)的開(kāi)源庫(kù),分享給大家,我相信只有選擇好合適的工具,才能在開(kāi)發(fā)的過(guò)程中事半功倍。
【嵌牛鼻子】:人工智能,開(kāi)源框架,深度學(xué)習(xí)
一.TensorFlow
TensorFlow是一款開(kāi)源的數(shù)學(xué)計(jì)算軟件,使用數(shù)據(jù)流圖(Data Flow Graph)的形式進(jìn)行計(jì)算。圖中的節(jié)點(diǎn)代表數(shù)學(xué)運(yùn)算,而圖中的線條表示多維數(shù)據(jù)數(shù)組(tensor)之間的交互。TensorFlow靈活的架構(gòu)可以部署在一個(gè)或多個(gè)CPU、GPU的臺(tái)式以及服務(wù)器中,或者使用單一的API應(yīng)用在移動(dòng)設(shè)備中。TensorFlow最初是由研究人員和Google Brain團(tuán)隊(duì)針對(duì)機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)進(jìn)行研究所開(kāi)發(fā)的,目前開(kāi)源之后可以在幾乎各種領(lǐng)域適用。
TensorFlow的特點(diǎn):
機(jī)動(dòng)性: TensorFlow并不只是一個(gè)規(guī)則的neural network庫(kù),事實(shí)上如果你可以將你的計(jì)算表示成data flow graph的形式,就可以使用TensorFlow。用戶構(gòu)建graph,寫內(nèi)層循環(huán)代碼驅(qū)動(dòng)計(jì)算,TensorFlow可以幫助裝配子圖。定義新的操作只需要寫一個(gè)Python函數(shù),如果缺少底層的數(shù)據(jù)操作,需要寫一些C++代碼定義操作。
可適性強(qiáng): 可以應(yīng)用在不同設(shè)備上,cpus,gpu,移動(dòng)設(shè)備,云平臺(tái)等
自動(dòng)差分: TensorFlow的自動(dòng)差分能力對(duì)很多基于Graph的機(jī)器學(xué)習(xí)算法有益
多種編程語(yǔ)言可選: TensorFlow很容易使用,有python接口和C++接口。其他語(yǔ)言可以使用SWIG工具使用接口。(SWIG—Simplified Wrapper and Interface Generator, 是一個(gè)非常優(yōu)秀的開(kāi)源工具,支持將 C/C++ 代碼與任何主流腳本語(yǔ)言相集成。)
最優(yōu)化表現(xiàn): ?充分利用硬件資源,TensorFlow可以將graph的不同計(jì)算單元分配到不同設(shè)備執(zhí)行,使用TensorFlow處理副本。
二.Torch
Torch是一個(gè)有大量機(jī)器學(xué)習(xí)算法支持的科學(xué)計(jì)算框架,其誕生已經(jīng)有十年之久,但是真正起勢(shì)得益于Facebook開(kāi)源了大量Torch的深度學(xué)習(xí)模塊和擴(kuò)展。Torch另外一個(gè)特殊之處是采用了編程語(yǔ)言Lua(該語(yǔ)言曾被用來(lái)開(kāi)發(fā)視頻游戲)。
Torch的優(yōu)勢(shì):
1、構(gòu)建模型簡(jiǎn)單
2、高度模塊化
3、快速高效的GPU支持
4、通過(guò)LuaJIT接入C
5、數(shù)值優(yōu)化程序等
6、可嵌入到iOS、Android和FPGA后端的接口
三.Caffe
Caffe由加州大學(xué)伯克利的PHD賈揚(yáng)清開(kāi)發(fā),全稱Convolutional Architecture for Fast Feature Embedding,是一個(gè)清晰而高效的開(kāi)源深度學(xué)習(xí)框架,目前由伯克利視覺(jué)學(xué)中心(Berkeley Vision and Learning Center,BVLC)進(jìn)行維護(hù)。(賈揚(yáng)清曾就職于MSRA、NEC、Google Brain,他也是TensorFlow的作者之一,目前任職于Facebook FAIR實(shí)驗(yàn)室。)
Caffe基本流程:Caffe遵循了神經(jīng)網(wǎng)絡(luò)的一個(gè)簡(jiǎn)單假設(shè)——所有的計(jì)算都是以layer的形式表示的,layer做的事情就是獲得一些數(shù)據(jù),然后輸出一些計(jì)算以后的結(jié)果。比如說(shuō)卷積——就是輸入一個(gè)圖像,然后和這一層的參數(shù)(filter)做卷積,然后輸出卷積的結(jié)果。每一個(gè)層級(jí)(layer)需要做兩個(gè)計(jì)算:前向forward是從輸入計(jì)算輸出,然后反向backward是從上面給的gradient來(lái)計(jì)算相對(duì)于輸入的gradient,只要這兩個(gè)函數(shù)實(shí)現(xiàn)了以后,我們就可以把很多層連接成一個(gè)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)做的事情就是輸入我們的數(shù)據(jù)(圖像或者語(yǔ)音等),然后來(lái)計(jì)算我們需要的輸出(比如說(shuō)識(shí)別的標(biāo)簽),在訓(xùn)練的時(shí)候,我們可以根據(jù)已有的標(biāo)簽來(lái)計(jì)算損失和gradient,然后用gradient來(lái)更新網(wǎng)絡(luò)的參數(shù)。
Caffe的優(yōu)勢(shì):
1、上手快:模型與相應(yīng)優(yōu)化都是以文本形式而非代碼形式給出
2、速度快:能夠運(yùn)行最棒的模型與海量的數(shù)據(jù)
3、模塊化:方便擴(kuò)展到新的任務(wù)和設(shè)置上
4、開(kāi)放性:公開(kāi)的代碼和參考模型用于再現(xiàn)
5、社區(qū)好:可以通過(guò)BSD-2參與開(kāi)發(fā)與討論
四.Theano
2008年誕生于蒙特利爾理工學(xué)院,Theano派生出了大量深度學(xué)習(xí)Python軟件包,最著名的包括Blocks和Keras。Theano的核心是一個(gè)數(shù)學(xué)表達(dá)式的編譯器,它知道如何獲取你的結(jié)構(gòu)。并使之成為一個(gè)使用numpy、高效本地庫(kù)的高效代碼,如BLAS和本地代碼(C++)在CPU或GPU上盡可能快地運(yùn)行。它是為深度學(xué)習(xí)中處理大型神經(jīng)網(wǎng)絡(luò)算法所需的計(jì)算而專門設(shè)計(jì)的,是這類庫(kù)的首創(chuàng)之一(發(fā)展始于2007年),被認(rèn)為是深度學(xué)習(xí)研究和開(kāi)發(fā)的行業(yè)標(biāo)準(zhǔn)。
Theano的優(yōu)勢(shì):
1、集成NumPy-使用numpy.ndarray
2、使用GPU加速計(jì)算-比CPU快140倍(只針對(duì)32位float類型)
3、有效的符號(hào)微分-計(jì)算一元或多元函數(shù)的導(dǎo)數(shù)
4、速度和穩(wěn)定性優(yōu)化-比如能計(jì)算很小的x的函數(shù)log(1+x)的值
5、動(dòng)態(tài)地生成C代碼-更快地進(jìn)行計(jì)算
6、廣泛地單元測(cè)試和自我驗(yàn)證-檢測(cè)和診斷多種錯(cuò)誤
7、靈活性好