PaddlePaddle/fluid: 靜態(tài)圖 vs. 動態(tài)圖

昨天,師兄問我:PaddlePaddle支持動態(tài)圖嗎?我才知道,模型還可以是動態(tài)的!孤陋寡聞了呀。調研走起~ 交流也是科研的生產(chǎn)力~

何謂“動靜”

在TensorFlow中,模型是完全靜態(tài)的:定義好一個完整的網(wǎng)絡結構(Graph),才能開始執(zhí)行整個圖(調入session開始計算),且運行中不能對圖進行修改(比如添加網(wǎng)絡節(jié)點等操作)。
在我初步試用PaddlePaddle的PARL庫中,涉及的也是靜態(tài)圖。定義好模型之后,調用executor,executor會將模型的定義提交給transplier,由其提交至C++后臺并返回ProgramDesc,executor據(jù)此依次執(zhí)行。整個過程是編譯器式的——靜態(tài)。

PyTorch提供有動態(tài)圖機制,PaddlePaddle也是至最新的1.5.x版本開始提供動態(tài)圖API(目前TF也有Eager Execution提供動態(tài)圖支持。)。在動態(tài)圖中,兼用各種邏輯控制語法(如if else等),按照代碼順序執(zhí)行,變執(zhí)行邊生成本次的計算圖,每次都會重新構建。

「 有點類于編譯語言和解釋性語言的區(qū)別?!?/p>

  • 靜態(tài)圖:聲明式編程。一次構建,多次使用;構建稍繁瑣復雜;性能好,速度快。
  • 動態(tài)圖:命令式編程。圖的代碼編寫很靈活,可使用Python的控制流(簡潔之道!);方便debug;操作可立即獲得執(zhí)行結果,無需等待計算圖的全部構建完成。
fluid動態(tài)圖&靜態(tài)圖總覽

fluid靜態(tài)圖

fluid內部的靜態(tài)圖執(zhí)行流程如下:「 圖源自官網(wǎng) 」

代碼里構建的圖為program(類于TensorFlow的graph),executor可理解為TensorFlow的session。過程中經(jīng)由Transpiler進行了編譯,故需事先定義好完整的program,提交至executor后不可修改。
詳參見官網(wǎng)的設計思想說明 ,此處不展開啦。https://www.paddlepaddle.org.cn/documentation/docs/zh/advanced_usage/design_idea/fluid_design_idea.html

fluid動態(tài)圖

動態(tài)圖的編程和思想就簡單些了,build when run. 使用的庫:fluid.dygraph 。

simple use

fluid.dygraph.guard() : 創(chuàng)建執(zhí)行dygraph的上下文,然后在其里隨心地靈活使用控制流~
最簡單的動態(tài)圖構建如下。

input0 = np.random.randint(low=1, high=5, size=(2,))
    input1 = np.random.randint(low=1, high=5, size=(2,))
    # print(inp1, inp2)
    with fluid.dygraph.guard():
        if np.sum(input0) < np.sum(input1):
            x = fluid.layers.elementwise_add(input0, input1)
        else:
            x0 = fluid.layers.elementwise_sub(input0, input1)
            x = fluid.layers.elementwise_sub(x0, input1)
        print(x.numpy())

若要反向傳播,則在定義loss(Variable)后,直接調用loss.backward(),用loss.gradient()可獲得梯度。

advanced

稍復雜些,則使用fluid.dygraph.Layer構建神經(jīng)網(wǎng)絡,代碼見下段的下方。策略繼承自fluid.dygraph.Layer,初始化以外,還需實現(xiàn)forward前向傳播函數(shù)。

class Policy(fluid.dygraph.Layer):
    def __init__(self, name_scope):
        super(Policy, self).__init__(name_scope)

        self.affine1 = nn.FC(self.full_name(), size=128)
        self.affine2 = nn.FC(self.full_name(), size=2)
        self.dropout_ratio = 0.6

        self.saved_log_probs = []
        self.rewards = []

    def forward(self, x):
        x = fluid.layers.reshape(x, shape=[1, 4])
        x = self.affine1(x)
        x = fluid.layers.dropout(x, self.dropout_ratio)
        x = fluid.layers.relu(x)
        action_scores = self.affine2(x)

        self._x_for_debug = x

        return fluid.layers.softmax(action_scores, axis=1)

fluid.dygraph.Layer : 本身已實現(xiàn)了train和eval函數(shù),都是通過tracer完成,tracer和engine的詳盡(動態(tài)圖的機制相關)待續(xù)。

links:
這篇文給的動態(tài)圖實例可供參考:https://cloud.tencent.com/developer/article/1493615
官方GitHub也給了些例子:https://github.com/PaddlePaddle/models/tree/develop/dygraph

why is this involved?

因為我們即將的工作中,希望針對當前的優(yōu)化狀態(tài)對計算圖進行動態(tài)執(zhí)行。
比如:使用兩個模型拼接達到更好對效果時,若第一個模型就達到了訓練目標,則無需運行第二個模型的網(wǎng)絡。即我們希望網(wǎng)絡是動態(tài)的,層次可選的,可以通過邏輯流來達到控制。雖然靜態(tài)圖也提供有一定的邏輯控制,但編程較為麻煩,且每次運行都是基于第一次構建的完整的計算圖,而非當前執(zhí)行邏輯下的分支圖,拼接模型都較大的情況下極為耗費內存。

TODO:

  • 邏輯控制 + fluid.dygraph.Layer,能否?即實現(xiàn)圖的層次可選。
  • 此外動態(tài)圖也提供了參數(shù)持久化,但邏輯控制是否涉入其中,還未試驗。
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容