2022-03-13 RASA實(shí)戰(zhàn)筆記 -- 第九章 rasa的工作原理

一、rasa的工作原理

rasa3.0中,NLU和Core都作為有向無環(huán)圖(DAG)計(jì)算的一部分進(jìn)行編排。即所有的計(jì)算過程(也就是組件)都作為圖的節(jié)點(diǎn),計(jì)算過程之間的依賴關(guān)系通過有向邊表示。所有的計(jì)算過程和依賴關(guān)系就構(gòu)成了一個(gè)DAG。
在訓(xùn)練和預(yù)測(cè)時(shí)使用兩個(gè)不同的DAG。下面按照組件的兩個(gè)階段(訓(xùn)練階段和推理階段)解釋組件的工作原理。

1.1 訓(xùn)練階段:

模型訓(xùn)練源碼:rasa.model_training.train()函數(shù),函數(shù)調(diào)用其他代碼完成訓(xùn)練。邏輯上說,訓(xùn)練階段有三個(gè)步驟:

  • 從配置文件和參數(shù)中構(gòu)造有向無環(huán)圖
  • 運(yùn)行有向無環(huán)圖,這是模型實(shí)際進(jìn)行訓(xùn)練和持久化的過程
  • 將元數(shù)據(jù)連同(通過持久化過程形成的)組件文件打包成模型

1.1.1 構(gòu)造DAG

根據(jù)配置文件(config.yml)和參數(shù)(通過調(diào)用train命令時(shí)的命令行制定)來構(gòu)建DAG。
構(gòu)造DAG的過程涉及多個(gè)類的逐層抽象和轉(zhuǎn)換,總體流程比較復(fù)雜。

  • 核心代碼位于:rasa.engine.recipes.default_recipe.DefaultV1Recipe.graph_config_for_recipe()方法中。
    • 其輸入是來自config.yaml的配置信息。
    • 輸出是圖的配置信息,包含圖中所有節(jié)點(diǎn)的定義、rasa NLU的輸出目標(biāo)和rasa Core的輸出目標(biāo)。①節(jié)點(diǎn)的定義包含了節(jié)點(diǎn)對(duì)應(yīng)的組件信息、組件的入口方法和該組件對(duì)其他組件的依賴關(guān)系
      rasa的訓(xùn)練和推理使用不同的DAG,在構(gòu)造訓(xùn)練DAG的同時(shí),推理DAG也會(huì)被構(gòu)造,并作為元信息的一部分寫入模型包。

1.1.2 運(yùn)行DAG

運(yùn)行DAG的過程即為模型訓(xùn)練和持久化的過程。

  • 核心代碼位于:rasa.engin.runner.dask.DaskGraphRunner.run()方法。
    • 其輸入是DAG,
    • 輸出是目標(biāo)的值,即我們所需的結(jié)果。

運(yùn)行DAG時(shí),會(huì)一一運(yùn)行每個(gè)節(jié)點(diǎn):調(diào)用節(jié)點(diǎn)所存儲(chǔ)的組件的對(duì)應(yīng)方法,完成其功能。功能包含:載入資源、訓(xùn)練和進(jìn)行推理。在載入資源和訓(xùn)練功能中需要組件完成組件的系列化,這樣就可以寫入磁盤供推理使用

1.1.3 打包模型

將運(yùn)行DAG過程中的產(chǎn)物寫入目錄,從而創(chuàng)建rasa模型文件。

  • 核心代碼:rasa.engine.storage.local_storage.LocalModelStorage.create_model_package()
    • 首先將各個(gè)組件序列化后的資源文件和配置文件拷貝進(jìn)工作目錄,并將包含模型訓(xùn)練和推理的2個(gè)DAG的元信息序列化成文件,拷貝進(jìn)工作目錄,最后將工作目錄壓縮為單一文件,即為rasa模型文件

1.2 推理階段

推理階段工作函數(shù):rasa.core.run.serve_application()函數(shù)。邏輯上講推理階段有三個(gè)步驟:

  • 建立connector,對(duì)外提供訪問接口
  • 從磁盤載入模型(DAG)
  • 處理用戶消息

1.2.1 建立connector

connector是rasa對(duì)外提供服務(wù)的一種接口機(jī)制。用戶客戶端與connector通信從而實(shí)現(xiàn)和rasa機(jī)器人溝通。
rasa服務(wù)器(推理功能)是基于sanic(類似于flask的高性能一步web框架,具有高擴(kuò)展能力)實(shí)現(xiàn)。
rasa中,每個(gè)connector都是可插拔的sanic擴(kuò)展。
rasa按照配置(credentials.yml)在啟動(dòng)時(shí)候載入這些connector。
載入connector的核心代碼在rasa.core.run.create_http_input_channels()

1.2.2 載入模型

rasa的模型是以DAG組織的。rasa從模型的元信息中還原推理用的DAG(在訓(xùn)練階段生成)。
載入DAG的核心代碼:rasa.engine.loader.load_predict_graph_runner()

1.2.3 處理用戶消息

處理用戶消息的核心代碼:rasa.core.agent.Agent.handle_message()。
邏輯上講,處理過程分為2個(gè)階段:①自然語言理解(NLU),即從用戶的消息中提取意圖和實(shí)體;②對(duì)話管理(DM),由Rasa Core負(fù)責(zé),這部分人Rasa會(huì)根據(jù)上下文選擇合適的動(dòng)作進(jìn)行執(zhí)行。
Rasa NLU主要函數(shù):rasa.core.processor.MessageProcessor.log_message(),它會(huì)根據(jù)DAG得到NLU結(jié)果,這些結(jié)果更新tracker的狀態(tài),隨后按照詞槽(slot)的映射(mapping)配置更新slot的值,并更新tracker的狀態(tài)。這一過程由rasa.core.processor.MessageProcessor.run_action_extract_slots()方法實(shí)現(xiàn)。
最后Core把tracker的狀態(tài)作為輸入,通過運(yùn)行DAG預(yù)測(cè)下一步要執(zhí)行的動(dòng)作并執(zhí)行這一動(dòng)作。
動(dòng)作的執(zhí)行可能會(huì)帶來新的tracker狀態(tài),因此“預(yù)測(cè)-執(zhí)行”的過程可能會(huì)循環(huán)多次,直到滿足停止條件。這一過程核心代碼在rasa.core.processor.MessageProcessor._run_prediction_loop()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容