關(guān)于 Keras 模型


關(guān)于 Keras 模型

在 Keras 中有兩類主要的模型:Sequential 順序模型使用函數(shù)式 API 的 Model 類模型

這些模型有許多共同的方法和屬性:

  • model.layers 是包含模型網(wǎng)絡(luò)層的展平列表。
  • model.inputs 是模型輸入張量的列表。
  • model.outputs 是模型輸出張量的列表。
  • model.summary() 打印出模型概述信息。 它是 utils.print_summary 的簡(jiǎn)捷調(diào)用。
  • model.get_config() 返回包含模型配置信息的字典。通過(guò)以下代碼,就可以根據(jù)這些配置信息重新實(shí)例化模型:
config = model.get_config()
model = Model.from_config(config)
# 或者,對(duì)于 Sequential:
model = Sequential.from_config(config)

  • model.get_weights() 返回模型中所有權(quán)重張量的列表,類型為 Numpy 數(shù)組。
  • model.set_weights(weights) 從 Numpy 數(shù)組中為模型設(shè)置權(quán)重。列表中的數(shù)組必須與 get_weights() 返回的權(quán)重具有相同的尺寸。
  • model.to_json() 以 JSON 字符串的形式返回模型的表示。請(qǐng)注意,該表示不包括權(quán)重,僅包含結(jié)構(gòu)。你可以通過(guò)以下方式從 JSON 字符串重新實(shí)例化同一模型(使用重新初始化的權(quán)重):
from keras.models import model_from_json

json_string = model.to_json()
model = model_from_json(json_string)

  • model.to_yaml() 以 YAML 字符串的形式返回模型的表示。請(qǐng)注意,該表示不包括權(quán)重,只包含結(jié)構(gòu)。你可以通過(guò)以下代碼,從 YAML 字符串中重新實(shí)例化相同的模型(使用重新初始化的權(quán)重):
from keras.models import model_from_yaml

yaml_string = model.to_yaml()
model = model_from_yaml(yaml_string)

  • model.save_weights(filepath) 將模型權(quán)重存儲(chǔ)為 HDF5 文件。
  • model.load_weights(filepath, by_name=False): 從 HDF5 文件(由 save_weights 創(chuàng)建)中加載權(quán)重。默認(rèn)情況下,模型的結(jié)構(gòu)應(yīng)該是不變的。 如果想將權(quán)重載入不同的模型(部分層相同), 設(shè)置 by_name=True 來(lái)載入那些名字相同的層的權(quán)重。

注意:另請(qǐng)參閱如何安裝 HDF5 或 h5py 以保存 Keras 模型,在常見(jiàn)問(wèn)題中了解如何安裝 h5py 的說(shuō)明。

Model 類繼承

除了這兩類模型之外,你還可以通過(guò)繼承 Model 類并在 call 方法中實(shí)現(xiàn)你自己的前向傳播,以創(chuàng)建你自己的完全定制化的模型,(Model 類繼承 API 引入于 Keras 2.2.0)。

這里是一個(gè)用 Model 類繼承寫的簡(jiǎn)單的多層感知器的例子:

import keras

class SimpleMLP(keras.Model):

    def __init__(self, use_bn=False, use_dp=False, num_classes=10):
        super(SimpleMLP, self).__init__(name='mlp')
        self.use_bn = use_bn
        self.use_dp = use_dp
        self.num_classes = num_classes

        self.dense1 = keras.layers.Dense(32, activation='relu')
        self.dense2 = keras.layers.Dense(num_classes, activation='softmax')
        if self.use_dp:
            self.dp = keras.layers.Dropout(0.5)
        if self.use_bn:
            self.bn = keras.layers.BatchNormalization(axis=-1)

    def call(self, inputs):
        x = self.dense1(inputs)
        if self.use_dp:
            x = self.dp(x)
        if self.use_bn:
            x = self.bn(x)
        return self.dense2(x)

model = SimpleMLP()
model.compile(...)
model.fit(...)

網(wǎng)絡(luò)層定義在 __init__(self, ...) 中,前向傳播在 call(self, inputs) 中指定。在 call 中,你可以指定自定義的損失函數(shù),通過(guò)調(diào)用 self.add_loss(loss_tensor) (就像你在自定義層中一樣)。

在類繼承模型中,模型的拓?fù)浣Y(jié)構(gòu)是由 Python 代碼定義的(而不是網(wǎng)絡(luò)層的靜態(tài)圖)。這意味著該模型的拓?fù)浣Y(jié)構(gòu)不能被檢查或序列化。因此,以下方法和屬性不適用于類繼承模型

  • model.inputsmodel.outputs。
  • model.to_yaml()model.to_json()
  • model.get_config()model.save()。

關(guān)鍵點(diǎn):為每個(gè)任務(wù)使用正確的 API。Model 類繼承 API 可以為實(shí)現(xiàn)復(fù)雜模型提供更大的靈活性,但它需要付出代價(jià)(比如缺失的特性):它更冗長(zhǎng),更復(fù)雜,并且有更多的用戶錯(cuò)誤機(jī)會(huì)。如果可能的話,盡可能使用函數(shù)式 API,這對(duì)用戶更友好。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容