【注】參考邱錫鵬《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》。
1. 簡介
在數(shù)學(xué)中, 矩陣微積分是多元微積分的一種特殊表達(dá),尤其是在矩陣空間上進(jìn)行討論的時(shí)候。它把單個函數(shù)對多個變量或者多元函數(shù)對單個變量的偏導(dǎo)數(shù)寫成向量和矩陣的形式,使其可以被當(dāng)成一個整體被處理。
2. 偏導(dǎo)數(shù)
矩陣微積分的表示通常有兩種符號約定:
- 分子布局( Numerator Layout)
- 分母布局( Denominator Layout)
兩者的區(qū)別是一個標(biāo)量關(guān)于一個向量的導(dǎo)數(shù)是寫成行向量還是列向量。
【注】向量一般未特殊說明都是用列向量表示。
2.1 標(biāo)量關(guān)于向量的偏導(dǎo)數(shù)
對于 維向量
和函數(shù)
,則
關(guān)于
的偏導(dǎo)數(shù)為:
分母布局:
分子布局:
在分母布局中, 為列向量;而在分子布局中,
為行向量。
2.2 向量關(guān)于標(biāo)量的偏導(dǎo)數(shù)
對于標(biāo)量 和函數(shù)
,則
關(guān)于
的偏導(dǎo)數(shù)為:
分母布局:
分子布局:
在分母布局中, 為行向量;而在分子布局中,
為列向量。
2.3 向量關(guān)于向量的偏導(dǎo)數(shù)
對于
維向量
和函數(shù)
,則
關(guān)于
的偏導(dǎo)數(shù)為:
分母布局:
分子布局:
對于
維向量
和函數(shù)
,則
關(guān)于
的二階偏導(dǎo)數(shù)為:
- 分母布局 = 分子布局:
【注】 和
分別為 Jacobian 矩陣和 Hessian 矩陣。
3. 偏導(dǎo)數(shù)法則
以下偏導(dǎo)數(shù)法則僅以分母布局為例:
3.1 加減法則
若 ,則
3.2 乘法法則
若
,則
若
和
無關(guān),則
若
,則
3.3 鏈?zhǔn)椒▌t
若
,則
若
,則
若
為矩陣,
,則
4. 附錄
4.1 記憶小技巧:
- 可以把「標(biāo)量對向量」和「向量對標(biāo)量」求導(dǎo)中的標(biāo)量看作是一維的行向量,而向量則為一般理解的列向量,則分母/分子布局就表示求導(dǎo)后的向量的布局是跟求導(dǎo)式的分母還是分子保持一致。
- 「標(biāo)量對向量」求導(dǎo):分母布局結(jié)果為列向量,分子布局結(jié)果為行向量。
- 「向量對標(biāo)量」求導(dǎo):分母布局結(jié)果為行向量,分子布局結(jié)果為列向量。
- 對于「向量對向量」求導(dǎo):既可以看作是分子向量中的每個標(biāo)量元素對分母向量求導(dǎo),也可以看作是分母向量對分子向量中的每個標(biāo)量元素求導(dǎo),然后便可以使用上一條記憶方法。最終將每個求導(dǎo)的結(jié)果向量拼接成一個矩陣,即得到最終的分母/分子布局結(jié)果。