本文主要參考B站UP主GRNovmbrain的推導視頻,鏈接如下:
https://www.bilibili.com/video/BV1xk4y1B7RQ/?vd_source=eef9eaf7d8271401f6cbf1b7afa000c0
矩陣求導的本質(zhì)
矩陣對矩陣
求導,表示為
,本質(zhì)是矩陣
中的每個元素對矩陣
中的每個元素求導。
求導后
中元素的個數(shù):
- 若
為
矩陣,
為
矩陣,則
中元素個數(shù)為
;
- 若
為
矩陣,
為
矩陣,則
中元素個數(shù)為
;
- 若
為
矩陣,
為
矩陣,則
中元素個數(shù)為
。
矩陣求導元素布局方法
矩陣對矩陣
求導,得到的結(jié)果為
,本質(zhì)上就是矩陣
中的每個元素對矩陣
中的每個元素求導;那么,不同的元素布局方式,就能得到不同的求導結(jié)果(指不同的結(jié)果矩陣)。元素的布局可以分為:1)分母布局,2)分子布局,兩種布局的關(guān)系為:將分母布局得到的結(jié)果矩陣進行轉(zhuǎn)置,即可得到分子布局的結(jié)果。
本文的例子中采用的是分母布局的形式,也是目前比較主流的機器學習矩陣求導布局形式。有些金融類的教材可能會采用分子布局的形式,兩種布局沒有優(yōu)劣之分,為了計算會推導的方便可以采用任意一種布局。需要注意的是:在同一個項目中需保持布局的一致性。
分母布局口訣
- 標量保持不變,向量需要拉伸;
- 分子橫向拉伸,分母縱向拉伸;
【例1】 為標量,
為列向量,求
。
此例中,分子為標量,分母
為向量,求導獲得的矩陣共有
個元素。依照布局口訣,分子為標量,保持不變,分母為向量,需將其各元素縱向拉伸。由此,我們可以得到:
【例2】 為向量函數(shù),
為標量,求
。
此例中,分子為向量,分母為標量,求導獲得的矩陣共有個元素。依照布局口訣,分子為向量,需將其各元素橫向拉伸,分母為標量,保持不變。由此,我們可以得到:
【例3】 為向量函數(shù),
為列向量,求
。
此例中,分子為向量,分母為也為向量,求導獲得的矩陣共有個元素。依照布局口訣,分子為向量,需將其各元素橫向拉伸,分母為向量,需將其各元素縱向拉伸。我們先將分母縱向拉伸,再將分子橫向拉伸,可以得到:
常用矩陣求導公式
符號說明:
-
,
為列向量;
-
為矩陣。
推薦書籍
The Matrix Cookbook : http://www2.imm.dtu.dk/pubdb/edoc/imm3274.pdf