數(shù)學基礎(chǔ):矩陣求導

本文主要參考B站UP主GRNovmbrain的推導視頻,鏈接如下:
https://www.bilibili.com/video/BV1xk4y1B7RQ/?vd_source=eef9eaf7d8271401f6cbf1b7afa000c0

矩陣求導的本質(zhì)

矩陣\boldsymbol{A}對矩陣\boldsymbol{B}求導,表示為\frac{d\boldsymbol{A}}{d\boldsymbol{B}},本質(zhì)是矩陣\boldsymbol{A}中的每個元素對矩陣\boldsymbol{B}中的每個元素求導。

求導后\frac{d\boldsymbol{A}}{d\boldsymbol{B}}中元素的個數(shù):

  • \boldsymbol{A}1*1矩陣,\boldsymbol{B}1*1矩陣,則 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素個數(shù)為1;
  • \boldsymbol{A}1*p矩陣,\boldsymbol{B}1*n矩陣,則 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素個數(shù)為p*n;
  • \boldsymbol{A}q*p矩陣,\boldsymbol{B}m*n矩陣,則 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素個數(shù)為q*p*m*n。

矩陣求導元素布局方法

矩陣\boldsymbol{A}對矩陣\boldsymbol{B}求導,得到的結(jié)果為\frac{d\boldsymbol{A}}{d\boldsymbol{B}},本質(zhì)上就是矩陣\boldsymbol{A}中的每個元素對矩陣\boldsymbol{B}中的每個元素求導;那么,不同的元素布局方式,就能得到不同的求導結(jié)果(指不同的結(jié)果矩陣)。元素的布局可以分為:1)分母布局,2)分子布局,兩種布局的關(guān)系為:將分母布局得到的結(jié)果矩陣進行轉(zhuǎn)置,即可得到分子布局的結(jié)果。

本文的例子中采用的是分母布局的形式,也是目前比較主流的機器學習矩陣求導布局形式。有些金融類的教材可能會采用分子布局的形式,兩種布局沒有優(yōu)劣之分,為了計算會推導的方便可以采用任意一種布局。需要注意的是:在同一個項目中需保持布局的一致性。

分母布局口訣

  • 標量保持不變,向量需要拉伸;
  • 分子橫向拉伸,分母縱向拉伸;

【例1】 f(\boldsymbol{x})為標量,\boldsymbol{x}=[x_1, x_2, ... , x_n]^{T}為列向量,求\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}。

此例中,分子f(\boldsymbol{x})為標量,分母\boldsymbol{x}為向量,求導獲得的矩陣共有n個元素。依照布局口訣,分子為標量,保持不變,分母為向量,需將其各元素縱向拉伸。由此,我們可以得到:

\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} = \left[ \begin{matrix} \frac{\partial f(\boldsymbol{x})}{\partial x_{1}}\\ \frac{\partial f(\boldsymbol{x})}{\partial x_{2}} \\ \vdots \\ \frac{\partial f(\boldsymbol{x})}{\partial x_{n}} \end{matrix} \right]

【例2】 f(x)=[f_1(x), f_2(x), ... , f_n(x)]為向量函數(shù),x為標量,求\frac{df(x)}{dx}。

此例中,分子為向量,分母為標量,求導獲得的矩陣共有n個元素。依照布局口訣,分子為向量,需將其各元素橫向拉伸,分母為標量,保持不變。由此,我們可以得到:

\frac{df(x)}{dx} = \left[ \begin{matrix} \frac{df_{1}(x)}{dx} & \frac{df_{2}(x)}{dx} \cdots & \frac{df_{n}(x)}{dx} \end{matrix} \right]

【例3】 f(\boldsymbol{x})=[f_1(\boldsymbol{x}), f_2(\boldsymbol{x}), ... , f_n(\boldsymbol{x})]為向量函數(shù),\boldsymbol{x}=[x_1, x_2, ... , x_n]^{T}為列向量,求\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}。

此例中,分子為向量,分母為也為向量,求導獲得的矩陣共有n^2個元素。依照布局口訣,分子為向量,需將其各元素橫向拉伸,分母為向量,需將其各元素縱向拉伸。我們先將分母縱向拉伸,再將分子橫向拉伸,可以得到:

\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} = \left[ \begin{matrix} \frac{\partial f(\boldsymbol{x})}{\partial x_{1}}\\ \frac{\partial f(\boldsymbol{x})}{\partial x_{2}} \\ \vdots \\ \frac{\partial f(\boldsymbol{x})}{\partial x_{n}} \end{matrix} \right]= \left[ \begin{matrix} \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_1} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_1} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_1} \\ \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_2} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_2} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_2} \\ \vdots & \vdots & \cdots & \vdots \\ \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_n} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_n} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_n} \end{matrix} \right]

常用矩陣求導公式

  • \frac{\partial \boldsymbol{a}^{T}\boldsymbol{x}}{\partial \boldsymbol{x}} = \frac{\partial \boldsymbol{x}^{T}\boldsymbol{a}}{\partial \boldsymbol{x}}= \boldsymbol{a}

  • \frac{\partial \boldsymbol{x}^{T}\boldsymbol{A}\boldsymbol{x}}{\partial \boldsymbol{x}} = (\boldsymbol{A} + \boldsymbol{A}^{T})\boldsymbol{x}

符號說明:

  • \boldsymbol{a}, \boldsymbol{x}為列向量;
  • \boldsymbol{A}為矩陣。

推薦書籍

The Matrix Cookbook : http://www2.imm.dtu.dk/pubdb/edoc/imm3274.pdf

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 向量、矩陣求導其實就兩個內(nèi)容 分子每個元素對分母每個元素求導 將結(jié)果以一定方式布局 對于 1,沒什么特別的,就是標...
    找不到工作閱讀 433評論 0 0
  • 對一個數(shù)求導大家都比較熟悉,那么對向量求導呢?看如下的例子:假設(shè)有矩陣和向量: 很容易求出, 現(xiàn)在令,則向量對向量...
    Jarkata閱讀 4,427評論 0 2
  • title: 閑話矩陣求導原始文件沒有辦法把latex公式正常顯示,所以一個一個弄出來了,保留了原來的公式。原始文...
    kylinxue閱讀 20,435評論 3 21
  • old Table of Contents 1. 布局(Layout) 2. 基本的求導規(guī)則(定義) 3. 維度分...
    場景為王閱讀 6,092評論 2 1
  • 求導布局: 分子布局(numerator layout): m維列向量對標量求導結(jié)果為m維列向量,標量對m*n維矩...
    米斯特芳閱讀 1,732評論 0 1

友情鏈接更多精彩內(nèi)容