視頻地址:https://www.bilibili.com/video/av6540378/?spm_id_from=333.788.videocard.0
本篇來講一下線性代數(shù)中非常重要的一個(gè)概念:特征向量/特征值。
前面介紹過,一個(gè)矩陣代表的是一種線性變換,考慮二維空間中的某個(gè)線性變換,它將i即[1,0]變換到[3,0]的位置,將j即[0,1]變換到[1,2]的位置,那么對(duì)應(yīng)的矩陣就是[3,1;0,2](先說一下寫法,這里的[3,1;0,2],其中3,1是第一行,0,2是第二行):

在這個(gè)變換過程中,很多向量都離開了其原本所張成的空間,即所在的直線,但也有一些向量在變換后,仍恰好落在原來的直線上:


如上面的例子中,基向量i就落在了原來的直線即x軸上,只不過是被拉長(zhǎng)了三倍,同樣的,x軸上的任何其他向量在經(jīng)過變換后都只是被拉伸為原來的三倍,且方向不變:

除了x軸上的向量外,向量[-1,1] 所在的直線上的向量在變換后仍在原來的直線上,只是長(zhǎng)度被拉長(zhǎng)了兩倍:

總結(jié)一下,在剛才的線性變換中,有兩條直線上的向量,在變換后仍在其所在的直線上,只不過長(zhǎng)度和方向發(fā)生了改變,但其他的向量,都離開了它所張成的直線:


想必大家都知道結(jié)果了,經(jīng)過上面矩陣所代表的線性變換,兩條位置不變的直線上的向量都可以稱之為特征向量,而對(duì)應(yīng)伸縮的大小,就稱之為特征值。值得一提的是,如果線性變換后是反向伸縮,那么特征值是負(fù)的:

接下來簡(jiǎn)單介紹一下特征值和特征向量的計(jì)算方法,首先根據(jù)剛才的介紹,一個(gè)矩陣A的特征向量,在經(jīng)過這個(gè)矩陣所代表的線性變換之后,沒有偏離其所張成的直線,而只是發(fā)生了伸縮或方向改變,所以首先可以寫出下面的式子:

接下來要求解特征向量和特征值,首先需要做下變換,因?yàn)榈仁降淖筮叴淼氖蔷仃嚭拖蛄肯喑?,右邊代表的是一個(gè)數(shù)和向量相乘,所以先把右邊變?yōu)榫仃嚭拖蛄肯喑说男问剑醋對(duì)伺c單位矩陣相乘:

然后就可以都移到等號(hào)左邊,提出公因子來:

接下來的目標(biāo)就是求解向量v,使得v與(A-λI)相乘的結(jié)果為零向量。如果v本身是零向量的話,那等式恒成立。但我們真正想找的是非零的特征向量。
回顧本系列視頻第五講的內(nèi)容,當(dāng)一個(gè)二維矩陣的行列式為0時(shí),它能代表的線性變換能將空間壓縮為一條直線或者是零點(diǎn)。因此,想讓v經(jīng)過(A-λI)變換后的結(jié)果為零向量,(A-λI)的行列式值必須為0,所以整個(gè)過程如下:

以最開頭提到的矩陣作為例子,很容易求解出特征值是2或者3:



求解出特征值了,如何求解對(duì)應(yīng)的特征向量呢?以特征值2為例子,求解如下的方程組即可,你可以發(fā)現(xiàn),一條直線上的所有向量都可以作為特征向量:

一般情況下,一個(gè)二維矩陣有兩個(gè)特征值,而對(duì)應(yīng)的特征向量在兩條直線上,但也存在一些特殊情況。如有時(shí)候只有一個(gè)特征值,以及特征向量分布在一條直線上,如下面的矩陣,只有1個(gè)特征值,為1:

有一些矩陣并沒有對(duì)應(yīng)的特征值,比如將空間旋轉(zhuǎn)90度的線性變換所對(duì)應(yīng)的矩陣,空間中所有的向量在經(jīng)過其變換后都偏離了原來的直線,旋轉(zhuǎn)了90度,因此其沒有特征向量。
更特別的,有時(shí)候一個(gè)矩陣只有一個(gè)特征值,但是其對(duì)應(yīng)的特征向量分布在不同的直線上,如下面的矩陣將空間中所有的向量都拉伸了兩倍,它只有一個(gè)特征值2,但是所有的向量都是其特征向量:

最后,講一下特征基的概念。講到基,又得搬出坐標(biāo)系的概念了。假設(shè)我們坐標(biāo)系的基是[1,0]和[0,1],如果基向量都是特征向量,那么會(huì)發(fā)生什么呢?沒錯(cuò),如果基向量都是一個(gè)矩陣的特征向量,那么這個(gè)矩陣就是一個(gè)對(duì)角矩陣,而對(duì)角線上的值,就是對(duì)應(yīng)的特征值:

這句話反過來說對(duì)不對(duì)呢?即如果一個(gè)矩陣是對(duì)角矩陣,那么對(duì)應(yīng)的特征向量都是基向量?好像有點(diǎn)問題,比如剛才的[2,0;0,2],它是一個(gè)對(duì)角矩陣,但其特征向量包括了所有的向量,而并非只有基向量。
但很多情況下,特征向量并非是基向量,但至少能夠找到一組能夠張成整個(gè)空間的向量集合,還是本文開頭所講的例子:

如果能找到這樣一組向量,那我們就能變換坐標(biāo)系,使這些向量成為新的坐標(biāo)系下的基向量。這里先簡(jiǎn)單回顧一下上一個(gè)視頻中所講到的基變換的概念。假設(shè)我們的坐標(biāo)系基向量分別是[1,0]和[0,1],那么矩陣[2,-1;1,1]的意思可以理解為,將我們空間中的[1,0]、[0,1],轉(zhuǎn)換到另一個(gè)空間中的[1,0]、[0,1],而另一個(gè)空間中的[1,0]、[0,1],在我們空間看的話,坐標(biāo)分別是[2,1]和[-1,1](這里可能比較繞,需要轉(zhuǎn)一下彎)。
因此,矩陣[2,-1;1,1]所代表的線性變換,可以理解為將另一組坐標(biāo)系下某一個(gè)向量的坐標(biāo),轉(zhuǎn)換到我們這組坐標(biāo)系下的坐標(biāo),同樣的,矩陣[2,-1;1,1]的逆代表將一個(gè)向量在我們坐標(biāo)系下的坐標(biāo),轉(zhuǎn)換成另一個(gè)坐標(biāo)系下的坐標(biāo)。
因此如果想要將我們坐標(biāo)系下的一個(gè)線性變換M,作用到另一個(gè)坐標(biāo)系中,需要怎么做呢?首先要將一個(gè)向量在另一個(gè)坐標(biāo)系中的坐標(biāo)轉(zhuǎn)換到我們的空間中坐標(biāo),然后在進(jìn)行線性變換M,最后在變回到另一個(gè)空間中的坐標(biāo):

最后還是最開始的例子,假設(shè)想讓在我們的坐標(biāo)系下得到的特征向量(因?yàn)橹本€上所有的向量都可以作為特征向量,因此這里取了一個(gè)特例[-1,1],[1,0])作為新的坐標(biāo)系下的基向量,新的坐標(biāo)系下[1,0]和[0,1]對(duì)應(yīng)的向量,在我們的坐標(biāo)系下分別是[1,0]和[-1,1],那么就可以得到一個(gè)基變換矩陣[1,-1;0,1](基變換矩陣可以將另一個(gè)坐標(biāo)系下的坐標(biāo)轉(zhuǎn)換為我們這個(gè)坐標(biāo)系下的坐標(biāo))。
思考下面三個(gè)矩陣相乘的結(jié)果的結(jié)果:

假設(shè)中間的矩陣為M,那么上面三個(gè)矩陣相乘的意思其實(shí)是對(duì)另一個(gè)坐標(biāo)系下定義的向量坐標(biāo)應(yīng)用在我們坐標(biāo)系下的線性變換M。三個(gè)矩陣相乘的結(jié)果是一個(gè)對(duì)角矩陣,且對(duì)角線元素為對(duì)應(yīng)的特征值:

從直觀上理解,由于選擇了矩陣M的特征向量作為新坐標(biāo)系下的基向量,基向量在變換中只是進(jìn)行了縮放。從數(shù)學(xué)上理解,如果把上面式子中左右兩邊同左乘矩陣[1,-1;0,1],其實(shí)就是特征向量的定義。把一個(gè)矩陣的特征向量作為基向量,這組基向量也稱為特征基:

根據(jù)上面的式子,使用矩陣M的特征向量所組成的矩陣,成功將M進(jìn)行了對(duì)角化。但并不是所有的矩陣都可以對(duì)角化,只有矩陣的特征向量夠多,能夠張成全空間時(shí),才能進(jìn)行對(duì)角化。
好了,本節(jié)的內(nèi)容就這么多,深入淺出,小伙伴們一定記得去看視頻哇!