我是靠谱客的博主 玩命白昼,最近开发中收集的这篇文章主要介绍MIT线性代数公开课学习笔记第26~30课二十六、对称矩阵及正定性二十七、复数矩阵和快速傅里叶变换二十七、正定矩阵和最小值二十九、相似矩阵与Jordan标准型三十、奇异值分解,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

二十六、对称矩阵及正定性

实对称矩阵

实对称矩阵是所有元素均为实数的对称矩阵。具有以下性质:

  • 1、所有特征值均为实数

  • 2、所有特征向量均为实向量

  • 3、不同特征值对应的特征向量之间是正交的

  • 4、具有n个线性无关的特征向量

  • 5、任意实对称阵A都可以用正交阵(P)对角化:(A=QLambda Q^{-1}=QLambda Q^T)

分析第一条性质

下面证明第1条性质:
因为(A)为实对称阵,从而(bar A=A,A^T=A)
[Ax=lambda x]

两边同取共轭:

[bar A bar x=bar lambda bar x ]

两边同时转置:

[bar x^Tbar {A^T} =bar lambda bar x^T ]

[bar x^T A =bar lambda bar x^T ]

两边同时右乘(x)

[bar x^T Ax =bar lambda bar x^T x ]

[lambda bar x^T x =bar lambda bar x^T x ]

其中,(|x|^2=bar x^T x),又特征向量模长不为0,从而左右同时除去(bar x^T x)便可得到:

[barlambda=lambda]

分析第五条性质

国内线代教材已指出,可通过求出A的每个特征值的特征向量,并对每个特征值的(n-r(lambda_iI-A))个线性无关的特征向量施密特正交单位化后,得到n个相互正交的单位特征向量,将它们按列排列,即可得到正交阵P=((q_1,cdots,q_n))(q_i)对应于(Lambda)中第i个主对角元,其值为特征向量(q_i)对应的特征值

[A=QLambda Q^T=(q_1,cdots,q_n)mathrm{diag}(lambda_1,cdots,lambda_n)(q_1,cdots,q_n)^T ]

[A=(q_1,cdots,q_n)(lambda_1q_1,cdots,lambda_nq_n)^T=sum_{i=1}^n lambda_iq_iq_i^T]

正定矩阵

定义:正定矩阵是特殊的实对称矩阵,其所有特征值均大于0。(xneq 0)时,对应的二次型(x^TAx)恒大于0

判断实对称阵是否正定的办法:

  • 1、求出所有特征值,判断是否都大于0

  • 2、n个K阶顺序主子式均大于0

  • 3、通过倍加操作将A化为阶梯型矩阵U后,判断U的所有主元(必须有n个主元)是否全部大于0。更一般地,大于0的主元个数=大于0的特征值个数,小于的主元个数=小于0的特征值个数,

二十七、复数矩阵和快速傅里叶变换

复数向量的内积与模长

对于n维复数列向量(x,yin mathbb{C}^n),其内积被定义为:

[xcdot y=bar x^T y]

定义(bar x^T=x^H)(hermitian),则:

[xcdot y=x^Hy]

相应地,n维复数列向量(xin mathbb{C}^n)的模长被定义为:

[|x|=sqrt{x·x}=sqrt{x^Hx}]

复数矩阵、埃尔米特矩阵与酉矩阵

由复数构成的矩阵称为复数矩阵

类似之前的定义,也有

[bar A^T=A^H ]

对于复数方阵(Ain mathbb{C^{ntimes n}}),若:

[A^H=A ]

则称A为埃尔米特矩阵(Hermitian Matrix),可见,埃尔米特矩阵中,与对角线对称的(a_{i,j}=bar a_{j,i})

若方阵(A)(A^HA=I),则称其为酉矩阵,对应于实矩阵里的正交矩阵。类似正交矩阵,在酉矩阵中,任意两个列向量是正交的,(alpha^Hbeta=0),同样地,任意两个行向量也是正交的

快速傅里叶变换

傅里叶矩阵

[F_n=begin{pmatrix}1 & 1 & 1 & cdots & 1\ 1 & w & w^2 & cdots & w^{n-1}\ 1 & w^2 & w^4 & cdots & w^{2(n-1)}\ vdots & vdots & vdots & ddots & vdots\ 1 & w^{n-1} & w^{2(n-1)} & cdots & w^{(n-1)^2} end{pmatrix}_{n times n}]

其中,((F_n)_{i,j}=w^{ij}),注意傅里叶矩阵的下标是从0开始的,即i,j=0,...,n-1

({1,w,cdots,w^{n-1}})为n阶单位根,(w^n=1,w=e^{ifrac {2pi} n }=cos(frac {2pi} n)+isin(frac {2pi} n))(欧拉公式)

傅里叶矩阵是酉矩阵,(F_n^HF_n=I)

给出n维列向量x,x的离散傅里叶变换(DFT)可表示为(F_nx),离散傅里叶逆变换为(F_n^{-1}x)

正常情况下,这个乘法过程时间复杂度为(O(n^2))

矩阵分解实现快速傅里叶变换

(D_n=mathrm{diag}(1,w,cdots,w^{n-1})),则:

[F_{2n}= begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_n & 0\0 & F_nend{pmatrix}P_{2n}]

其中P为奇偶置换阵,将奇数列(行)排在前面,然后将偶数列(行)排在后面。例如:

[P_4=begin{pmatrix} 1 &&&\ &&1&\ &1&&\ &&&1 end{pmatrix}]

[F_{2n}x= begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_n & 0\0 & F_nend{pmatrix}P_{2n}x]

(P_{2n}x=(alpha^T,beta^T)^T),其中(alpha,betain mathbb{R}^n)

[F_{2n}x= begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_n & 0\0 & F_nend{pmatrix}(P_{2n}x)]

[=begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_n & 0\0 & F_nend{pmatrix}begin{pmatrix}alpha\ betaend{pmatrix}]

[=begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_nalpha & 0\0 & F_nbetaend{pmatrix}]

求解(begin{pmatrix}I & D_n\I & -D_nend{pmatrix} begin{pmatrix}F_nalpha & 0\0 & F_nbetaend{pmatrix})时,计算量最大的是计算(F_nalpha,F_nbeta),这两个计算完成后,其余的n阶矩阵乘法都是在(O(n))时间内完成(因为I和D都是对角阵)

FFT的关键是用这种矩阵分解的方法,递归下去计算(F_{n}alpha,F_{n}beta)

设计算(F_nx)的时间复杂度是(f(n)),则

[f(2n)=f(n)+n]

[f(2n)=n+frac n 2+frac n 4+cdots +1= O(nlogn)]

二十七、正定矩阵和最小值

正定矩阵的定义和判定方法,在国内教材中都有,这里不再赘述

正定二次型的几何意义

对于二次型(f(x_1,x_2)=x^TAx)而言,若A正定,则所有点((x_1,x_2,f(x_1,x_2)))在直角坐标系中构成了一个开口向上,过原点的碗型(表明当(x_1,x_2)不同时为0时,二次型取值一定大于0)。

若在这个碗型,z轴为1处作一个平行于xoy面的平面,可以截得一个椭圆:(ax_1^2+bx_1x_2+cx_2^2=1)

Hessian矩阵与极小值判定

定义n元函数f的Hessian矩阵为

838ba61ea8d3fd1f498e3e4a324e251f95ca5f3e.jpg

(H(f))正定时,(f(x))在该点取得极小值

正定二次型与主轴定理

对于正定二次型(x^TAx)(x^TAx=1)是一个椭圆形(x为三维向量则是椭球体),(A)的n个线性无关的特征向量代表该几何图形(椭圆、椭球...)的n条主轴的方向,每个特征向量对应的特征值是该主轴的长度
v2-66ecfdd70950af41b67ffb4bc7cf1c98_hd.jpg

通过将二次型化为标准型(x^T(P^TAP)x=1)可以使得该几何图形通过正交变换P,使得所有主轴与各个坐标系平行

将二次型先化为标准形,再化为规范形(x^T(P^TAP)x=1),则可以使得该几何图形通过线性变换P,变为标准的圆(球体,...)

二十九、相似矩阵与Jordan标准型

相似矩阵

对于方阵A,B,若存在可逆阵(P)使得(P^{-1}AP=B),则(Asim B)

注意,若方阵A,B中有一个不可对角化,则A,B有完全相同的特征值也不能得到A和B相似。

只有当A,B有完全相同的特征值,都可对角化为相同的(Lambda)时,才能说A,B相似

Jordan标准型

设n阶方阵A有K个线性无关的特征向量(x_1,cdots,x_K),对应的特征值为(lambda_1,cdots,lambda_K),则一定存在可逆阵(P)使得

[P^{-1}AP= begin{pmatrix} J_1&&\ &J_2&\ &&ddots\ &&&J_K end{pmatrix}=J]

J称为A的Jordan标准型,其中(J_i)是一个Jordan块,为方阵,对应于K个线性无关的特征向量里的第i个,其中的(lambda_i)是该特征向量对应的特征值:

[J_i=begin{pmatrix} lambda_1&1&\ &lambda_2&1\ &&ddots&ddots\ &&&lambda_{r_i} end{pmatrix}]

当K=n时,每个Jordan块都是一阶的,J就是对角阵了

若J中对应(lambda_i)的Jordan块有t个,则(dim V_{lambda_i}=t)

三十、奇异值分解

任意m*n矩阵A都可以通过奇异值分解(singularly valueable decomposition,SVD)被分解为:

[A=USigma V^T]

其中,U是m阶正交阵,V是n阶正交阵,(U=(u_1,cdots,u_m)),(V=(v_1,cdots,v_n))(Sigma)(mtimes n)对角阵

((u_1,cdots,u_m)),((v_1,cdots,v_n))都是标准正交基,A矩阵可以让n维空间(C(v_1,cdots,v_n))投射到r(A)维空间中,即,将一组标准正交基((v_1,cdots,v_n))投射到((Av_1,cdots,Av_n)),而(dim (AV)= r(A))

(ineq j)时,(v_icdot v_j=v_i^Tv_j=0),若(v_i)(A^TA)的单位化的特征向量,则

[v_i^TA^TAv_j=v_i^Tlambda_jv_j=lambda_jv_i^Tv_j=0]

从而,

[Av_icdot Av_j=(Av_i)^TAv_j=v_i^TA^TAv_j=0]

表明新基是正交基,再将投射后的新的正交基单位化:

[u_i=frac {Av_i}{|Av_i|}=frac {Av_i}{sqrt{v_i^TA^TAv_i}}=frac {Av_i}{sqrt{lambda_iv_i^Tv_i}}=frac {Av_i}{sqrt {lambda_i}}]

所以(Av_i=sigma_i u_i,sigma_i=sqrt {lambda_i}),用矩阵表示:

[AV=U Sigma ]

(r(A)<n)时,对A的(v_1,cdots,v_{r(A)}),用A的零空间的n-r(A)个基(v_{r(A)+1},cdots,v_n)扩充成n个正交基

计算过程

[(A^TA)_{ntimes n}=VSigma^TU^TUSigma V^T=VSigma^TSigma V^T]

(r(A^TA)=r(A))

对n阶对角阵(A^TA)用正交阵对角化,便可得到(V=(v_1,cdots,v_n)),约定,(v_1,cdots,v_{r(A)})对应的特征值非零,对角阵(Lambda=Sigma^TSigma=mathrm{diag}(lambda_1,cdots,lambda_{r(A)},0,cdots,0))

从而(lambda_i=sigma_i^2,sigma_i=sqrt {lambda_i})被称为奇异值,由于(Lambda)有r(A)个非零元素,因此奇异值有r(A)个

[Sigma= begin{pmatrix} sigma_1\ & ddots\ && sigma_{r(A)}\ &&& 0 end{pmatrix}_{mtimes n}]

[(AA^T)_{mtimes m}=USigma V^TVSigma^T U^T=USigma Sigma^T U^T]

(AA^T)用正交阵对角化,得到(U=(u_1,cdots,u_m)),这里(Lambda=SigmaSigma^T=mathrm{diag}(lambda_1,cdots,lambda_{r(A)},0,cdots,0))

(lambda_ineq 0)(u_i)对应的(lambda_i)应该与(v_i)对应的(lambda_i)一致

SVD分解

[A=USigma V^T=(u_1,cdots,u_m) begin{pmatrix} sigma_1\ & ddots\ && sigma_{r(A)}\ &&& 0 end{pmatrix}_{mtimes n} begin{pmatrix} v_1^T\ vdots\ v_n^T end{pmatrix} ]
[ =(u_1,cdots,u_m) begin{pmatrix} sigma_1v_1^T\ vdots\ sigma_{r(A)}v_{r(A)}^T\ 0\ vdots\ 0 end{pmatrix} ]

[ =sum_{i=1}^{r(A)}sigma_iu_iv_i^T ]

从而将矩阵分解成了r(A)个秩1矩阵之和,每个秩1矩阵可以用一个奇异值(sigma_i)、两个向量(u_i,v_i)表示。若这里保留奇异值最大的前k个(sigma_i,u_i,v_i),则可以进一步压缩这个矩阵

转载于:https://www.cnblogs.com/qpswwww/p/9301602.html

最后

以上就是玩命白昼为你收集整理的MIT线性代数公开课学习笔记第26~30课二十六、对称矩阵及正定性二十七、复数矩阵和快速傅里叶变换二十七、正定矩阵和最小值二十九、相似矩阵与Jordan标准型三十、奇异值分解的全部内容,希望文章能够帮你解决MIT线性代数公开课学习笔记第26~30课二十六、对称矩阵及正定性二十七、复数矩阵和快速傅里叶变换二十七、正定矩阵和最小值二十九、相似矩阵与Jordan标准型三十、奇异值分解所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(48)

评论列表共有 0 条评论

立即
投稿
返回
顶部