Skip to content

矩阵分解主要旨在简化矩阵,简化运算,同时剖析线性空间的结构,探求各类线性映射的本质, Jordan标准形理论已将空间结构叙述的较为清晰,完全解决了复方阵的相似标准形问题 见笔记 [[Jordan_form]]:Jordan标准型
下面是一些常见的另类分解
可能基于不同研究目的,基于不同的数域,基于不同的矩阵间的等价关系或是不同的特殊矩阵,也自然基于不同的研究方法

满秩分解

QR分解

复制自 [[Linear_space_with_Measurement]]:有度量的线性空间 ,即

定理·QR分解: 设 \(A\)\(n\) 阶实(复)矩阵, 则 \(A\) 可分解为

\[ A=QR \]

其中 \(Q\) 为正交(酉)矩阵, \(R\) 为一个主对角线上的元素均大于等于零的上三角阵, 如果 \(A\) 是非奇异阵, 则该分解方式唯一

Cholesky分解

Schur三角型

复制自 [[Linear_space_with_Measurement]]:有度量的线性空间 ,即

Schur定理: 设 \(V\)\(n\) 维酉空间, \(\varphi\)\(V\) 上的线性算子, 则存在 \(V\) 的一组标准正交基, 使 \(\varphi\) 在该组基下的矩阵为上三角阵, 即复矩阵必然可正交相似上三角化
[证明]
\(V\) 的维数归纳, \(n=1\) 时显然成立
假设对 \(n-1\) 维的酉空间结论成立, 那么对于 \(n\) 维酉空间, \(\varphi^{*}\) 总有特征值和特征向量, 设

\[ \varphi^{*}(e)=\lambda e \]

\(W=\langle e\rangle^{\perp}\) , 则 \(V=\langle e\rangle\oplus W\) , \(W\)\((\varphi^{*})^{*}=\varphi\) 的不变子空间, 由归纳假设, \(\varphi|_{W}\)\(n-1\) 维空间 \(W\) 上存在一组标准正交基 \(e_{1},...e_{n-1}\) 使得 \(\varphi|_{W}\) 在该组基下的矩阵为 \(n-1\) 阶的上三角矩阵, 在记 \(e_{n}=\frac{e}{||e||}\) , 则 \(\varphi\) 在基 \(e_{1},e_{2},...,e_{n}\) 下的矩阵为上三角矩阵
即证

LU分解

特征分解(ED)&谱分解(SD)

基本内容

特征分解就为矩阵的相似对角化
对于可对角化的矩阵 \(A\) , 我们已知其有 \(n\) 个线性无关的特征向量 \(\eta_k\) , \((A\eta_k=\lambda_k\eta_k)\)
即存在一组特征向量基 \(\eta_1,\eta_2,...,\eta_n\)
那么该矩阵满足

\[ A(\eta_1,\eta_2,\cdots,\eta_n)=(\lambda_1\eta_1,\lambda_2\eta_2,\cdots,\lambda_n\eta_n)=\underbrace{(\eta_1,\eta_2,\cdots,\eta_n)}_{P}\underbrace{\begin{bmatrix}\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&\lambda_n\end{bmatrix}}_{\Lambda} \]

即有

\[ A=P\Lambda P^{-1} \]

这就称为矩阵的特征分解

特殊矩阵的谱分解

正规矩阵

正规矩阵谱分解:
对于正规矩阵 \(A\in M_n\) , 做分解 \(A=U\Lambda U^*\) , 这里 \(U\) 为酉矩阵, \(\Lambda\) 为对角矩阵, 该表示法称为 \(A\) 的谱分解

在此之前,先给出所需的基本概念

定义: 矩阵 \(A\in M_n\) , 若 \(AA^*=A^*A\) , 则将 \(A\) 称为正规矩阵

为了接下来的讨论,下面是几个将会用到的性质
性质:
\((1)\)

引理: 设 \(A\in M_n\), \(A=\begin{bmatrix}A_{11}&A_{12}\\0&A_{22}\end{bmatrix}\) , \(A_{11}\)\(A_{22}\) 都为方阵, 则

\[ A为正规矩阵\iff A_{11},A_{22}为正规矩阵,且A_{12}=O \]

更一般的, 若 \(A\) 为分块上三角矩阵, 则

\[ A为正规矩阵\iff A的对角线上的分块矩阵都为正规矩阵,且对角线之外的矩阵都为零矩阵 \]

推论: 分块上三角矩阵为正规矩阵当且仅当它为分块对角矩阵

定理: 设 \(A=(a_{ij})\in M_n\) , 特征值为 \(\lambda_1,\lambda_2,...,\lambda_n\) , 则下面的命题等价:
\((a)\) \(A\) 为正规阵
\((b)\) \(A\) 可以酉对角化
\((c)\) \(\sum_{i=1}^n\sum_{j=1}^n|a_{ij}|^2=\sum_{k=1}^n|\lambda_k|^2\)
\((d)\) \(A\)\(n\) 个标准正交的特征向量

对称矩阵

奇异值分解(SVD)

实数域下

定义: 设 \(A\)\(m\times n\) 实矩阵, 如果存在非负实数 \(\sigma\)\(n\) 维非零实列向量 \(\alpha\) , \(m\) 维非零实列向量 \(\beta\)
使得

\[ A\alpha=\sigma\beta,\qquad A^{\mathrm T}\beta=\sigma\alpha \]

\(\sigma\) 称为 \(A\)奇异值, \(\alpha\) , \(\beta\) 分别称为 \(A\) 关于 \(\sigma\)右奇异值向量左奇异值向量,

下面将从几何意义上描述奇异值的问题,类似于线性变换中的伴随概念,下面给出一般的线性映射的伴随概念

定义: 设 \(V,U\) 分别为 \(n\) 维, \(m\) 维Euclid空间, \(\varphi\)\(V\to U\) 的线性映射, 若有 \(U\to V\) 的线性映射 \(\varphi^*\) , 使对任意的 \(v\in V,u\in U\) , 都有

\[ (\varphi(v),u)=(v,\varphi^*(u)) \]

成立, 则称 \(\varphi^*\)\(\varphi\)伴随

定理: 设 \(V,U\) 分别是 \(n\) 维, \(m\) 维Euclid空间, \(\varphi\)\(V\to U\) 的线性映射, 则 \(\varphi\) 存在唯一伴随 \(\varphi^*\)

若取定 \(V\) 的基 \(v_1,v_2,...,v_n\)\(U\) 的基 \(u_1,u_2,...,u_m\)
\(\varphi\) 在这两组基下的矩阵为 \(A=(\alpha_1,\alpha_2,\cdots,\alpha_n)\)
则可证明 \(\varphi^*\) 在这两组基下的矩阵为 \(A^{\mathrm T}\) ,直接构造出即可证明存在性,唯一性类似于线性变换的情况也容易证明

于是奇异值和奇异向量也可以带有几何意义的如下定义

\[ \varphi(v)=\sigma u,\quad\varphi^*(u)=\sigma v \]

这里 \(\sigma\geq0\) , \(v\in V\) , \(u\in U\) 均为非零向量,可以验证 \(\varphi^{*}\varphi\)\(V\) 上的半正定自伴随算子,\(\varphi\varphi^{*}\)\(U\) 上的半正定自伴随算子,并且有

\[ \begin{align}\varphi^{*}\varphi(v)&=\varphi^{*}(\sigma u)=\sigma^{2}v\\\varphi\varphi^{*}(u)&=\varphi(\sigma v)=\sigma^{2}u\end{align} \]

这就说明了 \(v\) 为属于特征值 \(\sigma^{2}\)\(\varphi^{*}\varphi\) 的特征向量, \(u\) 为属于特征值 \(\sigma^{2}\)\(\varphi\varphi^{*}\) 的特征向量

定理·奇异值分解: \((i)\)\(V,U\) 分别为 \(n\) 维, \(m\) 维欧式空间, \(\varphi\)\(V\to U\) 的线性映射, 则存在 \(V\)\(U\) 的标准正交基, 使得 \(\varphi\) 在这两组基下的矩阵为

\[ \begin{bmatrix}S&O\\O&O\end{bmatrix} \]

其中

\[ S=\begin{bmatrix}\sigma_{1}& \ & \ & \ \\ \ &\sigma_{2}&\ &\ \\ \ & \ &\ddots&\ \\ \ &\ &\ &\sigma_r\end{bmatrix} \]

是一个 \(r\) 阶对角阵, \(\sigma_{1}\geq\sigma_{2}\geq\cdots\geq\sigma_{r}>0\)\(\varphi\) 的非零奇异值;
\((ii)\) 对于任意的 \(m\times n\) 的实矩阵 \(A\) , 存在 \(m\) 阶正交矩阵 \(P\)\(n\) 阶正交矩阵 \(Q\) , 使得

\[ P^{'}AQ=\begin{bmatrix}S&O\\O&O\end{bmatrix} \]

其中

\[ S=\begin{bmatrix}\sigma_{1}& \ & \ & \ \\ \ &\sigma_{2}&\ &\ \\ \ & \ &\ddots&\ \\ \ &\ &\ &\sigma_r\end{bmatrix} \]

是一个 \(r\) 阶对角阵, \(\sigma_{1}\geq\sigma_{2}\geq\cdots\geq\sigma_{r}>0\)\(A\) 的非零奇异值
[证明]:
\((i)\) 由于 \(\varphi^{*}\varphi\)\(V\) 上的半正定自伴随算子, 故存在 \(V\) 上的一组标准正交基 \(e_{1},e_{2},...,e_{n}\) 使得 \(\varphi^{*}\varphi\) 在该组基下的矩阵为 \(n\) 阶对角阵 \(\mathrm{diag}\{\lambda_{1},\cdots,\lambda_{r},0,\cdots,0\}\) , 其中 \(r=\mathrm{rank}(\varphi^{*}\varphi)=\mathrm{rank}(\varphi)\)\(\lambda_{1}\geq\lambda_{2}\geq\cdots\geq\lambda_{r}>0\)\(\varphi^{*}\varphi\) 的正特征值, 因而有

\[ \varphi^{*}\varphi(e_{i})=\begin{cases}\lambda_{i}e_{i}\qquad&, 1\leq i\leq r\\0\qquad&,r+1\leq i\leq n\end{cases} \]

\(\sigma_{i}=\sqrt{\lambda_{i}}\) , \((i=1,2,...,r)\) ,
\(1\leq i\leq r\) 时, 注意到

\[ ||\varphi(e_{i})||^{2}=(\varphi(e_{i}),\varphi(e_{i}))=(\varphi^{*}\varphi(e_{i}),e_{i})=\lambda_{i}(e_{i},e_{i})=\sigma_{i}^{2} \]

得到 \(||\varphi(e_{i})||=\sigma_{i}\)
\(r+1\leq j\leq n\) 时, 有

\[ ||\varphi(e_{j})||^{2}=(\varphi(e_{j}),\varphi(e_{j}))=(\varphi^{*}\varphi(e_{j}),e_{j})=(0,e_{j})=0 \]

\(\varphi(e_{j})=0\)

\[ f_{i}=\frac{1}{\sigma_{i}}\varphi(e_{i}),\quad i=1,2,...,r \]

\(f_{1},f_{2},...,f_{r}\) 为单位化的两两正交的单位向量组, 将其扩充为 \(U\) 的一组标准正交基

\[ \{f_{1},f_{2},\cdots,f_{r},f_{r+1},\cdots,f_{m}\} \]

现在得到

\[ \varphi(e_{i})=\begin{cases}\sigma_{i}f_{i}\qquad&,1\leq i\leq r\\0\qquad&,r+1\leq i\leq n\end{cases} \]

以及

\[ \varphi^{*}(f_{i})=\begin{cases}\sigma_{i}e_{i}\qquad&,1\leq i\leq r\\0\qquad&,r+1\leq i\leq m\end{cases} \]

由于有

\[ \varphi(e_{1},e_{2},\cdots,e_{n})=(f_{1},f_{2},\cdots,f_{m})\begin{bmatrix}S&O\\O&O\end{bmatrix}_{m\times n} \]

于是 \(\varphi\) 在这两组基下的矩阵为

\[ S=\begin{bmatrix}\sigma_{1}& \ & \ & \ \\ \ &\sigma_{2}&\ &\ \\ \ & \ &\ddots&\ \\ \ &\ &\ &\sigma_r\end{bmatrix} \]

即证
\((ii)\) 关于矩阵的结论则立即可以得到

将矩阵 \(A\) 分解为 \(P\begin{bmatrix}S&O\\O&O\end{bmatrix}Q^{'}\) ,称为 \(A\)奇异值分解(SVD),表示成 \(P^{'}AQ=\begin{bmatrix}S&O\\O&O\end{bmatrix}\) , 则叫做 \(A\)正交相抵标准型

计算奇异值分解的步骤
对于给定的 \(m\times n\) 阶矩阵 \(A\) , 求出矩阵 \(A^{T}A\) 的正交相似标准型

\[ Q^{T}A^{T}AQ=\Lambda=\mathrm{diag}\{\lambda_{1},\lambda_2,\cdots,\lambda_{r},0,\cdots,0\} \]

这里 \(Q=(\alpha_{1},\cdots,\alpha_{n})\) 为正交矩阵, 并且列向量组满足 \(A^{T}A\alpha_{k}=\lambda_{k}\alpha_{k}\)
\(\sigma_{k}=\sqrt{\lambda_{k}}\) , \(\beta_{k}=\frac{1}{\sigma_{k}}A\alpha_{k}\) , \((k=1,...,r)\) ,
\(r<k\leq m\) 时, \(\beta_{k}\)\(\beta_{1},...,\beta_{r}\) 任意的扩充得到一组标准正交基 \(\beta_{1},...,\beta_{m}\)
再记 \(P=(\beta_{1},\cdots,\beta_{m})\) , 就应有 \(AQ=P\Sigma\) , 其中 \(\Sigma=\mathrm{diag}\{\sigma_{1},\cdots,\sigma_{r},0,\cdots,0\}\) , 就有了

\[ A=P\Sigma Q^{T} \]

这里一般可排序 \(\sigma_{1}\geq\sigma_{2}\geq\cdots\geq\sigma_{r}>0\) , 显然 \(\Sigma\) 唯一, 但 \(P,Q\) 都不唯一

复数域下

奇异值分解: 给定 \(A\in M_{n\times m}\) , 令 \(q=\min\{m,n\}\) , 设 \(r=\mathrm{rank}\,A\) , 则:
\((a)\) 存在酉矩阵 \(V\in M_n\) , \(W\in M_m\) , 以及对角阵

\[ \Sigma_q=\begin{bmatrix}\sigma_1& \ &0\\ \ & \ddots & \ \\0& \ &\sigma_q\end{bmatrix} \]

使得 \(\sigma_1\geq\sigma_2\geq\cdots\geq\sigma_r>0=\sigma_{r+1}=\cdots=\sigma_q\) 以及 \(A=V\Sigma W^*\) , 其中这里 \(\Sigma\) 为:

\[ \Sigma=\begin{cases}\Sigma_q\qquad\qquad& m=n\\\\\begin{bmatrix}\Sigma_q&0\end{bmatrix}\in M_{n\times m}\qquad\qquad&m>n\\\\\begin{bmatrix}\Sigma_q\\0\end{bmatrix}\in M_{n\times m}\qquad\qquad&m<n\end{cases} \]

\((b)\) 其中的参数 \(\sigma_1,...,\sigma_q\)\(AA^*\) 或是 \(A^*A\) 的非零特征值的正平方根的递减排列
上面方阵 \(\Sigma_q\) 的对角元素 \(\sigma_1,...,\sigma_q\) 称为 \(A\)奇异值, \(A\) 的奇异值 \(\sigma\) 的重数是 \(\sigma^2\) 作为 \(AA^*\) 的特征值的重数. 如果 \(\sigma^2\)\(AA^*\) 的一个单重特征值, 则将 \(A\) 的奇异值 \(\sigma\) 称为是单重的, 显然有 \(A\) 的秩等于其非零奇异值的个数, 而 \(A\) 的秩不小于 \(A\) 的非零特征值的个数, 除奇异值排序外, 对角因子 \(\Sigma\) 唯一
[证明]:
\((\mathrm{I})\)\(m=n\) 时, Hermite矩阵 \(AA^*\in M_n\)\(A^*A\in M_n\) 有同样的特征值, 从而它们酉相似, 故存在酉矩阵 \(U\) , 使得 \(A^*A=U(AA^*)U^*\) , 那么

\[ (UA)^*(UA)=A^*U^*UA=A^*A=U(AA^*)U^*=(UA)(UA)^* \]

因此 \(UA\) 为正规矩阵, 设 \(\lambda_k=|\lambda_k|e^{i\theta_k}\) \((k=1,2,...,n)\)\(UA\) 的特征值, 且 \(|\lambda_1|\geq\cdots\geq|\lambda_n|\) ,设 \(r=\mathrm{rank}\,A=\mathrm{rank}\,UA\) , 那么 \(r\)\(UA\) 的非零特征值的个数
那么 \(\lambda_j>0\,(j\leq r)\) , \(\lambda_j=0\,(r+1\leq j\leq n)\) ,
\(\Lambda=\mathrm{diag}\{\lambda_1,\cdots,\lambda_n\}\) , 令 \(D=\mathrm{diag}\{e^{i\theta_1},\cdots,e^{i\theta_n}\}\) , \(\Sigma_q=\mathrm{diag}\{|\lambda_1|,\cdots,|\lambda_n|\}\) , 那么 \(\Lambda=\Sigma_qD\)
设酉矩阵 \(X\) , 使得 \(UA=X\Lambda X^*\) , 即得到

\[ A=U^*X\Lambda X^*=U^*X\Sigma_qDX^*=(U^*X)\Sigma_q(DX^*) \]

这里记 \(V=U^*X\) , \(W=XD^*\) , 即得 \(A=V\Sigma_qW^*\) ,
\(V^*V=X^*UU^*X=X^*X=I\) , \(W^*W=DX^*XD^*=DD^*=I\) , 因此 \(V\)\(W\) 都为酉矩阵
\((\mathrm{II})\)\(m>n\) 时, 由于有 \(r\leq n\) , 故

CS分解

极分解