计算方法B.裴玉茹.07.特征值与奇异值(2)

  • PPT(特征值)

特征值与奇异值

  • 特征值:Eigenvalue
  • 特征向量:Eigenvector

1. 定理

相似矩阵

  • 若存在非奇异矩阵 S,满足 A=S1BS,则称矩阵 A 与矩阵 B相似矩阵
  • 相似矩阵特征值相等
    • 假定 x0
    • 那么有 S1BSx=Ax=λx
    • BSx=SAx=λSx
    • 于是 λ 是矩阵 B 的特征值,Sx 是对应的特征向量

Schur 定理

  • A 为任意矩阵,存在非奇异矩阵 U 使得 T=U1AU,其中 T上三角矩阵对角线元素为矩阵 A特征值

  • 如果 A 是对称矩阵,则存在正交矩阵 Q 使得 D=Q1AQ=QTAQ,其中 D对角线矩阵对角线元素为矩阵 A特征值

  • 如果 Ux2=x2U 为酉矩阵,具有保范性质
    • 正交矩阵是酉矩阵

Jacobi 方法

  • 用于求解实对称矩阵的特征值
  • 通过旋转矩阵,构造相似矩阵
    • 如下是 QT

  • 旋转矩阵 Q:第 i,j 行出现和单位矩阵不一样的元素(cosθ,sinθ
  • B=Q1AQ,我们会发现 B 只有第 i,j 行和第 i,j 列和 A 不一样

[biibijbjibjj]=[cssc]T[aiiaijajiajj][cssc]

[bii00bjj]=[aiic2+ajjs2+2csaijcs(ajjaii)+aij(c2s2)cs(ajjaii)+aij(c2s2)ajjc2+aiis22csaij]

  • 整个矩阵结果如下

  • 思路:不断地消去非对角线元素
    • 正交变换 F 范数不变
    • 上述变换后,对角线上的元素平方和变大了,非对角线上元素的平方和变小了
    • 经过有限次变换,能够求得特征值

推论

  • 如果矩阵 A 为对称矩阵,其 n 个特征向量构成单位正交集,矩阵 A 的特征值为实数

正定性与特征值

  • 对称矩阵 A 为正定矩阵当且仅当矩阵 A 的所有特征值都是正数
    • 利用特征向量正交、线性即证
  • 证明

Gerschgorin 圆盘定理

  • k 个圆的并集指的是原本就相交形成的连通区域
  • 证明

2. 幂方法

  • note
  • 占优特征值
    • λ1=λ2==λk
    • λ1=λ2
      • 无法确定正负

逆幂方法

  • (AqI)1x 使用幂方法
    • q 的选择决定了收敛速度
    • q 与特征值 λk 越接近,收敛越快

3. 收缩方法

  • 在计算了主特征值的近似值后,可以通过紧缩获得矩阵其它特征值

Wielandt 收缩

  • 构造一个新的矩阵 B,其特征值除了占优特征值之外与 A 相同,其中占优特征值被替换为 0
    • 只有占有特征值与 A 不同

定理

  • 假设 λ1,,λnA 的特征值,其特征向量 v(1),,v(n),且 λ1 的重数为 1
  • x 为向量满足 xTv(1)=1,则矩阵 B=Aλ1v(1)xT
    • B 的特征值为 0,λ2,,λn,特征向量为 v(1),w(1),w(n)
    • v(i)=(λiλ1)w(i)+λ1xTw(i)v(1)

算法细节

  • 如何构造 x

  • 发现矩阵 B=Aλ1v(1)xT 的第 i 行全为 0
    • 代入即得
  • Bw=λw
    • 因此,w 的第 i 个分量是 0,所以 B 的第 i 列对解没有贡献,去掉第 i 行和第 i 列得到 (n1)×(n1) 矩阵 B
      • 行列式展开的角度也行
  • B 应用幂方法,得到 λ2w(2), 并插入 0 得到 w(2)
  • 问题:易受舍入误差影响

Householder 变换

  • P=I2wwT,其中 wTw=1,wRn
    • P对称正交矩阵

目标

  • 利用 Householder 方法计算对称三对角线矩阵 B,其与给定的对称矩阵 A 相似

步骤

  • 定义矩阵变换 P(1) 满足 A(2)=P(1)AP(1)
    • 显然 P(2) 是对称矩阵,P(1),A 都是对称矩阵
  • 试图在变换后保证
    • a11(2)=a11
      • w1=0 即可
    • aj1(2)=0,(j=3,,n)
  • 也就是说,利用 HouseHolder 变换将 (a21,a31,,an1)T 转换为 (α,0,,0)T

  • w^Ty^1×1 的,因此可以提前
求解参数
  • 计算具体的 α

(α,0,,0)=(a21rw2,a31rw3,,an1rwn) r=w^Ty^

α=a21rw2ai1rwi=0,i=3,,n

  • 2rwi 平方求和

4r2j=2nwj2=(a21α)2+j=3naj12

  • 左边:4r2(1w12)=4r2

4r2=2αa21+α2+j=2naj12

  • 再由 P 的正交性

α2=(P^y^)T(P^y^)=y^TP^TP^y^=y^Ty^=j=2naj12

  • 结合上面两个式子,得到

2r2=αa21+j=2naj12=αa21+α2

  • 可以求解得到 α,w

α=sgn(a21)j=2naj12

2r2=αa21+α2

w2=a21α2rwi=ai12r,i=3,,n

  • 之后的步骤类似前面的,收缩方法

4. QR 迭代

  • QR 方法
    • 同时确定对称矩阵所有特征值的矩阵约化方法
    • QR 方法可以生成一组矩阵 A=A(1),A(2),,A(n)
    • A(1)=A 分解为矩阵乘积 A(1)=Q(1)R(1)
      • Q(1) 为正交矩阵
      • R(1) 为上三角矩阵
    • A(2) 定义为 A(2)=R(1)Q(1)
    • 接着继续对 A(2) 进行 QR 分解
    • 可以得到 A(i+1)=(Q(i))TA(i)Q(i)
      • 相似变换,特征值不变
  • A(i+1)A(i) 具有相同的特征值,A(i+1) 变为对角线矩阵,其对角线上值为矩阵 A 的特征值

  • QA 的特征向量相同
    • AB=BA AB 具有相同的特征向量
  • 由于 Q 是正交矩阵,Q 的特征值为 ±1
  • 假设 Ax=λx,则有

λx=Ax=QRx=RQx=±Rx

  • 得出结论
    • A 的特征值与 A 的特征值相同
    • R 的特征值相同,即 R 的对角线元素(可能会差符号
    • Q 的特征向量相同

构造 QR

  • 考虑旋转矩阵
    • 旋转矩阵为正交矩阵
      • pii=pjj=cosθ,pji=pij=sinθ

三对角线稀疏矩阵

  • 矩阵 A 为三对角线矩阵 ,对其使用旋转矩阵进行 QR 分解
    • 让对角线以下元素变成 0
    • (1,3) 可能变为非零向量,(1,4)、(1,n) 为 0

  • 算法流程

  • 矩阵 A 三对角线最上面一条对角线不一定需要和最下面相同,不需要为 bn
  • 接着使用上面的方法进行迭代
  • A(2) 对角线以外的项比 A(1) 的相应项小,A(1) 更接近对角矩阵
  • 为什么 A(2) 还是三对角线矩阵 ?
    • A(2)=(Q(1))TA(1)Q(1)
    • 因为旋转矩阵只会影响行列 i,j
    • note
  • 收敛速度
    • 对于特征值|λ1|>|λ2|>>|λn|
    • A(i+1) 的元素 bj+1(i+1) 收敛到 0 的速度依赖于比值 |λj+1||λj|,接近于 1 的时候收敛速度较慢

平移方法(三对角线)

  • bn(i+1) 足够小,假设 λnan(i+1)
  • 删除矩阵的第 n 行与第 n 列,计算 λn1
  • 收敛速度依赖于 |λj+1s||λjs| , 一般为三阶收敛速度 平移需要加回到特征值