数据科学|为何QR分解收敛于特征值数据科学|机器学习

QR分解求特征值的方法很简单，计算过程如下：

文章图片

文章图片

QR本身可以看作一个将矩阵A转化为上三角矩阵R的过程，通过householder，givens转换等手段，构造一系列的变换矩阵T，将矩阵转换为上三角矩阵R，而变换矩阵的逆矩阵则构成了Q。一定条件下，经过n次迭代后，迭代矩阵An会神奇的收敛成一个上三角矩阵，其对角阵对应的元素就是An的特征值，也是原始矩阵A的特征值，是不是很神奇。那么为什么会收敛成这样呢？直觉上，这是一种幂法，经过不断地迭代，使得特征值保留下来，非特征值部分要么变大，要么收敛为0。事实上，这种求特征值地方法确实属于一种特殊地幂法。我们所知道地幂法和反幂法都是针对最大或者最小的特征值来的，像QR这种一网打尽的方式，实在难以想象。为什么QR这种迭代方式会最终收敛到特征值呢？我找了国内外不少网站，也没有找到浅显的解释。这里将这几天找到的资料整理一下，按照自己的理解说一下。
这个问题看来是一个复杂的问题，所以这里简化了它的收敛证明过程。考虑一种比较特殊的矩阵QR分解形式
假定矩阵A满足以下两个条件
1.A是对称正定矩阵，且特征值各不相同，保证了QR分解的唯一性
2.A可以表示为
文章图片
,
文章图片
且有
文章图片
，L为下三角矩阵，L的对角线全部为1，U为上三角矩阵

另外，需要知道以下几点性质
1.上三角矩阵乘以上三角矩阵仍然是上三角矩阵，对于下三角矩阵也是同理
2.上三角矩阵求逆，仍然是上三角矩阵，对于下三角矩阵也是同理
首先，求得
文章图片
的推导公式
$数据科学|为何QR分解收敛于特征值$
文章图片

假设我们的问题中
文章图片
收敛成立，最终可以得到
文章图片
,只要能证明这一点就行了，但是最关键的是想看到幂法是如何其作用的。
令
文章图片

文章图片

令
文章图片
,代入上式

文章图片

其中，
文章图片

由此可以得到
文章图片
，于是有
文章图片

其中，
文章图片
分别为正交矩阵和上三角矩阵，由QR分解的唯一性可以知道，
文章图片
，
文章图片

再来看看
文章图片

文章图片

我们可以看到，QR迭代过程，可以看作消去Q矩阵的过程。像幂法一样，QR也有平移的算法，以上介绍的是非平移的算法过程。由于A是对称正定矩阵，最终分解得到了对角阵，而不是上三角矩阵。为了尽量的描述简单，加了不少苛刻的条件，下面将条件稍微放宽些，A只是正定，不再是对称，其他条件保持不变，于是
文章图片
不再成立。

文章图片

由于
文章图片

文章图片

文章图片

由于
文章图片
，
文章图片

令
文章图片
,毫无疑问，M，R和T都是上三角矩阵，且有
文章图片
,可以看到M的对角线元素收敛于特征值。
上面就是QR收敛的证明过程，证明过程并不严密，且由于条件特殊，并不具备普遍性。确实如此，这个算法本身收敛性是有限制的，并非对所有矩阵都能满足。要做到普遍适用，应该要用到移位的QR算法。

参考：
https://www.zhihu.com/question/54455860
https://people.kth.se/~eliasj/qrmethod.pdf
【数据科学|为何QR分解收敛于特征值】http://pi.math.cornell.edu/~web6140/TopTenAlgorithms/QRalgorithm.html

数据科学|为何QR分解收敛于特征值

推荐阅读

刷牙是先漱口还是直接刷

ig蕉太狼是中国人吗 ig队员国籍

商业模式是什么意思

西门子e36故障

ts3300显示p08问题的解决方法

天堂鸟的叶子边变焦了,要剪掉吗天堂鸟叶子焦边的原因是什么

电商思维图是什么意思呀电商思维图是什么意思，电商思维图是什么意思啊

小米ai音箱可以改名字吗（小米ai音箱能够自己改名字吗）

我给女儿当婆婆请你不要尝试做婆婆的女儿

phpcmsjquery的简单介绍

基因肽能调理哪些症状

高铁一等座的桌子在哪

竹子可以放阳台养吗阳台种的竹子有毒吗

石墨烯一般用在哪里石墨烯可以用了吗

一周减肥餐分享一日三餐营养搭配减肥餐

月子中心|省省吧，月子中心最大的作用就是炫富

丽字五行属什么丽字五行属啥

冬天空调多少度最热

如何给六年级孩子制定计划

IG冠军皮肤可以免费领？LOL策划终于良心发现,如何免费领？