为什么特征值是“沿对应的特征向量的数据的方差”?
答案:2 悬赏:30 手机版
解决时间 2021-02-10 08:31
- 提问者网友:你挡着我发光了
- 2021-02-10 03:39
为什么特征值是“沿对应的特征向量的数据的方差”?在一篇论文上看到的,觉得很诡异啊,为什么呢?
最佳答案
- 五星知识达人网友:七十二街
- 2021-02-10 05:04
首先,既然提到数据,我假设你是在做数据分析,特别是使用主成分法等因子分析方法时遇到这类问题,这也是这类问题最常见的出处。
那么统计模型是这样的,我有一列随机变量(X1,...,Xn)(一般写为列向量,这里写不出来,下均为列向量),对它们有很多观察值。现在我用正交标准形的办法来分解这一批随机变量,具体来讲,这列随机变量有协方差阵C=Cov(X1,...Xn)={Cov(Xi,Xj)}i x j,对此方阵,我们可以把它化为其正交标准型C = T * L * T' ,其中T是正交阵,即其转置T’也是它的逆,即: T * T' = T' * T = I(单位阵)。
具体如何分解涉及到线性代数的知识,这里只要知道任何对称矩阵C都可以分解成这种形式,中间的矩阵L被称为C的正交标准型,它有如下性质:
1, L是对角阵 2, L的对角线上的元素正好是矩阵C的各个特征值。
3, 这个特征值对应的特征向量,就是T’中的对应行/或等价的,T中的对应列。也就是说,如果用这一行(向量)乘以C,那么得到的结果是一个方向不变,长度乘以特征值后的向量。
以上是关于矩阵正交分解的知识,如果很熟悉,那下面就很自然:
数据分析中,对原数据(随机向量X)做变换 F = T' * X,那么F对应的协方差阵是 COV(F) = COV(T' * X) = T' * C * T = L。在因子分析中,我们把变换后的这一列新数据称为(相应特征向量对应的)因子,或者说特征向量方向的数据。比如说F的第一行,实际是T'的第一行(第一个特征向量)和列向量X的乘积,被称为第一个特征向量对应的数据。
我们为什么要做这一变换?因为变换后的数据的协方差阵是对角阵(L),即各因子间是正交的,也就是说没有因子间的互相影响,我们分析起来就简单很多。当然,很自然地,对角阵L对角线上的元素(特征值)就是对应因子的方差。
实际应用时,一开始的协方差矩阵C是由数据得出的样本协方差矩阵。后面的过程就水到渠成了。
那么统计模型是这样的,我有一列随机变量(X1,...,Xn)(一般写为列向量,这里写不出来,下均为列向量),对它们有很多观察值。现在我用正交标准形的办法来分解这一批随机变量,具体来讲,这列随机变量有协方差阵C=Cov(X1,...Xn)={Cov(Xi,Xj)}i x j,对此方阵,我们可以把它化为其正交标准型C = T * L * T' ,其中T是正交阵,即其转置T’也是它的逆,即: T * T' = T' * T = I(单位阵)。
具体如何分解涉及到线性代数的知识,这里只要知道任何对称矩阵C都可以分解成这种形式,中间的矩阵L被称为C的正交标准型,它有如下性质:
1, L是对角阵 2, L的对角线上的元素正好是矩阵C的各个特征值。
3, 这个特征值对应的特征向量,就是T’中的对应行/或等价的,T中的对应列。也就是说,如果用这一行(向量)乘以C,那么得到的结果是一个方向不变,长度乘以特征值后的向量。
以上是关于矩阵正交分解的知识,如果很熟悉,那下面就很自然:
数据分析中,对原数据(随机向量X)做变换 F = T' * X,那么F对应的协方差阵是 COV(F) = COV(T' * X) = T' * C * T = L。在因子分析中,我们把变换后的这一列新数据称为(相应特征向量对应的)因子,或者说特征向量方向的数据。比如说F的第一行,实际是T'的第一行(第一个特征向量)和列向量X的乘积,被称为第一个特征向量对应的数据。
我们为什么要做这一变换?因为变换后的数据的协方差阵是对角阵(L),即各因子间是正交的,也就是说没有因子间的互相影响,我们分析起来就简单很多。当然,很自然地,对角阵L对角线上的元素(特征值)就是对应因子的方差。
实际应用时,一开始的协方差矩阵C是由数据得出的样本协方差矩阵。后面的过程就水到渠成了。
全部回答
- 1楼网友:十年萤火照君眠
- 2021-02-10 05:19
我。。知。。道
加。。我。。私。。聊
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯