当前位置:首页 > 读后感 > 协方差和相关系数公式_相关系数与协方差的关系
 

协方差和相关系数公式_相关系数与协方差的关系

发布时间:2019-08-02 09:35:10 影响了:

探究协方差与相关系数

罗燕

摘要:协方差Cov(X,Y)是描述二维随机变量两个分量间相互关联程度的一个特征数,如果将协方差相应标准化变量就得到相关系数Corr(X,Y)。从而可以引进相关系数Corr(X,Y)去刻画二维随机变量两个分量间相互关联程度。且事实表明,相关系数明显被广泛应用。本文的目的在于从协方差与相关系数的关系的角度去探讨协方差与相关系数的优缺点,并具体介绍协方差和相关系数这两个描述二维随机变量间相关性的特征数。 关键字:协方差Cov(X,Y) 相关系数Corr(X,Y) 相互关联程度

1 协方差、相关系数的定义及性质

设(X ,Y)是一个二维随机变量,若E{ [ X-E(X) ] [ Y-E(Y) ] }存在,则称此数学期望为X与Y的协方差,并记为Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] },特别有Cov(X,X)=Var(X)。

从协方差的定义可以看出,它是X的偏差“X-E(X) ”与Y的偏差“Y-E(Y)”的乘积的数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下:

·当Cov(X,Y)>0时,称X与Y正相关,这时两个偏差 [ X-E(X) ] 与[ Y-E(Y) ] 同时增加或同时减少,由于E(X)与E(Y)都是常数,故等价于X与Y同时增加或同时减少,这就是正相关的含义。

·当Cov(X,Y)

·当Cov(X,Y)=0时,称X与Y不相关。

也就是说,协方差就是用来描述二维随机变量X与Y相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则Cov(X,Y)带有量纲(m·kg)。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义如下:

设(X ,Y)是一个二维随机变量,且Var(X)>0,Var(Y)>0.则称

Cov(X,Y)

(X)(Y)Cov(X,Y) Corr(X,Y)==σxσ y

为X与Y的(线性)相关系数。

利用施瓦茨不等式我们不难得到-1≤Corr(X,Y)≤1.也就是说相关系数是介于-1到1之间的,并且可以对它作以下几点说明:

·若Corr(X,Y)=0,则称X与Y不相关。不相关是指X与Y没有线性关系,但也有可能有其他关系,比如平方关系、立方关系等。

·若Corr(X,Y)=1,则称X与Y完全正相关;若Corr(X,Y)=-1,则称X与Y完全,负相关。

·若0

2 协方差与相关系数的一致性

从协方差与相关系数的定义和性质我们不难发现,协方差与相关系数都是反映X与Y相关程度的量。也就是说,他们有异曲同工之效。在刻画二维随机变量两个分量间相互关联程度时,他们保持了一致性。这一点我可以给出以下两个例子来说明。

例一 设随机变量X和Y独立同服从参数为λ的泊松分布,令

U=2X+Y, V=2X-Y。

求U和V的协方差及相关系数。

解:因为

Var(U)=Var(2X+Y)=5λ,Var(V)=Var(2X-Y)=5λ.

所以

Cov(U,V)=Cov(2X+Y,2X-Y)

=Cov(2X,2X)+Cov(Y,2X)-Cov(2X,Y)-Cov(Y,Y)

=3λ

由此得

Corr(U,V)=Cov(U,V)

(U)(V)=3λ

5λ=3

5

服从参数为λ的泊松分布中得λ>0,由协方差Cov(U,V)=3λ是恒大于0的,再由相关

3系数Corr(U,V)=,就很好的说明协方差与相关系数均可以反映二维随机变量关联程度。5

我们再看下一个例题,看能否能出这个结论呢?

例二 将一枚硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,试求X 和Y的协方差和相关系数。

解:因为X+Y=n,且X~b(n,1/2),Y~b(n,1/2),所以

n Var(X) =Var(Y)=, 4

n Cov(X,Y)=Cov(X ,n-X)=-Cov(X,X)=- 4

Corr(X,Y)= Cov(X,Y)

(X)(Y)=-n

n=-1

4

我们假定n=1,Cov(X,Y)=-1

4

我们可以得出,随着n的增大,协方差Cov(X,Y)就越来越小,随之X与Y的负相关性就表;n=100,Cov(X,Y)=-25;n=10000,Cov(X,Y)=-2500„„现得越来越强烈。就有limCov(X,Y)=-∞,X与Y间是完全负相关的。 n→∞

又由于Corr(X,Y)=-1,表明X与Y间是完全负相关的。其实,这个结论早就蕴含在线性关系式X+Y=n之中了。

综上,就说明:在某种情况下,协方差和相关系数在反映X与Y间的关联程度时保持

一致性。若是这样的话,研究相关系数似乎有点多余了。因为,我们已经有一个可以反映X与Y间的关联程度的量了(即协方差),那我们能否找出相关系数更优秀的地方呢? 3 协方差与相关系数的“矛盾性”

Corr(X,Y)越接近1,则线性相关程度越高;Corr(X,Y)越接近0,则线性相关程度越低。而协方差看不出这一点。若协方差很小,而其两个标准差σX和σY也很小,则其比

值就不一定小,下面我们来看实例。

例三 已知随机向量(X,Y)的联合密度函数为

8

3, 0

求X,Y的协方差及相关系数。

解:先计算两个边际密度函数,再分别计算E(X)、E(X2)、E(Y)、E(Y2)、 Var(X)、Var(Y)及E(XY)。

最后得协方差和相关系数为

Cov(X,Y)=E(XY)-E(X)E(Y)=0.0471

Corr(X,Y)=Cov(X,Y)p(x,y)={

σxσ=0.8243 y

这个协方差很小,但其相关系数并不小。从相关系数Corr(X,Y)=0.8243看,X与Y有相当程度的正相关;但从相应的协方差Cov(X,Y)=0.0471看,X与Y的相关性很微弱,几乎可以忽略不计。造成这种错觉的原因在于没有考虑标准差,若两个标准差都很小,即使协方差小一些,相关系数也能显示一定程度的相关性。由此可见,在协方差的基础上加工形成的相关系数是更为重要的相关性的特征数。

参考文献

[1] 茆诗松,程依明,濮晓龙.概率论与数理统计教程.北京:高等教育出版社,2004

[2] 董永权,王占民.关于相关系数ρ的几点注释.唐山 063000

[3] 谢明文,关于协方差、相关系数与相关性的关系.四川成都 610074

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3