切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第四篇 随机变量的数字特征
协方差
最后
更新:
2025-12-10 15:46
查看:
361
次
反馈
能力测评
会员8.2元/月
赞助
协方差
> 在前两节中,我们介绍了一维随机变量的数字特征.对于二维随机变量 $(X, Y)$ ,除了讨论随机变量 $X$ 和 $Y$ 各自的数学期望和方差,还需要研究描述 $X$ 与 $Y$ 之间相互关系的数字特征。例如,假设某品牌企业的广告支出 $X$ 和销售收入 $Y$ 都为随机变量,$X$ 和 $Y$ 往往是不独立的,需要分析 $X$ 与 $Y$ 之间的依赖关系,即相关性.本节介绍的协方差和相关系数就是用来描述 $X$ 与 $Y$ 之间相互关系的数字特征. ## 协方差的引入 想象两个人散步 假设有两个变量:A的身高变化 和 B的身高变化。我们每天测量一次。 - **情况一(正协方差)**:A长高时,B也长高;A变矮时,B也变矮。他们的身高**同向变化**。我们说他们的身高有**正相关**趋势。 - **情况二(负协方差)**:A长高时,B却变矮;A变矮时,B却长高。他们的身高**反向变化**。我们说他们的身高有**负相关**趋势。 - **情况三(零协方差)**:A长高或变矮,与B的变化**没有固定规律**。他们身高变化**不相关**。 > **协,就是协助的意思,彼此互相关联 协方差就是给这种“同向或反向”的程度,赋予一个具体的数值。** ### 方差 在方差里,我们得到了下面一个公式 $$ \begin{aligned} D(X \pm Y)= & E[(X \pm Y)-E(X \pm Y)]^2 \\ = & E[(X-E(X)) \pm(Y-E(Y))]^2 \\ = & E[X-E(X)]^2 \pm 2 E[(X-E(X))(Y -E(Y))]+E[Y-E(Y)]^2 \\ = & D(X)+D(Y) \pm 2 E[(X-E(X))(Y-E(Y))] . \end{aligned} $$ 即 $$ \boxed{ D(X \pm Y)=D(X)+D(Y) \pm 2 E[(X-E(X))(Y-E(Y))] ...(1) } $$ 如果我们记 $$ \operatorname{cov}(X, Y)=E[(X-E(X))(Y-E(Y))] $$ 那么(1)式就可以携程 $$ \boxed{ D(X \pm Y)=D(X)+D(Y) \pm 2 \operatorname{cov}(X, Y) ...(2) } $$ $\operatorname{cov}(X, Y) $ 就是协方差。 方差衡量的是随机变量围绕其均值的波动程度。 • 两个随机变量的和(或差)的方差,不仅取决于它们各自的方差,还取决于它们之间的相关性。 • 当 X 与 Y 正相关,$D(X+Y)$ 更大,因为一个变大时另一个也倾向于变大,波动加剧。 • 当 X 与 Y 负相关,$D(X+Y)$ 更小,因为一个变大时另一个倾向于变小,波动部分抵消。 • 对于 X-Y,如果 X 与 Y 正相关,相减时会部分抵消波动,所以 $D(X-Y)$ 会减小。 比如,A变高,B也变高,那么$A+B$会变的更高,自然数据波动更大,方差也更大。 比如,A变高,B变矮,那么$A+B$会变的矮些,因为B中和路A的部分数据,自然数据波动变小,也就是方差也变小。 ## 协方差定义 **定义** 设二维随机变量 $(X, Y)$ ,若 $E\{[X-E(X)][Y-E(Y)]\}$ 存在,则称它为随机变量 $X$ 与 $Y$ 的协方差,记为 $\operatorname{cov}(X, Y)$ ,或 $\sigma_{X Y}$ ,即 $$ \operatorname{cov}(X, Y)=E\{[X-E(X)][Y-E(Y)]\} $$ 当 $D(X)>0, D(Y)>0$ 时, $$ \rho_{X Y}=\frac{\operatorname{cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} $$ 称为随机变量 $X$ 与 $Y$ 的**相关系数**. 特别地, $$ \begin{gathered} \operatorname{cov}(X, X)=E\{[X-E(X)][X-E(X)]\}=D(X), \\ \operatorname{cov}(Y, Y)=E\{[Y-E(Y)][Y-E(Y)]\}=D(Y) . \end{gathered} $$ 故方差 $D(X), D(Y)$ 是协方差的特例. 当 $\rho_{X Y}=0$ 时,称随机变量 $X$ 与 $Y$ **不相关**或线性无关. 将随机变量 $X$ 与 $Y$ 标准化,得 $$ X^*=\frac{X-E(X)}{\sqrt{D(X)}}, Y^*=\frac{Y-E(Y)}{\sqrt{D(Y)}} $$ 由相关系数的定义,显然有 $$ \rho_{X Y}=\operatorname{cov}\left(X^*, Y^*\right) $$ 在实际应用当中,协方差和相关系数是用来描述随机变量 $X$ 与 $Y$ 之间线性相关方向和依赖程度的数字特征。 由协方差定义及数学期望的性质,可得协方差的计算公式 ## 协方差计算公式 $$ \boxed{ \operatorname{cov}(X, Y)=E(X Y)-E(X) E(Y) } $$ 这个协方差公式可以从**“实际乘积均值”和“独立假设下乘积均值”的差值**这个角度来通俗理解,我们一步步拆解: ### 1. 先明确每个符号的含义 - $E(X)$:随机变量$X$的**期望**,也就是$X$的“平均值”; - $E(Y)$:随机变量$Y$的“平均值”; - $E(XY)$:$X$和$Y$乘积的期望,即$X$与$Y$取值相乘后再取平均; - $\text{cov}(X,Y)$:$X$和$Y$的**协方差**,核心作用是衡量$X$和$Y$的“线性相关性”。 ### 2. 公式的本质:“实际联动” vs “独立联动” 我们可以把公式拆成两个部分来看: - **右边第一项$E(XY)$**:这是$X$和$Y$**实际取值**相乘后的平均水平,反映了它们真实的“联动乘积”情况。 - **右边第二项$E(X)E(Y)$**:如果$X$和$Y$是**相互独立**的随机变量,根据期望的性质,恰好有$E(XY)=E(X)E(Y)$。也就是说,这一项代表“$X$和$Y$完全没关系时,它们乘积的平均水平”。 因此,协方差$\text{cov}(X,Y)=E(XY)-E(X)E(Y)$,本质就是**“$X$和$Y$实际的乘积均值”减去“它们独立时的乘积均值”**,差值的正负和大小就体现了线性相关性: - 若$\text{cov}(X,Y)>0$:$E(XY)>E(X)E(Y)$,说明$X$偏大时$Y$也容易偏大(正线性相关); - 若$\text{cov}(X,Y)<0$:$E(XY)<E(X)E(Y)$,说明$X$偏大时$Y$容易偏小(负线性相关); - 若$\text{cov}(X,Y)=0$:$E(XY)=E(X)E(Y)$,说明$X$和$Y$**没有线性相关性**(但不代表独立,可能有非线性关联)。 ### 3. 举个通俗例子 假设$X$是“每天的气温”,$Y$是“每天的冰淇淋销量”: - 先算$E(X)$(气温平均值)、$E(Y)$(冰淇淋销量平均值),得到$E(X)E(Y)$(独立假设下的乘积均值); - 再算$E(XY)$(每天气温×销量的平均值),比如气温高的日子销量也高,会让$E(XY)$明显变大; - 两者的差值$\text{cov}(X,Y)$就会是正数,直观体现了“气温越高,冰淇淋销量越高”的正相关关系。 ### 数学推到 **离散型** 若 $(X, Y)$ 为离散型随机向量,其概率分布为 $$ P\left\{X=x_i, Y=y_j\right\}=p_{i j} \quad i, j=1,2, \cdots, $$ 则 $$ \operatorname{Cov}(X, Y)=\sum_i \sum_j\left[x_i-E(X)\right]\left[y_j-E(Y)\right] p_{i j} $$ **连续型** 若 $(X, Y)$ 为
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
方差的性质
下一篇:
相关系数
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com