在线学习
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
首页
教材
高考区
考研区
VIP
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
你好
游客,
登录
注册
在线学习
高中数学
第十二章:排列组合与概率统计
阅读:相关系数的几何意义
最后
更新:
2025-04-12 09:21
查看:
50
次
反馈
刷题
阅读:相关系数的几何意义
## 相关系数与向量夹角 在前面的统计案例中,我们通过引入相关系数,对成对数据进行分析,以刻画两个随机变量之间的相关性。若我们把两组成对数据分别看作 $n$ 维空间的两个向量 $\left(x_1, x_2, \cdots, x_n\right),\left(y_1, y_2, \cdots, y_n\right)$ ,而这两个向量的紧密程度可以从这两个向量的夹角大小来度量,因而我们可以设想一种度量方法,从夹角的大小来判断两组数据的相关程度。 由向量知识可知,向量夹角的大小可以用余弦来进行刻画,下面我们尝试着用余弦来刻画两个向量的相关关系。为了两个向量表达的一致性,通常将向量的每个元素都减去均值 ${ }^{(1)}$ ,形成 $$ a =\left(x_1-\bar{x}, x_2-\bar{x}, \cdots, x_n-\bar{x}\right), \quad b =\left(y_1-\bar{y}, y_2-\bar{y}, \cdots, y_n-\bar{y}\right), $$ 从而有 $$ \cos \langle a , b \rangle=\frac{ a \cdot b }{| a || b |}=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2 \cdot \sum_{i=1}^n\left(y_i-\bar{y}\right)^2}} . $$ 由上可知,用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的。 由向量知识可知,两向量夹角的取值范围为 $[0, \pi]$ ,其余弦值的取值范围为 $[-1,1]$ 。 当夹角属于 $\left[0, \frac{\pi}{2}\right)$ 时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低. 当夹角属于 $\left(\frac{\pi}{2}, \pi\right]$ 时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高. 当夹角为 $\frac{\pi}{2}$ 时,余弦值为 0 ,这说明两组数据不相关. 下面,我们借助这一思路来判断身高与体重案例中的两个随机变量的相关性.身高与体重案例中的数据如下表所示:  由于 $\bar{H}=165.5, \bar{W}=55$ ,将上表中的两组数据分别减去 $\bar{H}, \bar{W}$ ,记 $$ \begin{array}{llll} h =\left(\begin{array}{lll} H_1-\bar{H}, & H_2-\bar{H}, & \cdots, \\ \left.H_{12}-\bar{H}\right), \\ w & =\left(W_1-\bar{W},\right. & W_2-\bar{W}, \end{array},\right. & \left.W_{12}-\bar{W}\right), \end{array} $$ 则可得 $$ \begin{aligned} h = & (-6.5,-5.5,-4.5,-3.5,-1.5,-0.5,0.5,2.5, \\ & 2.5,4.5,5.5,6.5), \\ w = & (-3,-3,-2,-0.5,-1,-0.5,0,1,2,2,3,2), \end{aligned} $$ 于是有 $$ \begin{aligned} \cos \langle h , w \rangle & =\frac{(-6.5) \times(-3)+(-5.5) \times(-3)+\cdots+6.5 \times 2}{\sqrt{\left[(-6.5)^2+(-5.5)^2+\cdots+6.5^2\right]\left[(-3)^2+(-3)^2+\cdots+2^2\right]}} \\ & \approx 0.960 . \end{aligned} $$ 由此可以看出,其余弦值接近 1 ,也就是两向量的夹角接近 0 ,这说明这两组数据正相关程度高.
开VIP会员
非会员每天6篇,会员每天16篇,VIP会员无限制访问
题库训练
自我测评
投稿
上一篇:
阅读:敏感问题的统计
下一篇:
阅读:夹角余弦与文本分类
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。