切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
高中数学
第十二章:概率与统计(高中)
相关系数
最后
更新:
2026-01-09 17:13
查看:
420
次
反馈
能力测评
会员8.2元/月
赞助
相关系数
散点图;相关系数
## 变量的相关关系 我们知道,一个人的体重与他的身高有关系.一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小。但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(correlation)。 两个变量具有相关关系的事例在现实中大量存在。例如: 1.子女身高 $y$ 与父亲身高 $x$ 之间的关系。 一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮.但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高。 2.商品销售收人 $y$ 与广告支出 $x$ 之间的关系.一般来说,广告支出越多,商品销售收人越高。但广告支出并不是决定商品销售收人的唯一因素,商品销售收人还与商品质量、居民收人等因素有关。 3.空气污染指数 $y$ 与汽车保有量 $x$ 之间的关系.一般来说,汽车保有量增加,空气污染指数会上升.但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业废气排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素. 4.粮食亩产量 $y$ 与施肥量 $x$ 之间的关系.在一定范围内,施肥量越大,粮食亩产量就越高。但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响。 因为在相关关系中,变量 $y$ 的值不能随变量 $x$ 的值的确定而唯一确定,所以我们无法直接用函数去描述变量之间的这种关系。对上述各例中两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断。"经验之中有规律",经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足。例如,不同经验的人对同一情形可能会得出不同结论,不是所有的情形都有经验可循等。因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断. > 在统计活动中,我们常常需要研究来自同一对象的两个相关变量的两组数据间的关系.例如,为考察某班学生的身高与体重的关系,首先需要对每个学生的身高和体重进行测量,得到两组数据:一组是反映"身高"这个变量的数据,另一组是反映"体重"这个变量的数据.我们把这样来自同一对象的两组数据称为**成对数据**.研究成对数据相关性的方法称为**相关分析** . ## 散点图 为了研究两个变量之间的关系,我们通常借助图象来探究. 案例 某校高二(一)班同学为检验"个子高的人,体重一定也重"这句话的准确程度,随机从本班同学中抽取了 12 名女生,测量出她们的身高与体重,得到下表所示数据: {WIDTH=600PX} 如图 4.1-1,我们以身高的取值为横坐标,以体重的取值为纵坐标,建立直角坐标系,则每对数据 $\left(H_i, W_i\right)$ 都可在直角坐标系中用一个点 $P_i(i=1,2, \cdots, 12)$表示.这些点称为**散点**,由坐标系及散点形成的数据图叫作**散点图**. {WIDTH=600PX} 散点图直观地描述了变量之间的关系形态,如图4.1-2是不同形态的散点图. {WIDTH=600PX} 如果两个变量之间的关系近似地表现为一条直线,则称它们有**线性相关关系**,简称为**相关关系**,如图4.1-2(a)(b); 如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们**线性相关**,这实际上就是函数关系,如图4.1-2(c)(d). 由散点图 4.1-1 可以直观地看出,女生的体重随身高的增加而增加,并且这些散点大致在一条直线附近.也就是说,从大体上看,女生的身高与体重之间具有相关关系。 相关关系可以分为 **正相关**、**负相关**和**不相关**,不相关因为是非线性的,通常称呼为两个变量是 **非线性关系**或**曲线关系**,如下图  ## 相关系数 通过散点图可以判断两个变量之间有无相关关系,但散点图不能准确反映变量之间的关系强度.因此,需要引人一个统计量——**相关系数**。 设由变量 $x$ 和 $y$ 获得的两组数据分别为 $x_i$ 和 $y_i(i=1,2, \cdots$ , $n)$ ,其对应关系如表 8-2 所示. {width=600px} 两组数据 $x_i$ 和 $y_i$ 的线性相关系数 是度量两个变量 $x$ 与 $y$ 之间线性相关程度的统计量,其计算公式为 $$ \boxed{ r=\dfrac{\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2 \sum_{i=1}^n\left(y_i-\b
免费注册看余下 70%
非VIP会员每天5篇文章,开通VIP 无限制查看
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
用频率分布直方图估计总体分布
下一篇:
多组成对数据的相关性
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com