科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
高中数学
第十二章:概率与统计
极差、方差与标准差
最后
更新:
2025-05-27 05:59
查看:
672
次
反馈
同步训练
极差、方差与标准差
## 极差 在统计学中,我们将一组数据中的最大值与最小值统称为极值,**将最大值与最小值之差称为极差**,也称全距,用 $R$ 表示。 例如,某地随机抽取 9 个家庭,调查得到每个家庭的人均月收人(单位:元)为 $$ 1080,750,1080,1080,850,960,2000,1250,1630, $$ 则 9 个家庭人均月收人的极差 $$ R=2000-750=1250 \text { (元). } $$ **极差反映了一组数据变化的幅度**,是描述数据离散程度的最简单的代表值,计算简单又易于理解,**但它容易受极端值的影响**。由于极差只利用了一组数据两端的信息,不能反映中间数据的离散状况,因而不能全面地描述数据的离散程度. ## 方差 学校从甲,乙两名射击运动员中选拔一人参加市中学生运动会,甲,乙两人参加测试的成绩(单位:环)如下: $$ \begin{aligned} & \text { 甲 }: 7,8,8,9,7,8,8,9,7,9 \\ & \text { 乙: } 6,8,7,7,8,9,10,7,9,9 \end{aligned} $$ 教练员该如何选出合适选手? 很自然地,我们首先考虑两人射击测试的平均成绩,经计算得 $$ \bar{x}_{\text {甲 }}=8.0, \quad \bar{x}_{\text {乙 }}=8.0, $$ 可见两人的平均成绩相同.那么是否意味着两个人的射击水平没有差异呢? 我们可以将甲,乙的射击成绩表示在图 6.4-2 中.  比较上面两幅图可以发现,甲的射击成绩大多集中在平均成绩 8 环的附近,而乙的射击成绩与平均成绩比较,波动较大。 **统计上,常采用方差来刻画一组数据波动的大小:若设 $y_1, y_2, \cdots, y_N$ 是总体的全部个体,$\mu$ 是总体均值,则称** $$ \boxed{ \sigma^2=\frac{\left(y_1-\mu\right)^2+\left(y_2-\mu\right)^2+\cdots+\left(y_N-\mu\right)^2}{N} } $$ **为总体方差或方差** > 总体方差 $\sigma^2$ 刻画了总体中的个体向总体均值 $\mu$ 的集中或离散的程度:方差越小,表明个体与均值 $\mu$ 的距离越近,个体向 $\mu$ 集中得越好。 总体方差 $\sigma^2$ 也刻画了总体中个体的稳定或波动的程度:方差越小,表明个体越整齐,波动越小。 类似地,若从总体中随机抽样,获得 $n$ 个观测数据 $x_1, x_2, \cdots, x_n$ ,用 $\bar{x}$ 表示这 $n$ 个数据的均值,则称 $$ \boxed { s^2=\frac{1}{n}\left[\left(x_1-\bar{x}\right)^2+\left(x_2-\bar{x}\right)^2+\cdots+\left(x_n-\bar{x}\right)^2\right] } $$ 为这 $n$ 个数据的样本方差,也简称为方差. 样本方差 $s^2$ 刻画了样本数据相对于样本均值 $\bar{x}$ 集中或离散的程度. 样本方差依赖于样本的选取,带有随机性.如果样本是随机抽取的,当样本容量较大时,样本方差是总体方差的估计. > **上面两个公式本质上是一样的,一个是总体方差,一个是样本方差。假设学校有1000人,我要求学校里全体学生的平均身高,最理想的是把这1000个学生身高都测量一下,这是总体的方差。但是很明显这不现实,因此,我随机抽取100人进行测量,然后用这100人的方差替代总体方差。** 下面,我们由获得的样本数据,并利用方差来分析甲,乙射击成绩的波动大小: $$ \begin{aligned} & s_{\text {甲 }}^2=\frac{1}{10}\left[(7-8)^2+(8-8)^2+\cdots+(9-8)^2\right]=0.6, \\ & s_乙^2=\frac{1}{10}\left[(6-8)^2+(8-8)^2+\cdots+(9-8)^2\right]=1.4 . \end{aligned} $$ 由于 $s_{\text {甲 }}^2<s_乙^2$ ,可以估计甲的射击成绩比乙更稳定,故可推荐甲参加运动会. `例` 某省农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲,乙两种水稻各 100 亩.待水稻成熟,分别从甲,乙的 100 亩水稻中随机抽取 10 亩水稻,它们的亩产量如下表所示.就产量这一指标来讲,试确定哪个品种的水稻在该地区更适合推广.  分析 为选择合适的水稻品种,从产量这一指标而言,可以从样本的平均亩产量与产量的稳定性两个角度来衡量。 解 使用计算器可算出甲,乙品种各 10 亩抽样水稻的平均亩产量为 $$ \bar{x}_{\text {甲 }}=885 kg, \quad \bar{x}_乙=885.1 kg . $$ 由于这 10 亩水稻是随机抽取的,而这两种水稻的样本均值相差很小,从而我们可以估计大面积种植这两种水稻后的平均亩产量也应相差很小。 借助计算器计算方差可得 $$ s_{\text {甲 }}^2=129.6, \quad s_乙^2=59.09 . $$ 由于 $s_{\text {乙 }}^2<s_{\text {甲 }}^2$ ,因此我们可以估计乙种水稻的亩产量要比甲种水稻稳定.综合以上两种因素,我们可以得出:在该地区,乙种水稻更有推广价值. `例`某校高一年级有男生 180 人,女生 120 人.某统计小组为调查本年级学生身高情况,采取分层抽样的方法从总体中随机抽取样本,其中男生抽取 18 人,女生抽取 12 人.将男生组看作样本 $A_1$ ,计算出样本 $A_1$ 的平均身高为 173.5 cm ,方差为 17 ;将女生组看作样本 $A_2$ ,计算出样本 $A_2$ 的平均身高为 164.0 cm ,方差为 30 .试根据以上数据计算由 $A_1, A_2$ 组成的样本 $A$ 的方差,并估计总体方差. 分析 按分层抽样获取的样本分为两层:男生组与女生组.现已知男生组样本和女生组样本的均值与方差,借助方差的定义可计算出分层抽样样本的方差,进而估计总体方差。 解 设从男生中抽出的样本个体为 $y_1, y_2, \cdots, y_{18}$ ,均值记为 $\bar{y}$ ,方差记为 $s_1^2$ ;从女生中抽取的样本个体为 $z_1, z_2, \cdots, z_{12}$ ,均值记为 $\bar{z}$ ,方差记为 $s_2^2$ . 先计算总样本均值 $\bar{x}$ : $$ \begin{aligned} \bar{x} & =\frac{y_1+y_2+\cdots+y_{18}+z_1+z_2+\cdots+z_{12}}{18+12} \\ & =\frac{18 \bar{y}+12 \bar{z}}{18+12} \\ & =\frac{18 \times 173.5+12 \times 164.0}{30} \\ & =169.7(cm) ; \end{aligned} $$ 再计算总样本方差: $$ \begin{aligned} s^2= & \frac{1}{30}\left[\left(y_1-\bar{x}\right)^2+\left(y_2-\bar{x}\right)^2+\cdots+\left(y_{18}-\bar{x}\right)^2+\right. \\ & \left.\left(z_1-\bar{x}\right)^2+\left(z_2-\bar{x}\right)^2+\cdots+\left(z_{12}-\bar{x}\right)^2\right] \\ = & \frac{1}{30}\left\{\sum_{i=1}^{18}\left[\left(y_i-\bar{y}\right)+(\bar{y}-\bar{x})\right]^2+\right. \\ & \left.\sum_{j=1}^{12}\left[\left(z_j-\bar{z}\right)+(\bar{z}-\bar{x})\right]^2\right\} \\ = & \frac{1}{30}\left\{\left[\sum_{i=1}^{18}\left(y_i-\bar{y}\right)^2+\sum_{i=1}^{18}(\bar{y}-\bar{x})^2\right]+\right. \\ & {\left.\left[\sum_{j=1}^{12}\left(z_j-\bar{z}\right)^2+\sum_{j=1}^{12}(\bar
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
平均数、中位数与众数
下一篇:
用频率分布直方图估计总体分布
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com