科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
高中数学
第十二章:概率与统计
平均数、中位数与众数
最后
更新:
2025-05-27 05:44
查看:
381
次
反馈
同步训练
平均数、中位数与众数
## 平均数 平均数也称为均值,在统计学中具有重要的地位,是刻画一组数据集中趋势最主要的指标.若样本容量为 $n$ ,第 $i$ 个个体是 $x_i$ ,则样本平均数 $$ \boxed{ \bar{x}=\frac{x_1+x_2+\cdots+x_n}{n} } $$ 总体均值是总体的指标,是一个固定的量.而样本均值依赖于样本的选择,不同的样本通常有不同的样本均值.所以我们说样本均值带有随机性. 实践和理论都表明:在随机抽样的前提下,当样本容量增加时,样本均值 $\bar{x}$ 会向总体均值 $\mu$ 接近.于是,称 $\bar{x}$ 为 $\mu$ 的估计. `例`一种产品需要人工组装,现有 $A, B$ 两种可供选择的组装方法.为检验哪种方法生产效率更高,现随机抽取 29 名工人并随机分成两组:第一组 14 人,采用方法 $A$ 组装;第二组 15 人,采用方法 $B$ 组装。让两组工人在相同的时间内组装产品,得到产品数量(单位:个)如下表所示:  哪种组装方法的效率更高? 分析 平均数刻画了一组数据的平均水平.当我们要比较组装方法在相同时间内的效率时,可以分别计算用不同组装方法得到的产品数量的平均数,再通过平均数来进行比较。 解 设两组工人采用方法 $A, B$ 组装的平均产量分别为 $\bar{x}_A, \bar{x}_B$ ,则 $$ \begin{aligned} & \bar{x}_A=\frac{126+129+129+\cdots+125}{14}=128(\text { 个 }), \\ & \bar{x}_B=\frac{129+125+126+\cdots+125}{15}=126(\text { 个). } \end{aligned} $$ 由于在相同时间内,方法 $A$ 的平均产量高于方法 $B$ 的平均产量,所以我们可以认为方法 $A$ 的效率更高. `例` 表6-4 是某地统计局调查 100 个家庭月均用水量(单位:$t$ )的频率分布表,试估计该地家庭的月均用水量.   分析 要确定这 100 个家庭的月均用水量,就必须计算其总用水量.由于每组中的个体月用水量只是一个范围,因此可用各组区间的组中值(位于各组中央的值)近似地表示。 解(方法一) 100 个家庭的月总用水量约为 $$ 0.25 \times 4+0.75 \times 8+1.25 \times 15+1.75 \times 22+2.25 \times 25+2.75 \times 14+3.25 \times 6+ $$ 3. $75 \times 4+4.25 \times 2=202( t )$ , $$ 202 \div 100=2.02(t) . $$ 因此估计该地家庭的月均用水量为 2.02 t 。 (方法二)求组中值与对应频率之积的和. $$ \begin{aligned} \bar{x}= & 0.25 \times 0.04+0.75 \times 0.08+1.25 \times 0.15+1.75 \times \\ & 0.22+2.25 \times 0.25+2.75 \times 0.14+3.25 \times 0.06+ \\ & 3.75 \times 0.04+4.25 \times 0.02 \\ = & 2.02(t), \end{aligned} $$ 因此估计该地家庭的月均用水量为 2.02 t 。 > 例2 在计算平均数时,是用各组的组中值代表各组的实际数据.便用组中值进行计算的前提是假定各组数据在组内的分布是均匀的. 一般地,若取值为 $x_1, x_2, \cdots, x_n$ 的频率分别为 $f_1$ , $f_2, \cdots, f_n$ ,则其平均数为 $x_1 f_1+x_2 f_2+\cdots+x_n f_n$ . `例`某市进行家庭年收人调查时,分别对城镇家庭和农村家庭进行调查.在全部城镇的 85679 户中无放回地随机抽取了 350 户,在全部农村的 275692 户中无放回地随机抽取了 360 户。调查结果为:城镇家庭年平均收人是 35612 元,农村家庭年平均收人是 5623 元.试估计该市家庭年平均收入。 解 统计调查使用了分层抽样。设总体 $A$ 表示该市所有家庭的年收人,总体 $A$分为两层:第一层 $A_1$ 对应所有城镇家庭的年收人,第二层 $A_2$ 对应所有农村家庭的年收人。 用 $x_1$ 表示来自总体 $A_1$ 的样本均值,用 $x_2$ 表示来自总体 $A_2$ 的样本均值,则 $x_1=$ 35612 , $\bar{x}_2=5623$ . $A_1$ 在 $A$ 中所占的比例是 $$ W_1=\frac{85679}{85679+275692} \approx 0.2371 $$ $A_2$ 在 $A$ 中所占的比例是 $$ W_2=\frac{275692}{85679+275692} \approx 0.7629 . $$ 所以 $A$ 的总体均值的估计是 $$ \begin{aligned} X & =W_1 \bar{x}_1+W_2 \bar{x}_2 \\ & =0.2371 \times 35612+0.7629 \times 5623 \\ & \approx 12733 \end{aligned} $$ 即该市家庭年平均收人的估计是 12733 元. 在分层抽样中,用 $N$ 表示总体 $A$ 的个体总数,若将总体 $A$ 分为 $L$ 层,用 $N_i$ 表示第 $i$ 层 $(i=1,2, \cdots, L)$ 的个体总数,则有 $$ N=N_1+N_2+\cdots+N_L $$ 我们称 $$ W_i=\frac{N_i}{N}(i=1,2, \cdots, L) $$ 为第 $i$ 层的层权. 对 $i=1,2, \cdots, L$ ,用 $\bar{x}_i$ 表示从第 $i$ 层抽出样本的均值.我们称 $$ \bar{X}=W_1 \bar{x}_1+W_2 \bar{x}_2+\cdots+W_L \bar{x}_L $$ 是总体均值 $\mu$ 的简单估计. 分层抽样在获得总体均值估计的同时,也得到各层的均值估计.在例 3 中,不但得到了 $A$ 的均值估计,还得到了 $A_1$ 和 $A_2$ 的均值估计. ## 众数 **我们称观测数据中出现次数最多的数是众数**,用 $M_o$ 表示. 按照这个定义,在抽样调查中,样本中出现次数最多的数是样本的众数.如果观测数据中每个数出现的次数都相同,它就没有众数.一组数据可以有两个或多个众数。 众数作为一组数据的代表,能反映一组数据的集中趋势。 例如,某鞋店店主统计了一个月内销售各种尺码男鞋的数据,如下表所示:  从统计表可以看出,一个月内销售量最多的男鞋尺码是 25 cm ,即众数 $M_o=25$ ,这组数据的平均数 $\bar{x}=24.97$ ,此时,用平均数作为这组数据的代表值是没有实际意义的,而用众数作为顾客对男鞋所需尺寸的集中趋势的体现既便捷又符合实际。 众数是一个位置代表值,它不受数据组中极端值的影响。 ## 中位数 **将一组观测数据按从小到大的顺序排列后,我们称处于中间位置的数是中位数,用 $M_e$ 表示。** 具体而言,当数据的个数是奇数时,处于中间位置的数就是中位数;当数据
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
频率直方分布图
下一篇:
极差、方差与标准差
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com