科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
概率论与数理统计
第六篇 统计量和抽样分布
平均数、众数、分位数、中位数
最后
更新:
2025-06-08 21:38
查看:
337
次
反馈
同步训练
平均数、众数、分位数、中位数
## 平均数 平均数(mean)也称均值,它是一组数据相加后除以数据的个数得到的结果。平均数是度量数据集中趋势的常用统计量,在参数估计和假设检验中经常用到。 设一组样本数据为 $x_1, x_2, \cdots, x_n$ ,样本量(样本数据的个数)为 $n$ ,则样本平均数用 $\bar{x}$ 表示,计算公式为 $$ \bar{x}=\frac{x_1+x_2+\cdots+x_n}{n}=\frac{\sum_{i=1}^n x_i}{n} ...(4.1) $$ 式(4.1)也称为简单平均数(simple mean)。 `例`随机抽取 30 个消费者,得到他们每月网购金额的数据如表 4-1 所示。计算这 30 个人每月的平均网购金额。  $$ \bar{x}=\frac{429.0+671.2+\cdots+437.5+625.4}{30}=\frac{14668.5}{30}=488.95 $$ ## 加权平均数 >假设演员唱歌,由评委和观众打分,因为评委更专业,所以评委的分数占总分的60%,而观众比较业余,其打分的权重站40%, 这就是加权平均数的由来 如果样本数据被分成 $k$ 组,各组的组中值(一个组中的中间值,是组的下限值与上限值的平均数)分别用 $m_1, m_2, \cdots, m_k$ 表示,各组的频数分别用 $f_1, f_2, \cdots, f_k$ 表示,则样本平均数的计算公式为: $$ \bar{x}=\frac{m_1 f_1+m_2 f_2+\cdots+m_k f_k}{f_1+f_2+\cdots+f_k}=\frac{\sum_{i=1}^k m_i f_i}{n} ...(4.2) $$ 式(4.2)也称为加权平均数(weighted mean)(1) ## 中位数和四分位数 一组数据从小到大排序后,找出排在某个位置上的数值,并用该数值代表数据水平的高低,则这些位置上的数值就是相应的分位数(quantile),包括中位数,四分位数等。 ### 中位数 中位数(median)是一组数据排序后处在中间位置上的数值,用 $M_e$ 表示。中位数是用一个点将全部数据等分成两部分,每部分包含 $50 \%$ 的数据,一部分数据比中位数大,另一部分比中位数小。中位数是用中间位置上的值代表数据的水平,其特点是不受极端值的影响,在研究收人分配时很有用。 计算中位数时,要先对 $n$ 个数据从小到大进行排序,然后确定中位数的位置,最后确定中位数的具体数值。如果位置是整数值,中位数就是该位置所对应的数值;如果位置是整数加 0.5 的数值,中位数就是该位置两侧值的平均值。 设一组数据 $x_1, x_2, \cdots, x_n$ 从小到大排序后为 $x_{(1)}, x_{(2)}, \cdots, x_{(n)}$ ,则中位数就是 $(n+1) / 2$ 位置上的值。计算公式为: $$ M_e= \begin{cases}x_{\left(\frac{n+1}{2}\right)} & n \text { 为奇数 } \\ \frac{1}{2}\left\{x_{\left(\frac{n}{2}\right)}+x_{\left(\frac{n}{2}+1\right)}\right\} & n \text { 为偶数 }\end{cases} $$ ### 四分位数 四分位数(quartile)是一组数据排序后处于 $25 \%$ 和 $75 \%$ 位置上的数值。它是用 3个点将全部数据等分为 4 部分,其中每部分包含 $25 \%$ 的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在 $25 \%$ 位置上和处在 $75 \%$ 位置上的两个数值。 与中位数的计算方法类似,计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。与中位数不同的是,四分位数位置的确定方法有多种 ${ }^{(1)}$ ,每种方法得到的结果可能会有一定差异,但差异不会很大(一般相差不会超过一个位次)。由于不同软件的计算方法可能不一样,因此,对同一组数据使用不同软件得到的四分位数结果也可能会有所差异,但不会影响分析的结论。 设 $25 \%$ 位置上的四分位数为 $Q_{25 \%}, 75 \%$ 位置上的四分位数为 $Q_{75 \%}$ ,用 SPSS 计算四分位数位置的公式为: $$ Q_{25 \%} \text { 位置 }=\frac{n+1}{4}, \quad Q_{75 \%} \text { 位置 }=\frac{3(n+1)}{4} $$ 如果位置是整数,四分位数就是该位置对应的数值;如果是在整数加 0.5 的位置上,则取该位置两侧数值的平均数;如果是在整数加 0.25 或 0.75 的位置上,则四分位数等于该位置前面的数值加上按比例分摊的位置两侧数值的差值。 沿用例 4.1。计算 30 个消费者每月网购金额的四分位数。 --解 先对 $n$ 个数据从小到大排序,然后计算出四分位数的位置: $$ Q_{25 \%} \text { 位置 }=\frac{30+1}{4}=7.75, \quad Q_{75 \%} \text { 位置 }=\frac{3 \times(30+1)}{4}=23.25 $$ $Q_{25 \%}$ 在第 7 个数值(427.1)和第 8 个数值(429.0)之间 0.75 的位置上: $$ Q_{25 \%}=427.1+0.75 \times(429.0-427.1)=428.525 $$ $Q_{75 \%}$ 在第 23 个数值(540.1)和第 24 个数值(570.1)之间 0.25 的位置上: $$ Q_{25 \%}=540.1+0.25 \times(570.1-540.1)=547.6 $$ 由于 $Q_{25 \%}$ 和 $Q_{75 \%}$ 之间大约包含了 $50 \%$ 的数据,就上面 30 个消费者每月网购金额而言,可以说大约有一半人的每月网购金额在 $428.525 \sim 547.6$ 元之间。 ## 众数 除平均数,中位数和四分位数外,有时候也会使用众数作为数据集中趋势的度量。众数(mode)是一组数据中出现频数最多的数值,用 $M_o$ 表示。一般情况下,只有在数据量较大时众数才有意义。从分布的角度看,众数是一组数据分布的峰值点所对应的数值。如果数据的分布没有明显的峰值,众数可能不存在;如果有两个或多个峰值,也可以有两个或多个众数。就例 4.1 而言,出现金额最多的是 450 ,因此 $M_o=450$ 。 ## 几何平均数 几何平均
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
样本数据的整理与显示
下一篇:
全距、四分位距、方差、标准差
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com