切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第七篇 参数估计
点估计(矩估计法)
最后
更新:
2026-01-04 09:36
查看:
517
次
反馈
能力测评
会员8.2元/月
赞助
点估计(矩估计法)
## 估计方法 假设我们要估算全校初中生男生的平均身高,因为,我们不可能每个人都测量,只能随机的抽查部分人,假设得到下面10个学生身高数据 $$ 170,172,172,174,168,165,175,172,173,174 $$ 现在,我们要做的是,如何使用这10个样本数据来估算全校男生的平均身高。我们有下面几个方法: **(1)平均数法** $(170+172+172+174+168+165+175+172+173+174)/10 = 171.5 cm$ 即全校男生的平均身高为 171.5cm **(2)中位数法** 计算中位数的核心步骤是**先排序,再找中间位置的数值**,具体过程如下: 1. 将这组数据从小到大排序: $165, 168, 170, 171, 172, 172, 173, 174, 174, 175$ 2. 这组数据共有 $10$ 个(偶数个),中位数是**第 $\frac{10}{2}=5$ 位**和**第 $\frac{10}{2}+1=6$ 位**数值的平均值。 3. 第 5 位数值是 $172$,第 6 位数值也是 $172$。 中位数 $=\frac{172+172}{2}=172$ 这组数据的中位数是 **172**。即全校男生的平均身高为 172cm **(3)众数法** **众数**是一组数据中出现次数最多的数值。 1. 统计这组数据中每个数值的出现次数: | 数值 | 165 | 168 | 170 | 172 | 173 | 174 | 175 | |------|-----|-----|-----|-----|-----|-----|-----| | 次数 | 1 | 1 | 1 | 3 | 1 | 2 | 1 | 2. 可以看到,**172** 出现了 3 次,出现次数多于其他任何数值。 因此这组数据的众数是 **172**。即男生的平均身高为 172cm 在这些估计中,采用的方法不同,得到的结果并不同。**除非把全校男生都测量,否则,也许我们永远无法知道全校男生的平均身高(试想如果要估算全国男生的平均身高,那就真的无法每个人都测量)**。 我们知道,全校男生的真实的平均身高,身高的方差、身高的中位数,身高的众数等等肯定都是存在且唯一的,只是我们不知道而已。 ## 点估计 **定义**:若总体 $X$ 的分布已知,但它的一个或多个参数未知,则由总体 $X$ 的样本去估计未知参数的值,此类问题就属于参数的**点估计**。 例如,设总体 $X$ 的分布函数为 $F(x ; \theta)$ ,其中 $\theta$ 为未知参数,由样本 $X_1, X_2, \cdots, X_n$ 构造一个统计量 $$ \hat{\theta}\left(X_1, X_2, \cdots, X_n\right) $$ 去估计未知参数 $\theta$ ,这种方法称为**点估计**,$\hat{\theta}\left(X_1, X_2, \cdots, X_n\right)$ 称为参数 $\theta$ 的**估计量**.若 $x_1, x_2, \cdots, x_n$ 是一组样本观测值,则 $\hat{\theta}\left(x_1, x_2, \cdots, x_n\right)$ 称为参数 $\theta$ 的**估计值**. ## 矩估计法 要理解**矩估计法**,可以先记住它的核心逻辑:**用样本数据的“特征”去猜总体(所有数据)的“特征”**。这里的“特征”指的是“矩”——可以理解为数据的“平均趋势”“波动大小”等简单统计量。 ### 先搞懂:什么是“矩”? “矩”其实是数学里描述分布形状的工具,最常用的是**低阶矩**(容易计算,也能反映关键信息): 详细介绍见 [远点矩和中心矩](https://kb.kmath.cn/kbase/detail.aspx?id=557) - **一阶原点矩**:就是“平均值”(比如全班数学考试的平均分)。对总体来说,叫“总体均值”,记为 $\mu = E(X)$($E$ 表示“期望/平均”);对样本来说,叫“样本均值”,记为 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$($n$ 是样本量,$X_i$ 是第 $i$ 个样本值)。 - **二阶中心矩**:就是“方差”(比如全班成绩的波动大小)。总体方差记为 $\sigma^2 = Var(X) = E[(X-\mu)^2]$;样本方差记为 $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$(分母用 $n-1$ 是为了更准确,不过矩估计有时也用 $n$,看情况)。 ### 矩估计法的“通俗步骤”:用样本的“矩”代替总体的“矩” 矩估计的本质是**“替换思想”**:既然我们不知道总体的参数(比如总体的平均分 $\mu$、方差 $\sigma^2$),那就用样本的对应矩去“代替”它,解出未知参数。 举个超简单的例子: 假设我们知道某班数学成绩(总体)服从**正态分布** $N(\mu, \sigma^2)$,但不知道 $\mu$(总体平均分)和 $\sigma^2$(总体方差)是多少。现在我们抽了10个学生(样本),算出他们的平均分是80分($\bar{X}=80$),样本方差是25($S^2=25$)。 矩估计怎么用? 1. **列矩方程**:总体的“一阶原点矩”等于样本的“一阶原点矩”(因为样本矩是总体矩的“近似”),即 $\mu = \bar{X}$;总体的“二阶中心矩”等于样本的“二阶中心矩”,即 $\sigma^2 = S^2$(或 $\frac{n-1}{n}S^2$,看定义)。 2. **解参数**:把样本的矩代入,直接得到 $\hat{\mu} = 80$,$\hat{\sigma}^2 = 25$。这里的 $\hat{\mu}$ 和 $\hat{\sigma}^2$ 就是“矩估计值”——我们用样本猜出来的总体参数。 ### 矩估计法的“优缺点”(通俗说) - **优点**:简单直观!不需要复杂的数学推导,只要知道“总体矩和参数的关系”,用样本的矩一替换就能算出来,新手也容易上手。 - **缺点**:比较“粗糙”。因为它只用了“低阶矩”(比如均值、方差),没用到数据的高阶信息(比如偏度、峰度),所以估计精度可能不如最大似然估计等方法。但在很多情况下,“够简单”比“绝对精确”更重要。 ## 矩估计的具体步骤 设总体 $X$ 的分布函数 $F\left(x ; \theta_1, \cdots, \theta_k\right)$ 中含有 $k$ 个未知参数 $\theta_1, \cdots, \theta_k$, 则: (1) 设总体 $X$ 的前 $k$ 阶矩 $\mu_l=E\left(X^l\right) \quad(1 \leqslant l \leqslant k)$ 存在, 求出 $\mu_l=E\left(X^l\right) \quad(1 \leqslant l \leqslant k)$,一般都是这 $k$ 个未知参数的函数, 记为 $$ \mu_l=\mu_l\left(\theta_1, \cdots, \theta_k\right), \quad l=1,2, \cdots, k . $$ (2) 设 $A_l(1 \leqslant l \leqslant k)$ 为样本 $k$ 阶矩, 用样本矩去替换总体矩, 即 令 $$ \left\{\begin{array}{c} \mu_1\left(\theta_1, \cdots, \theta_k\right)=A_1 \\ \mu_2\left(\theta_1, \cdots, \theta_k\right)=A_2 \\ \vdots \\ \mu_l\left(\theta_1, \cdots, \theta_k\right)=A_l \end{array}\right. $$ (3) 求出上面方程组的解 $\hat{\theta}_1, \hat{\theta}_2, \cdots, \hat{\theta}_k$, 称 $\hat{\theta}_l=\hat{\theta}_l\left(X_1, X_2, \cdots, X_n\right)$ 为参数 $\theta_l(1 \leqslant l \leqslant k)$的矩估计量, $\hat{\theta}_l=\hat{\theta}_l\left(x_1, x_2, \cdots, x_n\right)$ 为参数 $\theta_l(1 \leqslant l \leqslant k)$ 的矩估计值. > **在做矩估计时,既可用原点矩也可用中心矩建立关于未知参数的方程组,而且矩的阶数有多种选择,因而矩估计是不唯一的.为了计算方便,在矩估计中应该尽量采用低阶矩给出未知参
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
参数估计概述
下一篇:
点估计(极大似然估计★★★★★)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com