在线学习
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
题库
教材
高考区
考研区
VIP
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
你好
游客,
登录
注册
在线学习
概率论与数理统计
第八篇 参数估计
区间估计(置信区间)
最后
更新:
2024-11-21 20:31
查看:
328
次
反馈
刷题
区间估计(置信区间)
## 置信区间定义 设 $\left(X_1, X_2 \cdots, X_n\right)$ 是来自总体 $f(x, \theta)$ 的样本,其中参数 $\theta \in \Theta$ 末知,对给定 的 $0<\alpha<1$ ,若存在统计量 $\theta_1\left(X_1, \cdots, X_n\right) \leq \theta_2\left(X_1, \cdots, X_n\right)$, 使得 $$ P\left(\theta_1 \left(X_1, \cdots, X_n\right) \leq \theta \leq \theta_2\left(X_1, \cdots, X_n\right)\right) \geq 1-\alpha $$ 那么称随机区间 $\left[\theta_1\left(X_1, \cdots, X_n\right), \theta_2 \left(X_1, \cdots, X_n\right)\right]$ 为 $\theta$ 的双侧 $1-\alpha$ **置信区间**; 称 $1-\alpha$ 为 **置信水平**; 称 $\theta_1 $ 为 $\theta$ 的双侧 $1-\alpha$ 置信区间的下限; 称 $\theta_2$ 为 $\theta$ 的双侧 $1-\alpha$ 置信区间的上限, 简称双侧置信下限或者上限. 抽样以后就得到置信区间的观测值: $$ \left[\theta_1 \left(x_1, \cdots, x_n\right), \theta_2\left(x_1, \cdots, x_n\right)\right] $$ ## 置信区间的通俗解释 我们通常使用学生的身高来解释置信区间,假设学校初中生的身高分布服从如下正态分布 $(\mu=145, \sigma=1.4)$ : $ X \sim N\left(145,1.4^2\right)$ 也就是说全体人类的平均身高为 145 cm ,为了表示只有上帝可以看到,我把**真实分布**用虚线来表示: {width=400px} 我们不可能把每个学生身高都测量出来,我们只能在人群中抽样统计,比如下面是一次抽样数据,我把算出来的样本均值(记作 $\hat{\mu}$ ) 画在图上(**蓝色的点**): {width=430px} $\hat{\mu}$ 就是对真实的 $\mu$ 的一次点估计。通过一次次的抽样,我们可以算出不同的身高均值的点估计: {width=400px} **上图是在知道真实值的情况下,如果没有真实值,我们其实并不容易分辨不出哪个点估计更好**: {width=400px} 为此提出了置信区间,他提供了一种区间估计的方法。想象一下,我们拿一把尺子,尺子中心点对准采样的样本点,那么尺子左端点和右端点形成一个区间,这个区间称作置信区间。 下面采用 $95 \%$ 置信区间来构造区间估计 {width=400px} 关闭真实值的置信区间是如下的样子。 {width=400px} 上图显示有7把“尺子”,在关闭真实值的情况下,我们要从这7把尺子里找到最符合真实值的区间,这就是我们本节要研究的工作。 ## 置信区间估计 置信区间,提供了一种区间估计的方法。下面采用 $95 \%$ 置信区间来构造区间估计。也就是尽可能这个尺子套在95%的可能性范围内。 {width=400px} 通过 $95 \%$ 置信区间构造出来的区间,我们可以看到,基本上都包含了真实的 ${ }^\mu$ ,除了红色的那根。 关闭上帝视角,我们仍然不知道哪一个区间估计更好: {width=400px} 但是,和点估计比较: - 点估计和区间估计,都不知道哪个点或者哪个区间更好 - 但是,按照 $95 \%$ 置信区间构造出来的区间,随便选一个区间,有 $95 \%$ 的概率会包含 $\hat{\mu}$ 这就好像用渔网捞鱼,我知道每一网下去有 $95 \%$ 的几率捞到想要的那条鱼,但是并不知道是不是现在这一网: ### $95 \%$ 置信区间 假设人群的身高服从: $$ X \sim N\left(\mu, \sigma^2\right) $$ 其中 $\mu$ 未知,$\sigma$已知。 我们不断对人群进行采样,样本的大小为 $n$ ,样本的均值: $$ M=\frac{X_1+X_2+\cdots+X_n}{n} $$ 根据大数定律和中心极限定律, $M$服从: $$ M \sim N\left(\mu, \frac{\sigma^2}{n}\right) $$ 我们可以算出以 $\mu$为中心,面积为 0.95的区间,如下图 {width=400px} 即: $$ P\left(\mu-1.96 \frac{\sigma}{\sqrt{n}} \leq M \leq \mu+1.96 \frac{\sigma}{\sqrt{n}}\right)=0.95 $$ 也就是, $M$有 $95 \% $ 的几率落入此区间: {width=400px} 那自然,我们以 $1.96 \frac{\sigma}{\sqrt{n}}$ 为半径做区间,有 $95 \%$ 的概率把 $\mu$包含进去: {width=400px} 那么,只有一个问题了,我们不知道、并且永远都不会知道真实的 $\hat{\mu}$是多少。 我们就只有用 $\hat{\mu}$来代替 $\mu$ : $$ P\left(\hat{\mu}-1.96 \frac{\sigma}{\sqrt{n}} \leq M \leq \hat{\mu}+1.96 \frac{\sigma}{\sqrt{n}}\right) \approx 0.95 $$ ## 置信上下限 ### 同等置信区间定义1 如对给定的 $\alpha(0<\alpha<1)$, 对任意的 $\theta \in \Theta$, 有 $$ P_\theta\left(\hat{\theta}_1 \leqslant \theta \leqslant \hat{\theta}_2\right)=1-\alpha, $$ 则称 $\left[\hat{\theta}_1, \hat{\theta}_2\right]$ 为 $\theta$ 的 $1-\alpha$ 同等置信区间. 在一些实际问题中, 人们感兴趣的有时仅仅是未知参数的一个下限或一个上限.譬如, 对某种产品的平均寿命来说, 我们希望它越大越好, 因此人们关心的是它的 0.90置信下限是多少, 此下限标志了该产品的质量, 它的一般定义如下. ### 置信上限定义2 若有统计量 $\bar{\theta}=\bar{\theta}\left(X_1, \cdots, X_n\right)$ ,使得 $P_\theta(\theta \leq \bar{\theta}) \geq 1-\alpha, \theta \in \Theta$ 则称 $\left(-\infty, \bar{\theta}\left(X_1, \cdots, X_n\right)\right]$ 为 $\theta$ 的单侧 $1-\alpha$ 置信区间, $\bar{\theta}\left(X_1, \cdots, X_n\right)$ 为 $\theta$ 的单侧 $1-\alpha$ 置信上限. ### 置信下限定义3 若有统计量 $\underline{\theta}=\underline{\theta}\left(X_1, \cdots, X_n\right)$ ,使得 $P_\theta(\theta \geq \underline{\theta}) \geq 1-\alpha, \theta \in \Theta$ 则称 $\left[\underline{\theta}\left(X_1, \cdots, X_n\right),+\infty\right)$ 为 $\theta$ 的单侧 $1-\alpha$ 置信区间, $\underline{\theta}\left(X_1, \cdots, X_n\right)$ 为 $\theta$ 的单侧 $1-\alpha$ 置信下限.
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
区间估计概述
下一篇:
枢轴变量
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。