高中数学
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
组卷
教材
考研区
VIP
足迹
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
你好
游客,
登录
注册
在线学习
概率论与数理统计
第九篇 假设检验
假设检验的基本基本原理与例题
最后
更新:
2025-02-21 09:25
查看:
283
次
反馈
刷题
假设检验的基本基本原理与例题
> 初学者很难理解拒绝域,建议参考附录 [附录1:置信区间与上a分位数](https://kb.kmath.cn/kbase/detail.aspx?id=1641) ## 假设检验与参数估计的区别 1 参数估计是用样本数据对总体参数进行估计; 2 假设检验是用样本数据对总体参数的某个特定假设进行检验,进而判断是否拒绝该 假设. ### 引例 ① 某车间用一台包装机包装葡萄糖.包得的袋装质量是一个随机变量,它服从正态分布.当机器正常时,质量 $X \sim N\left(500,2^2\right)$(单位: g )。某日开工后为检验包装机是否正常,随机地抽取它所包装的糖 9 袋,称得质量为 $$ 505,499,502,506,498,498,497,510,503 $$ 假设总体标准差 $\sigma$ 不变,即 $\sigma=2$ ,试问包装机工作是否正常? 针对这个实际问题,我们从中得出几点: (1)这与前面讨论的参数估计问题不同,不是一个参数估计问题. (2)这是在给定总体与样本下,从样本值出发去判断关于总体分布的一个"看法"是否成立,即要求对命题"葡萄糖质量 $X$ 的均值 $\mu$ 等于 500 g "做出"是"还是"否"的回答。 (3)若把命题"葡萄糖质量 $X$ 的均值 $\mu$ 等于 500 g "看成一个假设,记为"$H_0: \mu=$ $\mu_0=500$",对命题的判断转化为对假设 $H_0$ 的检验,此类问题称为统计假设问题,简称假设检验问题。 统计假设提出之后,我们关心的是它的真伪。所谓对假设 $H_0$ 的检验,就是根据来自总体的样本,按照一定的规则对 $H_0$ 做出判断:是接受,还是拒绝.这个用来对假设做出判断的规则称为**检验准则**,简称检验,如何对统计假设进行检验呢?结合上例来说明假设检验的具体步骤。 ② 历史上有个女士品茶的例子,有位常饮牛奶加茶的女士称:她能从一杯冲好的饮料中辨别出先放茶还是先放牛奶。并且她在 10 次试验中都正确地辨别出来了,问这个女士的说法是否可信?显然,我们有两种决策选择:一种是承认她的说法是真的;另一种是否认她的说法,而认为她只是运气比较好,都蒙对了。这个问题,我们通过下面的方法来分析。 不妨假设她不具备辨别能力,每次都是蒙的,即假设每次蒙对的概率为 0.5 ,那么 10 次都蒙对的概率为 $0.5^{10}=0.0009766$ ,这是一个"小概率事件",即平均来讲, 1000粒黑豆中刚好有 1 粒白豆,而我们从 1000 粒豆子中随机地抽取一粒,抽取出来的这粒恰好是那粒白豆子,我们会有这么好的运气吗?直观上来看我们知道这是不大可能的,当然从严谨的角度来说这样的事情也不是绝对不可能发生,所以比较科学的说法是,我们宁愿冒着 0.0009766 的风险(这就是后面说的第一类错误)也要否定"她不具备辨别能力"的说法。 > 这就是假设检验的统计思想,它有些类似初等数学中的"反证法",即不妨先认为某一假设(记为 $H_0$ )是成立的,通过样本数据,结果得到一个与之相矛盾的结果,于是认为假设 $H_0$ 不成立,而接受与之对立的另外一个检验。若原假设和备择假设是关于参数的,称为参数假设检验,否则称为非参数假设检验. 在[Z检验](https://kb.kmath.cn/kbase/detail.aspx?id=2542)章节告诉我们,抽取数据服从正态分布时,由如下定义: **Z统计量(也称U检验,正态检验)**:设 $X$ 是一个服从正态分布的随机变量,其方差是已知的 $\sigma^2$ ,并假设其均值为 $\mu$ .设 $x_1, x_2, \cdots, x_n$ 是从该分布中取出的 $n$ 个相互独立的观测值.设 $\bar{x}=\left(x_1+\cdots+x_n\right) / n$ 是样本均值.那么,观测到的 $z$检验统计量的值 $$ \boxed{ z=\dfrac{\bar{x}-\mu}{\sqrt{\sigma^2 / n}} } $$ 服从均值为 0 且方差为 1 的正态分布(所以 $Z \sim N(0,1)$ ). 利用这个原理可以对数据进行检验。 ## 例题 `例`某切割机正常工作时,切割每段金属棒的平均长度为 10.5 cm ,标准差为 0.15 cm 。今从一批产品中随机抽取 15 段进行测量,其结果如下(单位: cm ): $$ \begin{aligned} & \quad 10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8 \text {, } \\ & 10.5,10.7,10.2,10.7 \end{aligned} $$ 由以往的经验知道,金属棒长度服从正态分布,在显著性水平 $\alpha=0.05$下,检验该切割机的工作是否正常? 解: 记 $X$ 为金属棒的长度,则 $X \sim N\left(\mu, 0.15^2\right)$ .由题意,要检验的假设为: $$ H_0: \mu=10.5 \leftrightarrow H_1: \mu \neq 10.5 . $$ 因为总体方差已知,故选择统计量 $$ U=\frac{\sqrt{n}\left(\bar{X}-\mu_0\right)}{\sigma_0} $$ 当 $H_0$ 为真时,$U \sim N(0,1)$ .对 $\alpha=0.05$ ,查标准正态分布表,可得 $u_{1-\frac{\alpha}{2}}$ $=u_{0.975}=1.96$ ,由所给数据直接计算得 $\bar{x}=10.48$ ,于是 $$ u=\frac{\sqrt{n}\left(\bar{x}-\mu_0\right)}{\sigma_0}=\frac{\sqrt{15}(10.48-10.5)}{0.15}=-0.516, $$ 由 $|u|=|-0.516|<1.96$ ,故接受 $H_0$ ,即认为该切割机的工作是正常的. `例`由以往的经验知道,某电子元件的使用寿命服从正态分布,标准差为 100 小时.按上级质检部门的规定,该元件只有其使用寿命不低于 1000 小时才能认为合格。今从某厂生产的一批这种电子元件中随机抽查了 25 件,测得其平均寿命为 950 小时,在显著性水平 $\alpha=$ 0.05 下,能否认为这批电子元件为合格品? 解 记 $X$ 为电子元件的寿命,则 $X \sim N\left(\mu, 100^2\right)$ .本题中要检验的统计假设为: $$ H_0: \mu \geqslant 1000 \leftrightarrow H_1: \mu<1000 $$ 由于总体方差 $\sigma^2=100^2$ ,故选用统计量 $$ U=\frac{\sqrt{n}\left(\bar{X}-\mu_0\right)}{\sigma_0} \sim N(0,1) $$ 由 $\alpha=0.05$ ,查标准正态分布表,可得 $u_{1-\alpha}=u_{0.95}=1.645$ ,将 $\bar{x}=950$ 代人上述统计量,有 $$ u=\frac{\sqrt{25}(950-1000)}{100}=-2.5 $$ 由于 $u=-2.5<-u_{1-\alpha}=-1.645$ ,故拒绝 $H_0$ ,即认为该批电子元件不合格。 ## 检验的基本步骤 假设检验就是根据已知的样本,运用统计分析方法对总体 $X$ 的某种假设 $H_0$ 做出判断.下面结合引例①介绍假设检验的基本步骤。 ### 1.建立假设 一般假设检验问题需要建立两个互相对立的(统计)假设:$H_0$ 和 $H_1$ .其中 $H_0$ 是要检验的假设,称为**原假设**(Original Hypothesis)或**零假设**(Null Hypothesis),$H_1$ 是在原假设被拒绝时而应接受的假设,称为**对立假设**或**备择假设**(Alternative Hypothesis).$H_0$ 和 $H_1$ 中只能有一个成立,即为 $H_0$ 真 $H_1$ 假或者 $H_1$ 真 $H_0$ 假。在处理实际问题时,通常把希望得到的陈述作为备择假设,而把这一陈述的否定作为原假设。例如在上例中,可建立如下假设. 原假设 $\quad H_0: \mu=\mu_0=500$ , 对立假设 $\quad H_1: \mu \neq \mu_0=500$ 。 ### 2.选择检验统计量,给出拒绝域形式 对于引例1 建立的假设检验就是指这样一个法则:当有了具体的样本后,按该法则就可以决定是接受 $H_0$ 还是拒绝 $H_0$ ,即检验等价于把样本空间划分成两个互不相交的部分 $W$ 和 $\bar{W}$ ,当样本属于 $W$ 时,拒绝 $H_0$ ;否则接受 $H_0$ 。于是,称 $W$ 为该**检验的拒绝域**,称 $\bar{W}$ 为**接受域**。 在引例中,$H_0$ 对 $H_1$ 的检验问题中有关的是正态均值 $\mu$ ,样本均值 $\bar{X}$ 是 $\mu$ 的最好估计,由前面相关定理可知 $\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$ . 在 $\sigma$ 已知为 $\sigma_0$ 和原假设 $H_0: \mu=\mu_0$ 为真的情况下,则有 $$ U=\frac{\bar{X}-\mu_0}{\sigma_0 / \sqrt{n}} \sim N(0,1) $$ $U$ 就是检验统计量,$\left|\bar{X}-\mu_0\right|$ 反映了样本均值 $\bar{X}$ 与总体均值 $\mu_0$ 之间的差异,其大小反映系统误差的大小;分母 $\sigma_0 / \sqrt{n}$ 则反映的是随机误差的大小;比值 $|U|$ 表示系统误差是随机误差的倍数.在给定随机误差下,$|U|$ 越大,系统误差越大, $\bar{X}$ 距离总体均值 $\mu_0$ 越远,这时应倾向拒绝 $H_0$ ;反之,$|U|$ 越小,系统误差越小, $\bar{X}$ 距离总体均值 $\mu_0$ 越近,这时应倾向不拒绝 $H_0$ .由此可知,$|U|$ 的大小用来区分是否拒绝 $H_0$ ,即 $|U|$ 越大,应倾向拒绝 $H_0$ , $|U|$ 越小,应倾向不拒绝 $H_0$ . 为便于区分拒绝 $H_0$ 与不拒绝 $H_0$ ,需要找到一个临界值 $c$ ,使得 $$ \begin{aligned} & \text { 当 }|u| \geqslant c \text { 时, 拒绝 } H_0, \\ & \text { 当 }|u|<c \text { 时, 不拒绝 } H_0 \text {. } \end{aligned} $$ $W=\{u:|u| \geqslant c\}$ 称为例 8.1.1 中检验问题的拒绝域,其中临界值 $c$ 待定.当拒绝域确定之后,检验的判断准则也跟着确定了,即:如果 $\left(x_1, x_2, \cdots, x_n\right) \in W$ ,则拒绝 $H_0$ .如果 $\left(x_1, x_2, \cdots, x_n\right) \in \bar{W}$ ,则接受 $H_0$ 。 由此可见,一个拒绝域 $W$ 唯一确定一个检验法则,反之,一个检验法则也唯一确定一个拒绝域。 通常将注意力放在拒绝域上.正如在数学中不能用一个例子去证明一个结论一样,用一个样本(例子)不能证明一个命题(假设)是成立的,但可以用一个例子(样本)推翻一个命题。因此,从逻辑上看,注重拒绝域是适当的。事实上,在"拒绝原假设"和"拒绝备择 假设(从而接受原假设)"之间还有一个模糊域,如今把它并入接受域,所以接受域是复杂的,将之称为保留域也许更恰当,但习惯上已把它称为接受域,没有必要进行改变,只是应注意它的含义。 ### 3.选择显著性水平 由于样本是随机的,故当应用某种检验做判断时,可能做出正确的判断,也可能做出错误的判断,除非检查整个总体。在许多实际问题中检查整个总体是不可能的,因此在进行假设检验过程中是允许犯错误的,我们的任务是努力控制犯错误的概率,使其在尽量小的范围内波动.检验的两类错误如表 8.1.1 所示.  **第一类错误(拒真错误或弃真错误)**:原假设 $H_0$ 正确,由于抽样的随机性,样本却落入了拒绝域 $W$ 内,从而导致拒绝 $H_0$ ,因而犯了"弃真"的错误,称此为第一类错误。其发生的概率称为犯第一类错误的概率或弃真概率,通常记为 $\alpha$ ,又称显著性水平,即 $$ P\left\{\text { 拒绝 } H_0 \mid H_0 \text { 为真 }\right\}=\alpha \text {. } $$ **第二类错误(取伪错误)**:原假设 $H_0$ 不正确,由于抽样的随机性,样本却落入了拒绝域 $W$ 之外,即落入了 $\bar{W}$ 内,从而接受 $H_0$ ,因而犯了"取伪"的错误,称此为第二类错误。其发生的概率称为犯第二类错误的概率或取伪概率,通常记为 $\beta$ ,即 $$ P\left\{\text { 接受 } H_0 \mid H_0 \text { 不真 }\right\}=\beta \text {. } $$ 对给定的一对 $H_0$ 和 $H_1$ ,总可以找到许多拒绝域 $W$ 。我们当然希望寻找这样的拒绝域 $W$ ,使得犯两类错误的概率 $\alpha$ 与 $\beta$ 都很小。但是当样本容量 $n$ 固定时,要使 $\alpha$ 与 $\beta$ 同时很小是不可能的。一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样。通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平 $\alpha \quad(0<\alpha<1)$ ,而使犯第二类错误的概率也尽可能地小。具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于 $\alpha$ ,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验。通常情况下,显著性检验法则是较容易找到的,将在以下各节中详细讨论。 在构造显著性水平为 $\alpha$ 的检验中,$\alpha$ 不宜定得过小,$\alpha$ 过小会导致 $\beta$ 过大,这是不可取的。所以在确定 $\alpha$ 时不要忘记"用 $\alpha$ 去制约 $\beta$".故在实际中常选 $\alpha=0.05$ ,有时也用 $\alpha=0.01$或 $\alpha=0.1$ . ### 4.给出拒绝域 在确定显著性水平后,可以定出检验的拒绝域 $W$ .在引例1 中,对给定显著性水平 $\alpha$ ,用下式定出临界值 $$ P(|U| \geqslant c)=\alpha \text { 或者 } P(|U|<c)=1-\alpha \text {. } $$ 由 $U=\frac{\bar{X}-\mu_0}{\sigma_0 / \sqrt{n}} \sim N(0,1)$ 及标准正态分布分位点可得,$c=u_{1-\frac{\alpha}{2}}$ .则显著性水平为 $\alpha$ 的检验的拒绝域为 $W=\left\{|u| \geqslant u_{1-\frac{\alpha}{2}}\right\}$ 。 若取 $\alpha=0.05$ ,则 $c=u_{1-\frac{\alpha}{2}}=u_{0.975}=1.96$ ,即 $W=\{|u| \geqslant 1.96\}$ 。 5.做出判断 在有了明确的拒绝域 $W$ 后,根据样本观测值可以做出判断.判断法则如下: 根据样本计算检验统计量 $U$ 的值 $u$ ,如果检验统计量的值 $u$ 落入拒绝域 $W$ 内,则拒绝原假设 $H_0$ ,即接受备择假设 $H_1$ ,反之,则接受原假设 $H_0$ 。 根据上述法则,可以对例8.1.1 进行判断. 由 $\mu_0=500, \sigma_0=2, \alpha=0.05, n=9$ 及 $$ \bar{x}=(505+499+502+506+498+498+497+510+503) / 9=502 . $$ 检验统计量 $U$ 的值 $$ \begin{gathered} u=\frac{502-500}{2 / 3}=3, \\ |u|=3>1.96=u_{1-\frac{\alpha}{2}}, \end{gathered} $$ 样本点落入拒绝域 $W$ 内,故拒绝原假设 $H_0$ ,接受 $H_1$ . 在显著性水平 $\alpha=0.05$ 下,认为这天葡萄糖包装机工作不正常。 综上所述,进行假设检验都要经过 5 个步骤,即: (1)根据实际问题的要求,建立原假设 $H_0$ 与备择假设 $H_1$ ; (2)选择检验统计量 $U$ ,在原假设 $H_0$ 成立的前提下导出 $U$ 的概率分布,求 $U$ 的分布不依赖于任何未知参数,并给出拒绝域 $W$ 形式; (3)给出显著性水平 $\alpha$ 及样本容量 $n$ ; (4)根据显著性水平 $\alpha$ 和 $U$ 的分布,由 $$ P\left\{\text { 拒绝 } H_0 \mid H_0 \text { 为真 }\right\}=\alpha \text {, } $$ 求出临界值,从而确定拒绝域; (5)根据的样本观察值和拒绝域,对假设 $H_0$ 做出拒绝或接受的判断. `例`设一个成年男子身高的总体 $X$ 服从正态分布 $N(\mu, 11)$ (单位: cm ),其中 $\mu$ 为未知参数, $\left(X_1, X_2, \cdots, X_n\right)$ 是取自该总体的一个样本,对于假设检验问题 $H_0: \mu=170$ $\leftrightarrow H_1: \mu \neq 170$ ,在显著性水平 $\alpha=0.05$ 下,求该检验问题的拒绝域。 解 首先,给出未知参数 $\mu$ 的一个估计量,通常 $\hat{\mu}=\bar{X}$. 根据备择假设的形式, $\mu \neq 170$ ,即平均身高不是 170 cm ,那么如果样本均值作为 $\mu$ 的估计与 170 偏差足够大,则拒绝 $H_0$ ,因此我们构造拒绝域的形式为 $$ W=\{|\bar{X}-170|>c\} . $$ 对给定显著性水平 $\alpha=0.05$ ,即第一类错误概率不超过 0.05 则 $$ P\left(\left(X_1, X_2, \cdots, X_n\right) \in W \mid H_0 \text { 成立 }\right)=P\left(|\bar{X}-170|>c \mid H_0 \text { 成立 }\right) \leqslant \alpha=0.05 \text {. } $$ 考虑当 $H_0$ 成立时, $\bar{X} \sim N\left(170, \frac{1}{n}\right)$ ,将 $\bar{X}$ 改造 $Z=\sqrt{n}(\bar{X}-170) \sim N(0,1)$ ,则 $c=u_{1-\alpha / 2}$ ,故最终的拒绝域为 $$ W=\left\{|Z|>u_{1-\alpha / 2}\right\} . $$ 在这里,为了求出临界值 $c$ 的值,我们构造了一个统计量 $Z$ ,它在原假设下的分布是完全已知的或分位数可以计算,我们称符合这个要求的统计量为检验统计量,在本例中,检验统计量 $Z$ 服从标准正态分布,故该检验又称为 $Z$-检验(又可称为 $U$-检验)。 综上所述,在给定显著性水平 $\alpha$ 下,求拒绝域 $W$ 的一般步骤如下。 (1) 建立针对未知参数 $\theta$ 的某个假设; (2) 给出未知参数 $\theta$ 的一个点估计; (3)构造检验统计量 $Z=\varphi\left(X_1, X_2, \cdots, X_n\right)$, 要求当 $H_0$ 时可以求解 $Z$ 的分位数; (4)以 $Z$ 为基础,根据备择假设 $H_1$ 的实际意义,构造一个拒绝域 $W$ 的表达形式; (5)确定拒绝域 $W$ 中的临界值, 要求 $W$ 满足显著性水平 $\alpha$. `例`自动生产线生产某种食品罐头,在正常生产情况下,每听罐头的标准重量为 500 克,标准差不得超过 10 克.由经验知道,该种罐头的重量服从正态分布,某天开工后,为了检查生产线的工作是否正常,随机抽取了 9 听罐头测量其重量,其结果为(单位:克): $$ 497,507,510,475,484,488,524,491,515, $$ 问:这天的自动生产线工作是否正常 $(\alpha=0.05)$ ? 解 记 $X$ 为罐头重量,则 $X \sim N\left(\mu, \sigma^2\right)$ .为了检验生产线的工作是否正常,需要检验以下两组假设: $$ \begin{gathered} H_0: \mu=500 \leftrightarrow H_1: \mu \neq 500 \\ H_0^{\prime}: \sigma^2 \leqslant 100 \leftrightarrow H_1^{\prime}: \sigma^2>100 \end{gathered} $$ 为了检验假设 $H_0: \mu=500 \leftrightarrow H_1: \mu \neq 500$ ,由于总体方差未知,因此采用 $t$ 一检验法,选用统计量 $$ T=\frac{\sqrt{n-1}\left(\bar{X}-\mu_0\right)}{S_n} $$ 当 $H_0$ 为真时,$T \sim t(n-1)$ .对于给定的显著性水平 $\alpha=0.05$ ,査自由度为 $n-1=8$ 的 $t$-分布表,可得 $t_{1-\frac{a}{2}}(n-1)=t_{0.975}(8)=2.306$ ,又由所给数据,直接计算可得 $\bar{x}=499, S_n=15.113$ ,将它们代人统计量 $T$ ,不难得到 $T$ 的观察值为 $$ t=\frac{\sqrt{8}(499-500)}{15.113}=0.187 $$ 由于 $|t|=0.187<t_{0.975}(8)=2.306$ ,因此接受 $H_0$ . 下面再检验 $H_0^{\prime}: \sigma^2 \leqslant 100 \leftrightarrow H_1^{\prime}: \sigma^2>100$ ,选用统计量 $$ \chi^2=\frac{n S_n^2}{\sigma_0^2} \sim \chi^2(n-1) $$ 对于给定的 $\alpha=0.05$ ,查自由度为 $n-1=8$ 的 $\chi^2$ 分布表,可得临界值 $C_{1-\alpha}(n-1)=C_{0.95}(8)=15.5$ ,而 $\chi^2$ 统计量的观察值 $$ c=\frac{9 \times 15.113^2}{100}=20.56 $$ 由于 $c=20.56>C_{1-\alpha}(n-1)=15.5$ ,故拒绝 $H_0^{\prime}$ 。 由以上结果可见,这天的自动生产线由于产品重量的方差偏大,即生产不够稳定,从而认为生产线的工作是不正常的.
其他版本
【高中数学】抽样
【高中数学】独立检验
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
Z检验(正态检验)
下一篇:
单正态总体均值的假设检验(Z检验)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。