最后更新: 2025-04-12 09:43 查看: 59 次反馈刷题

独立检验

## 独立检验概述
在实际问题中经常遇到要证实两类变量是相关的，或者反过来，证实它们是相互独立的．如何利用取自这两类变量的样本来判断它们是否相互独立呢？

下面通过案例来加以说明。
某疾病预防中心随机调查了 339 名 50 岁以上的公民，研究吸烟习惯与慢性气管炎患病的关系，调查数据如表 8－7 所示。问：患慢性气管炎与吸烟是否相互独立？

![图片](/uploads/2025-04/1eaea8.jpg)
 
 表格，称为 2 行 $\times 2$ 列列联表，简称 $2 \times 2$ 列联表，也称为四格表。

由表 8－7 中的数据可以计算其中一个分类变量的不同类别在另一个分类变量中的百分比．例如，在不吸烟者中，约有 $9.70 \%$ 患慢性气管炎，而在吸烟者中，约有 $20.98 \%$ 患慢性气管炎，两者相差较大．因此，我们可以初步推断：患慢性气管炎可能与吸烟有关，吸烟者患慢性气管炎的可能性更大．但这种推断是否具有统计意义呢？我们有多大把握认为患慢性气管炎与吸烟有关呢？这就需要用到 $2 \times 2$ 列联表独立性检验方法。

要检验两个随机变量是否有关，统计上一般先假设它们没有关系，即相互独立，再进行统计检验。这种假设称为**原假设**（null hypothesis），也称为**零假设**，习惯上用 $H_0$ 表示．以上述问题为例，我们提出的原假设是：

$H_0$ ：患慢性气管炎与吸烟没有关系，即它们相互独立．
要检验上述假设，我们需要对 $2 \times 2$ 列联表（表 8－7）中的观察值与预期值进行比较。预期值是当原假设 $H_0$ 成立时的预期结果．例如，由表 8－7 可知，总计 339 位样本公民中有 56 位患有慢性气管炎，其百分比为 $\frac{56}{339} \times 100 \% \approx 16.52 \%$ 。假设患慢性气管炎与吸烟没有关系，那么 205 位吸烟者中应该有 $205 \times 16.52 \% \approx$ 33.87 位患有慢性气管炎，这里的 33.87 就是原假设 $H_0$ 成立时计算得到的预期值．我们把这样计算得到的所有预期值与观察值建立表格，就得到表 8－8．
 ![图片](/uploads/2025-04/8fd1f0.jpg)
 
## 卡方统计量 $\chi^2$
 为了描述观察值与预期值之间的总体偏差，我们引人统计量 $\chi^2$ ：

$$
\chi^2=\sum \frac{(\text { 观察值一预期值 })^2}{\text { 预期值 }}
$$

$$
\begin{aligned}
= & \frac{(121-111.86)^2}{111.86}+\frac{(162-171.13)^2}{171.13}+\frac{(13-22.14)^2}{22.14} \\
& +\frac{(43-33.87)^2}{33.87} \\
\approx & 7.468
\end{aligned}
$$

$\chi^2$ 的值越大，说明表 8－8 中观察值与预期值的总体偏差越大，原假设成立的可能性就越小。那么究竟 $\chi^2$ 多大时，我们才可以拒绝原假设呢？这涉及 $\chi^2$ 分布。通过查阅 $\chi^2$ 分布概率表，可以得到 $\chi^2$ 值超过某些界限的概率。例如，

$$
\begin{aligned}
& P\left(\chi^2 \geqslant 6.635\right) \approx 0.01, \\
& P\left(\chi^2 \geqslant 5.024\right) \approx 0.025, \\
& P\left(\chi^2 \geqslant 3.841\right) \approx 0.05 \\
& P\left(\chi^2 \geqslant 2.706\right) \approx 0.1
\end{aligned}
$$

以 $P\left(\chi^2 \geqslant 3.841\right) \approx 0.05$ 为例，其含义是：如果原假设成立，那么 $\chi^2 \geqslant 3.841$ 成立的概率约为 0.05 ．这是一个小概率事件，不太可能发生．由于在本例中，$\chi^2 \approx 7.468>3.841$ ，因此我们可以推断原假设＂患慢性气管炎与吸烟没有关系＂成立的可能性小于 $5 \%$ 。或者说，我们有 $95 \%$ 的把握认为患慢性气管炎与吸烟有关．

为了计算方便，我们给出 $2 \times 2$ 列联表 $\chi^2$ 检验的计算公式：
设有两组分类数据 $A , ~ B$ ，每组数据的两种状态分别用 0 和 1 表示（如 A 组是＂不吸烟者＂，B组是＂吸烟者＂；用＂0＂表示＂不患慢性气管炎者＂，用＂ 1 ＂表示＂患慢性气管炎者＂），则可得到下面的 $2 \times 2$ 列联表（表 8－9）：
 ![图片](/uploads/2025-04/44f25b.jpg)
 
 其中，$a, ~ b, ~ c, ~ d$ 为实际观察值．
由 $\chi^2=\sum \frac{(\text { 观察值一预期值 })^2}{\text { 预期值 }}$ ，经过变形可得 $\chi^2$ 的一般计算公式

$$
\chi^2=\frac{n(a d-b c)^2}{(a+b)(c+d)(a+c)(b+d)}
$$

其中，$n=a+b+c+d$ ．
该公式的证明留作习题。
本例所用的 $\chi^2$ 检验方法在统计学中称为 $2 \times 2$ 列联表独立性检验（independence test in contingency table）。

从上面的例子可以看出， $2 \times 2$ 列联表独立性检验通常有如下步骤：
（1）提出两个随机变量没有关系的原假设 $H_0$ ．
（2）确定显著性水平 $\alpha$ ，本书中规定 $\alpha=0.05$ ，也即 $P\left(\chi^2 \geqslant\right.$ $3.841) \approx 0.05$ ．
（3）计算统计量 $\chi^2$ 的值．
（4）统计决断：比较上述 $\chi^2$ 值与 3.841 的大小，若 $\chi^2$ 值 $\geqslant$ 3.841 ，则拒绝（或否定）$H_0$ ；若 $\chi^2$ 值 $<3.841$ ，则不能拒绝（或否定）$H_0$ ，即接受 $H_0$ ．根据上述推断作出结论．

## 独立检验
在许多实际问题中，我们需要考察两个分类变量（1）之间是否有关系。例如，考察患肺癌与吸烟之间是否有关系，考察儿童语言能力与他们的性别之间是否有关系等。

案例 患肺癌与吸烟之间是否有关系？
为了了解患肺癌与吸烟之间的关系，某医疗机构调查了其他条件都基本相同的 100 个人，调查结果如下表（表中 $X$ 表示＂是否吸烟＂，$Y$ 表示＂是否患肺癌＂）。
 ![图片](/uploads/2025-02/9b27c0.jpg)
 
 像上表这样，将两个（或两个以上）分类变量进行交叉分类得到的频数分布表称为列联表；称 $X, Y$ 为分类变量，其中变量 $X$ 有两个变量值——＂吸烟＂和＂不吸烟＂，变量 $Y$ 有两个变量值——＂患肺癌＂和＂未患肺癌＂。

由于所涉及的两个分类变量 $X, Y$ 均有两个变量值，所以称上表为 $2 \times 2$ 列联表．
从表 4－3 可以得出，在 54 个吸烟的人中有 39 人患肺癌，患者占 $39 / 54 \approx$ $72.22 \%$ ；在不吸烟的 46 人中，有 21 人患肺癌，患者占 $21 / 46 \approx 45.65 \%$ 。吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高出约

$$
72.22-45.65=26.57 \text { (个百分点). }
$$

这种差异似乎已经说明吸烟与患肺癌有很大关系。但仔细想想，由于这 100 人是随机选取的，会不会是由于随机抽样的误差，使得所抽取的 60 名肺癌患者中碰到了较多的吸烟者，而在 40 名未患肺癌者中碰到了较多的不吸烟者？这样也可能导致吸烟者中肺癌患者的比例比不吸烟者中肺癌患者的比例高。

于是，我们还需进一步用统计方法来检验，因为单凭随机抽样的误差可能还不
足以造成如此大的差异。
为了讨论的方便我们引人以下记号：
变量 $X: A=$ 吸烟， $\bar{A}=$ 不吸烟；
变量 $Y: B=$ 患肺癌, $\bar{B}=$ 未患肺癌．
我们将表 4－3 中的数字用字母代替得到如下列联表：
 ![图片](/uploads/2025-02/65f694.jpg)
 
 在本案例中，$n=a+b+c+d=100$ ，

$$
\begin{aligned}
& a=39, b=15, c=21, d=25 \\
& a+b=54, c+d=46, a+c=60, b+d=40
\end{aligned}
$$

为分析 $X, Y$ 是否有关系，我们先提出假设 $H_0: X, Y$ 之间没有关系（独立），也就是假设＂吸烟 $(A)$＂与＂患肺癌 $(B)$＂独立．这时 $A$ 与 $B$ 独立， $\bar{A}$ 与 $B$ 独立，$A$与 $\bar{B}$ 独立， $\bar{A}$ 与 $\bar{B}$ 独立．

于是 $\quad P(A \cap B)=P(A) P(B), P(\bar{A} \cap B)=P(\bar{A}) P(B)$ ，

$$
P(A \cap \bar{B})=P(A) P(\bar{B}), P(\bar{A} \cap \bar{B})=P(\bar{A}) P(\bar{B})
$$

根据概率与频率的关系，知道 $P(A \cap B)$ 的估计值为 $p_{A B}=\frac{a}{n}=0.39, P(\bar{A} \cap B)$的估计值为 $p_{A B}=\frac{c}{n}=0.21, P(A \cap \bar{B})$ 的估计值为 $p_{A B}=\frac{b}{n}=0.15, P(\bar{A} \cap \bar{B})$ 的估计值为 $p_{A B}=\frac{d}{n}=0.25$ ．

又 $P(A)$ 的估计值为 $p_A=\frac{a+b}{n}=0.54, P(\bar{A})$ 的估计值为 $p_A=\frac{c+d}{n}=0.46$ ， $P(B)$ 的估计值为 $p_B=\frac{a+c}{n}=0.6, P(\bar{B})$ 的估计值为 $p_B=\frac{b+d}{n}=0.4$ ．

因为假设 $X, Y$ 独立，所以 $\mu_{A B}=\left|p_{A B}-p_A p_B\right|, \mu_{A B}=\left|p_{A B}-p_A p_B\right|, \mu_{A B}=$ $\left|p_{A B}-p_A p_B\right|, \mu_{A B}=\left|p_{A B}-p_A p_B\right|$ 都相应比较小，我们用 $\chi^2$（读作＂卡方＂）表示 $\mu_{A B}, \mu_{A B}, \mu_{A B}, \mu_{A B}$ 的总体大小，记

$$
\begin{aligned}
\chi^2 & =\frac{n \mu_{A B}^2}{p_A p_B}+\frac{n \mu_{A B}^2}{p_A p_B}+\frac{n \mu_{A B}^2}{p_A p_B}+\frac{n \mu_{A B}^2}{p_A p_B} \\
& =\frac{n(a d-b c)^2}{(a+b)(c+d)(a+c)(b+d)} .
\end{aligned}
$$

当 $\chi^2$ 的取值较小时，表示假设 $H_0$ 成立，当 $\chi^2$ 的取值较大时，表示假设 $H_0$ 不成立。

在本案例中，经过计算得到 $\chi^2$ 的观测值为

$$
\chi^2=\frac{100(39 \times 25-15 \times 21)^2}{54 \times 46 \times 60 \times 40} \approx 7.307
$$

那么，$\chi^2=7.307$ 这个取值是较大还是较小呢？
统计学家已经有明确的结论：如果 $2 \times 2$ 列联表中的两个分类变量 $X, Y$ 是独立的，即在 $H_0$ 成立的情况下，且当随机调查的数据 $a, b, c, d$ 都不小于 5 时，随机事件＂$\chi^2 \geqslant 6.635$＂发生的概率约为 0.01 ，即

$$
P\left(\chi^2 \geqslant 6.635\right) \approx 0.01
$$

也就是说，在 $H_0$ 成立的情况下，$\chi^2$ 的观测值大于或等于 6.635 的概率非常小，近似于 0.01 。即在 $H_0$ 成立的情况下，观测值超过 6.635 的概率不大于 0.01 ．

在本案例中，由抽样数据所得到的 $\chi^2 \approx 7.307>6.635$ ，这表明这一事件发生的概率不大于 0.01 ，这是一个小概率事件。因此，我们有 $\left[1-P\left(\chi^2 \geqslant 6.635\right)\right] \times$ $100 \%=99 \%$ 的把握认为 $H_0$ 不成立，于是否定假设 $H_0$ ，从而认为吸烟与患肺癌之间有关系。

值得指出的是，我们在作出上述判断时也有可能犯错误，因为吸烟与患肺癌没有关系时，$\chi^2$ 的观测值仍有可能超过 6.635 ．但是这一事件发生的概率不超过 0.01 ，也就是说，我们犯错误的概率不会超过 0.01 。

上面这种利用统计量 $\chi^2$ 来确定在多大程度上可以认为＂两个分类变量有关系＂的方法，称为两个分类变量的独立性检验．

`例` 研究者发现多看电视易使人变冷漠，下表数据（单位：人）是一个调查机构对此现象的调查结果：
 ![图片](/uploads/2025-02/fadcf9.jpg)
 试根据上述数据判断＂多看电视＂与＂人变冷漠＂是否有关系．
解 先提出统计假设 $H_0$ ：多看电视与人变冷漠没有关系。
根据列联表中的数据，可以求得

$$
\chi^2=\frac{168 \times(68 \times 38-42 \times 20)^2}{110 \times 58 \times 88 \times 80} \approx 11.377 .
$$

由于 $11.377>6.635$ ，故否定假设 $H_0$ ，所以认为多看电视与人变冷漠有关系．

前面我们用独立性检验的方法研究了吸烟与患肺癌之间是否有关系的问题．
独立性检验的统计思想是：要研究＂两个分类变量有关系＂这一结论的可靠程度，首先假设该结论不成立，即假设 ＂$H_0$ ：两个分类变量没有关系（指独立）＂成立．在该假设下构造统计量 $\chi^2$ ，如果由抽样数据计算得到的 $\chi^2$ 的观测值 $x_0 \geqslant$ 6.635 ，则有 $\left[1-P\left(\chi^2 \geqslant 6.635\right)\right] \times 100 \%$ 的概率说明 $H_0$ 不成立。

> 独立性检验的思想类似于反证法，试比较它们之间的异同。

我们把 $P\left(\chi^2 \geqslant 6.635\right)$ 中的数据 6.635 称为一个判断可靠程度的临界值．在实际应用中，常用的临界值如表 4－5 所示（称为临界值表）。

![图片](/uploads/2025-02/64ef6b.jpg)
 
 一般地，对于两个分类变量 $X$ 和 $Y, ~ X$ 有两类取值，即类 $A$ 和类 $B$（如吸烟与不吸烟）；$Y$ 也有两类取值，即类 1 和类 2 （如患肺癌与未患肺癌）。经过统计调查，我们得到如下 $2 \times 2$ 列联表（表 $4-6$ ）所示的抽样数据：
  ![图片](/uploads/2025-02/44a3d0.jpg)
  
  利用独立性检验推断＂$X$ 与 $Y$ 有关系＂，可按下面的步骤进行：
（1）提出统计假设 $H_0: X$ 与 $Y$ 之间没有关系；
（2）根据 $2 \times 2$ 列联表与公式（1）计算 $\chi^2$ 的观测值；
（3）查临界值表（表 4－5）确定临界值 $x_0$ ，然后作出判断．
例如：（1）如果 $\chi^2>10.828$ ，就有不少于 $99.9 \%$ 的把握认为＂$X$ 与 $Y$ 之间有关系＂；
（2）如果 $\chi^2>6.635$ ，就有不少于 $99 \%$ 的把握认为＂$X$ 与 $Y$ 之间有关系＂；
（3）如果 $\chi^2>3.841$ ，就有不少于 $95 \%$ 的把握认为＂$X$ 与 $Y$ 之间有关系＂，如果 $\chi^2 \leqslant 3.841$ ，就认为还没有充分的证据显示＂$X$ 与 $Y$ 之间有关系＂．

独立性检验在生物统计，医学统计等领域应用很广泛。在处理调查社会问题得到的数据时，也常常使用独立性检验，下面我们举例说明．

例 2 为了考察某种新疫苗预防疾病的作用，科学家对动物进行试验，所得数据（单位：只）如下表所示：
 ![图片](/uploads/2025-02/00bd43.jpg)
 
 能否作出接种疫苗与预防疾病有关的结论？
解 提出统计假设 $H_0$ ：接种疫苗与预防疾病无关．
根据列联表中的数据，可以求得

$$
\chi^2=\frac{50 \times(8 \times 9-15 \times 18)^2}{23 \times 27 \times 26 \times 24} \approx 5.059,
$$

由于 $5.024<5.059<6.635$ ，查临界值表可知，我们至少有 $97.5 \%$ 的把握认为接种疫苗与预防疾病有关，即疫苗有效．

`例` 为了解某挑战赛中是否接受挑战与受邀者的性别是否有关系（假设每个人是否接受挑战互不影响），某机构进行了随机抽样调查，得到如下调查数据 （单位：人）：

![图片](/uploads/2025-02/d53872.jpg)

根据表中数据，能否认为＂比赛中是否接受挑战与受邀者的性别有关＂？
解 提出统计假设 $H_0$ ：是否接受挑战与受邀者的性别无关．
根据列联表中的数据，可以求得

$$
\chi^2=\frac{100 \times(45 \times 15-15 \times 25)^2}{60 \times 40 \times 70 \times 30}=\frac{25}{14} \approx 1.786 .
$$

因为 $1.786<3.841$ ，所以没有充分的证据显示比赛中是否接受挑战与受邀者的性别有关．

`例` 为了研究色盲与性别是否有关，随机抽取 480 位男性和 520 位女性，测得他们是否为色盲的数据如表 8－10 所示．
 ![图片](/uploads/2025-04/2b56b0.jpg)
 问：色盲与性别是否有关？
解 把性别作为一个分类变量，把是否为色盲作为另一个分类变量，问题为判断色盲与性别是否有关，因此可采用 $2 \times 2$ 列联表独立性检验。
（1）提出原假设 $H_0$ ：色盲与性别无关．
（2）确定显著性水平 $\alpha=0.05$ ．
（3）计算 $\chi^2$ 的值，直接把表 8－10 中的数据代人 $\chi^2$ 的计算公式（1），其中 $a=442, b=514, c=38, d=6, n=a+b+c+d=$ $1000, a+b=956, c+d=44, a+c=480, b+d=520$ ，可得 $\chi^2=\frac{1000 \times(442 \times 6-514 \times 38)^2}{956 \times 44 \times 480 \times 520} \approx 27.139$.
（4）统计决断：由 $P\left(\chi^2 \geqslant 3.841\right) \approx 0.05$ ，而 $27.139>3.841$ ， $\chi^2$ 的值超过了 $\alpha$ 所确定的界限，从而否定原假设，即判定色盲与性别有关．

`例` 一次语文测验，王老师所任教的甲，乙两个班级的成绩情况如表 8－11 所示．
 ![图片](/uploads/2025-04/c3efd3.jpg)
 根据表 8－11 的数据，判断甲，乙两个班级语文测验的成绩是否有显著差异。

解 把班级作为一个分类变量，把语文测验的成绩是否优秀作为另一个分类变量，问题为判断语文测验的成绩与所在的班级是否有关。

（1）提出原假设 $H_0$ ：甲，乙两个班级语文测验的成绩没有显著差异。
（2）确定显著性水平 $\alpha=0.05$ ．
（3）计算 $\chi^2=\frac{66 \times(15 \times 18-13 \times 20)^2}{28 \times 38 \times 35 \times 31} \approx 0.006$ ．
（4）统计决断：由 $P\left(\chi^2 \geqslant 3.841\right) \approx 0.05$ ，而 $0.006<3.841$ ，小概率事件没有发生，故不能否定原假设。

因此，甲，乙两个班级语文测验的成绩没有显著差异。

`例` 为了研究55岁以上的人群与50岁以下的人群服用一种胶囊药物后的反应是否有显著差异，某医学院进行了志愿者口服该胶囊的观察试验，试验结果如表 8－12 所示。根据表中数据，能否作出这两类人群对此药物的反应有显著差异的结论？
 ![图片](/uploads/2025-04/f3de4d.jpg)
 
 解 把两年龄范围的人群作为一个分类变量，把对此药物有无明显反应作为另一个分类变量，问题是判断两类人群对此药物的反应是否有显著差异．
（1）提出原假设 $H_0$ ：两类人群对此药物的反应没有显著差异．
（2）确定显著性水平 $\alpha=0.05$ ．
（3）计算 $\chi^2=\frac{117 \times(6 \times 75-7 \times 29)^2}{13 \times 104 \times 35 \times 82} \approx 1.840$ ．
（4）统计决断：由于 $P\left(\chi^2 \geqslant 3.841\right) \approx 0.05$ ，而 $1.840<$ 3.841 ，因此根据本试验数据，不能认为 55 岁以上人群对此胶囊药物的反应与 50 岁以下人群有显著差异．

其他版本
【概率论与数理统计】附录5：卡方分布表【概率论与数理统计】检验的基本原理【概率论与数理统计】卡方分布

刷题

做题，是检验是否掌握数学的唯一真理

上一篇：一元线性回归模型的应用

下一篇：阅读：容斥原理

本文对您是否有用？有用 (0) 无用 (0)