切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第六篇 统计学和抽样分布
卡方分布χ²-独立检验-Part1
最后
更新:
2025-12-04 18:23
查看:
246
次
反馈
能力测评
会员8.2元/月
赞助
卡方分布χ²-独立检验-Part1
## 自由度 在介绍三大分布之前,我们先说一下自由度。 ### 从方程理解自由度 假设有一个3元函数 $x+y+z=1 ...(1)$ 在这个等式里,可以改写为 $x=1-y-z$ 这意味着,虽然方程有3个未知量(变量能随便取值的数量称呼自由度),但是因为其和为1,这使得,每给定一对$(y,z)$,那么$x$值也就固定了, 所以$x$ 并不能随便取值,因此,我们说他的自由度为:2. 如果再增加一个限制 $y=2z ...(2)$ 这样,每随意给$z$一个值,$y$就固定了,而再由(1)知道$x$值也会固定,因此他的自由度为:1 > 换句话说,每增加一个等式,会使得自由度减少1。 ## 卡方检验χ²的引入 χ²分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K.Pearson)分别于1875年和1900年推导出来。 > **χ²分布的主要用途,其实不是拿来用于自然现象的建模,而是用于假设检验用的。** Pearson在1900年提出χ²的论文,其实介绍的是χ²检验中的拟合优度检验。卡方检验主要用于分析两个分类变量的相关关系. ## 独立检验 我们通过一个简单例子来理解独立检验的实际意义。在许多实际问题中,我们需要考察两个分类变量之间是否有关系。例如,考察患肺癌与吸烟之间是否有关系。 为了了解患肺癌与吸烟之间的关系,某医疗机构调查了其他条件都基本相同的 100 个人,调查结果如下表(表中 $X$ 表示"是否吸烟",$Y$ 表示"是否患肺癌")。 {width=600px} 像上表这样,将两个分类变量进行交叉分类得到的频数分布表称为列联表;称 $X, Y$ 为分类变量,其中变量 $X$ 有两个变量值——"吸烟"和"不吸烟",变量 $Y$ 有两个变量值——"患肺癌"和"未患肺癌"。 由于所涉及的两个分类变量 $X, Y$ 均有两个变量值,所以称上表为 **$2 \times 2$ 列联表**. 从表 4-3 可以得出,在 54 个吸烟的人中有 39 人患肺癌,患者占 $39 / 54 \approx$ $72.22 \%$ ;在不吸烟的 46 人中,有 21 人患肺癌,患者占 $21 / 46 \approx 45.65 \%$ 。吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高出约 $$ 72.22-45.65=26.57 \text { (个百分点). } $$ 这种差异似乎已经说明吸烟与患肺癌有很大关系。但仔细想想,由于这 100 人是随机选取的,会不会是由于随机抽样的误差,使得所抽取的 60 名肺癌患者中碰到了较多的吸烟者,而在 40 名未患肺癌者中碰到了较多的不吸烟者?这样也可能导致吸烟者中肺癌患者的比例比不吸烟者中肺癌患者的比例高。 于是,我们还需进一步用统计方法来检验,因为单凭随机抽样的误差可能还不 足以造成如此大的差异。 为了讨论的方便我们引人以下记号: 变量 $X: A=$ 吸烟, $\bar{A}=$ 不吸烟; 变量 $Y: B=$ 患肺癌, $\bar{B}=$ 未患肺癌. 我们将表 4-3 中的数字用字母代替得到如下列联表: {width=600px} 在本案例中, $$ \begin{aligned} & a=39, b=15, c=21, d=25 \\ & n=a+b+c+d=100 \\ & a+b=54 \\ & c+d=46 \\ & a+c=60 \\ & b+d=40 \\ \end{aligned} $
其他版本
【概率论与数理统计】单正态总体方差的假设检验(卡方检验)
【概率论与数理统计】卡方分布χ²-前世今生-Part5
【概率论与数理统计】卡方分布χ²-拟合度检验-Part2
【概率论与数理统计】卡方分布χ²-密度与分布函数的性质-Part3
【概率论与数理统计】拟合优度检验
【概率论与数理统计】卡方分布χ²-前世今生-Part4
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
正态抽样的均值与方差★★★★★
下一篇:
卡方分布χ²-拟合度检验-Part2
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com