切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第六篇 统计学和抽样分布
阅读:卡方分布χ²-前世今生-Part4
最后
更新:
2025-12-04 18:14
查看:
63
次
反馈
能力测评
会员8.2元/月
赞助
阅读:卡方分布χ²-前世今生-Part4
## 卡方分布χ²-前世今生 χ的写法很像英文字母X,又像生物课本中的人的染色体符号,所以一开始我对这个希腊字母感觉非常陌生。 卡方分布是概率论与统计学中常用的一种概率分布。这个分布有些特别,**因为它在不同的应用场景有不同的自由度**。而且他也不用来建模的,在前面介绍过很多分布,比如二项分布,指数分布等,当在实际生活中遇到问题时,会尽可能把生活模型往这些分布模型上靠,但是卡方分布不是,他主要用来检验的,就是用来检验你网上靠的模型是不是准确。 > 如果做一个比喻,大家都去淘金,但是淘金要过一条河,前面介绍的各种分布(指数分布、正态分布、二项分布等)就是各种淘金者,而卡方分布就像一个摆渡者,他本身不去淘金,但是你要淘金,可以坐他的小船,他会渡你过岸。 卡方所以在不同的场景下使用不同的自由计算公式。如果是用χ²检验列联表的时候,自由度为:(行数-1)×(列数-1); 而如果用χ²检验进行拟合优度检验,那么自由度则为:k-1。 另外,卡方分布与正态分布变量相关,也就是说卡方分布其实源自于**正态分布**。 我们查了下互联网资料,特别是维基百科中的资料索引,一直查下去,发现有很多人都支持是德国的大地测量学家F.R.Helmert在1875 年关于正态总体样本方差分布的研究中,是他首次描述了这种分布。 因此在德语中这个分布被称为Helmert'sche或“Helmert 分布”,中文翻译为 **赫尔默特分布**。 后来,英国数学家 卡尔·皮尔逊 (Karl Pearson,以下简称Pearson)又独立地在1900年在Philosophical杂志的一篇论文中正式提出这个概念,并且他还和助手一起计算出了卡方值检验表,使得卡方分布得以实用化。 那为啥Pearson为啥会引用希腊字母和阿拉伯数字的组合——χ²作为这个概率分布的名字呢? 主要是1895年Pearson在伦敦大学学院时,他在《对数学进化论的贡献》(Contributions to the Mathematical Theory of Evolution)论文集中发表过一篇关于回归、遗传及Panimixia(混合物?)的论文,他在论文中将多元正态密度函数中的指数部分写成 -½·χ²,这个习惯Pearson一直沿用到了刚才说到的1900年的那篇文章。 如下图的考古  考古如下  在论文中Pearson 多处的推导用了正态分布的σ符号来表示标准差,这也就间接表示了卡方分布源自正态分布。 最后,又是R. A. Fisher 在1924年把卡方分布纳入了正态分布族。 ## 从Pearson的案例切入对χ²理解 Pearson最早发表卡方分布的论文里,列举了日后在教科书里面经常见到的应用案例:样本的抽样比例分布,和理论的概率分布之间是否有显著差异。 就是文章开头里,统计量服从卡方分布的例子,我们在前面[Part1](https://kb.kmath.cn/kbase/detail.aspx?id=3028)和 [Part2](https://kb.kmath.cn/kbase/detail.aspx?id=3032) 里已经介绍过这个公式 $$ \chi^2=\sum_{i=1}^k \frac{\left(O_i-E_i\right)^2}{E_i} $$ 只不过他的第一个例子,是和Weldon教授一起搞的掷骰子场景。 这个例子比较长,我也打算从中慢慢的提取出卡方分布推导的切入点,而且可能切入点还不止一个。 ### 频率已知,或假设先验已知:12个骰子的实验和轮盘实验 Pearson 和Weldon教授一起做了个实验:有12个骰子,连续扔26306次,Weldon教授提供了出现5点或6点的骰子数量的理论频数,以及他的学生们观测到的实际频数。 Pearson的论文并没有给出理论频数m的计算方法,而是直接给出了结果,所以第一次看的时候比较晦涩,我只好自己尝试补充了一下,如下表:  比较一下上表中的理论频数值m的分布,和实际频数值m’的分布还是有些差异的,特别的,出现5次,6次实际的频数要比理论频数高一些(m’-m 分别为176和140)。 这种偏差是否就否定了投骰子的实验结果和理论的概率分布不一致?或者说m’不服从m分布? 此时可以通过计算卡方值进行测算,如下表:  有13组数据,要代入一个P值的概率计算公式: $$ P=e^{-\frac{1}{2} \chi^2}\left(1+\frac{\chi^2}{2}+\frac{\chi^4}{2 \cdot 4}+\frac{\chi^6}{2 \cdot 4 \cdot 6}+\frac{\chi
其他版本
【概率论与数理统计】卡方分布χ²-独立检验-Part1
【概率论与数理统计】卡方分布χ²-拟合度检验-Part2
【概率论与数理统计】卡方分布χ²-密度与分布函数的性质-Part3
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
卡方分布χ²-拟合度检验-Part2
下一篇:
阅读:卡方分布χ²-前世今生-Part5
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com