切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第六篇 统计学和抽样分布
t分布★★★★★
最后
更新:
2026-01-03 10:47
查看:
677
次
反馈
能力测评
会员8.2元/月
赞助
t分布★★★★★
> 假设车间生产了一批螺丝,你想检验这些产品质量情况,你随机抽查了一些螺丝,此时就可以使用统计抽样的四大分布是:正态分布、卡方分布、t分布和F分布,他们分别对应 Z检验、卡方检验、t检验和F检验。 如果你抽查的样本比较多(n>30)优先使用**Z检验**(对应[正态分布](https://kb.kmath.cn/kbase/detail.aspx?id=532)),如果抽查样本比较少(n<20)则使用**t检验**(对应[t分布](https://kb.kmath.cn/kbase/detail.aspx?id=568)),如果你想比较两个机床生产的螺丝质量差异则使用**F检验**(对应[F分布](https://kb.kmath.cn/kbase/detail.aspx?id=569))。如果想分析螺丝质量和原材料质量的关系则使用**χ²卡方检验**(对应[卡方分布](https://kb.kmath.cn/kbase/detail.aspx?id=567)) > χ²分布、t分布、F分布的主要用途,其实不是拿来用于自然现象的建模,而是用于假设检验用的。只有正态分布既可以进行建模又可以进行检验 ## 为什么引入t分布 当我们想用**样本均值**去估计**总体均值**时,自然会用到样本均值的分布。如果总体服从正态分布,那么样本均值也服从正态分布。 但问题是,**总体标准差σ通常是未知的**。我们只能用**样本标准差S**去估计它。当我们用S代替σ来计算标准化的样本均值(即 $t = \frac{\bar{X} - \mu}{S/\sqrt{n}}$ )时,这个新的统计量就不再服从标准正态分布N(0,1)了。 **t分布的本质**, 正是描述这个用样本标准差S代替总体标准差σ后,标准化样本均值的精确分布。 ## 理解: t分布 想象一下,你想知道你们学校所有男生的平均身高,但你不可能测量每一个人。 **1. 理想情况(正态分布)** 如果你知道全国男生的身高标准差(数据有多分散),那么你只需要抽样调查一部分同学,用样本平均值,就能比较准确地估算总体平均值,并且误差范围很明确。这个完美的场景用的是 **“正态分布”** (也叫Z分布)。 **2. 现实情况(t分布登场)** 但现实中,你**根本不知道全国男生的身高标准差**是多少!你只有自己抽样的这个小样本。 你只能用自己样本的数据,来**估算**一个标准差。 这个“估算的标准差”本身就有**不稳定性**——如果你只抽了5个人,算出来的标准差可能很不准;抽了1000个人,就会准很多。 **t分布就是专门处理这种“用样本估算的标准差”所带来的额外不确定性的。** ### 核心比喻 把“估计总体平均值”想象成在雾天射击一个靶心: * **正态分布(Z分布)**:天气晴朗,无风。你知道风速(总体标准差),只需要调整一下瞄准位置就能打得很准。误差主要来自枪本身的精度。 * **t分布**:起雾了,而且风速未知(总体标准差未知)。你只能根据感觉(样本标准差)来估计风向和风速。这时,你的**不确定性大大增加**了。 * 如果你只开了几枪(**样本量小**),你的“感觉”很不靠谱,雾就显得特别浓,你的瞄准点必须更保守,误差范围要设得**非常宽**才行(t分布比正态分布更“矮胖”,尾巴更厚)。 * 如果你开了很多枪(**样本量大**),你的“感觉”就越来越准,雾就散了,环境越来越接近“晴朗无风”的状态。当样本量足够大(比如>30),t分布就几乎和正态分布一模一样了。 ### 具体应用场景 > 我们平时用正态分布做统计推断(比如估计总体均值),有个前提:要么总体标准差 σ 已知,要么样本量很大(n≥30,根据中心极限定理,样本均值近似正态分布)。但实际研究中,很多情况不满足: 样本量小(比如测试一种新药,只招募了 10 个患者); 总体标准差 σ 未知(我们根本不知道整个总体的波动情况,只能用样本标准差 s 代替)。 这时候再用正态分布就会 “低估误差”(因为小样本的 s 和真实 σ 可能差很远),而 t 分布正是为了解决这个问题 —— 它通过 “自由度” 调整了小样本的不确定性,让推断结果更可靠。 ①:某地某年高考后随机抽得 15 名男生, 12 名女生的数学考试成绩如下: 男生: 49 48 47 53 51 43 39 57 56 46 42 44 55 44 40 女生: 46 40 47 51 43 36 43 38 48 54 48 34 这 27 名学生的成绩能说明这个地区男女生的数学考试成绩不相上下吗(显著性水平 $\alpha=0.05$ )? ②:某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试,其结果如下。 镍合金铸件 $(X): 72.0,69.5,74.0,70.5,71.8$. 铜合金铸件 $(Y): 69.8,70.0,72.0,68.5,73.0,70.0$ 。 根据以往经验知, 硬度 $X \sim N\left(\mu_1, \sigma_1^2\right), Y \sim N\left(\mu_2, \sigma_2^2\right)$, 且 $\sigma_1=\sigma_2=2$, 试在显著性水平 $\alpha=0.05$ 下, 比较镍合金铸件硬度有无显著提高. 以上两个例子,都是$t$分布的典型案列:样本点少,但是需要用样本估计总体数据。 ## t分布的定义 如果从一个**正态分布的总体**中,随机抽取无数个“小样本”(每个样本量为n),对每个样本计算一个统计量t: $$ t = \frac{\bar{X} - \mu}{s/\sqrt{n}} $$ (其中$\bar{X}$是样本均值,μ是总体均值,s是样本标准差,n是样本量) 那么所有这些t值会构成一个分布,这个分布就是**t分布**。把普通正态分布标准化后就得到下面的正式定义: ### t分布定义 设随机变量 $X \sim N(0,1), Y \sim {\chi}^2(n)$ ,且 $X$ 与 $Y$ 相互独立, 则称 $$ \boxed{ T = \dfrac{X}{\sqrt{Y / n}} } $$ 所服从的分布为自由度为 $n$ 的 $t$ 分布,记为 $T \sim t(n)$. ### $t$-分布的密度函数与图形 $$ f(x)=\dfrac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n \pi } \Gamma\left(\frac{n}{2}\right)}\left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}},-\infty<x < +\infty $$ 密度函数如下 {width=500px} 还是那句话,t分布的概率密度函数是不可能记住的,也不需要记住。但我们还是得分析一下定义。t分布是**偶函数**,关于y轴对称。可以看出,t变量是一个正态变量除以卡方变量比上自由度的开方得到的。 分子是正态变量,分母源于正态变量,所以,t变量也源于正态变量。明白t变量的构造形式,后面你对各种各样的涉及t统计量的参数估计、假设检验,就不至于很懵了。 反正所有的t统计量的样子都是一个正态变量除以卡方变量(实在不行,理解成方差也能应对大多数场景)比上n的开方。 可以证明当$n>45$时,他可以看成正态分布。 ## 理解:t分布为什么是除法 > 在理解t分布时,我们必须注意一个前提:总体方差通常是未知的。比如检测食盐包装是否合格,我们并不知道总体$\sigma$的数据上下浮动的范围是多少,此时我们就用样本$s$的数据上下浮动来替代总体的上下浮动,由此构造出了t分布。 t分布的定义式之所以是**除法形式**,核心原因是它是为了解决 “未知总体方差时,对正态总体均值进行估计或检验” 的问题而构造的统计量,本质是**标准化正态变量**与**卡方变量开方**的比值。 ### 1. 先明确t分布的严格定义 设两个独立的随机变量满足: - $X \sim N(0,1)$ (标准正态分布) - $Y \sim \chi^2(n)$ (自由度为 $n$ 的卡方分布) 则构造的新随机变量 $$t = \frac{X}{\sqrt{\frac{Y}{n}}}$$ 服从**自由度为 $n$ 的t分布**,记为 $t \sim t(n)$。 这个式子的除法形式,是由**问题背景**和**统计量构造逻辑**共同决定的。 ### 2. 除法形式的核心逻辑:解决“方差未知”的痛点 我们先回忆已知方差时,正态总体均值的标准化统计量: $$Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1)$$ 这里 $\sigma$ 是**总体标准差**,是已知常数。 但实际研究中,$\sigma$ 几乎都是未知的,我们只能用**样本标准差 $S$** 去替代 $\sigma$。此时统计量变为 $$\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$$ #### 关键推导: - 分子:$\bar{X}-\mu$ 经过标准化后服从 $N(0,1)$,对应t分布定义里的 $X$。 - 分母:样本标准差 $S$ 的平方 $S^2$ 满足 $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$(卡方分布的性质),整理得 $\frac{S}{\sigma} = \sqrt{\frac{\chi^2(n-1)}{n-1}}$。 - 代入后,$\sigma$ 会被约掉,最终得到 $$\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}} = \frac{\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}}{\sqrt{\frac{\chi^2(n-1)}{n-1}}} \sim t(n-1)$$ 注意:这里自由度是$n-1$,而不是$n$ 这完全符合t分布的定义式——**分子是标准正态变量,分母是卡方变量除以自由度后的开方**,因此必然是除法形式。 ### 3. 除法形式的直观意义 t分布的除法形式,本质是**样本均值与总体均值的偏差** 和**样本数据的离散程度
其他版本
【概率论与数理统计】商的分布
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
卡方分布χ²★★★★★
下一篇:
F分布★★★★★
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com