切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第五篇 大数定律与中心极限定理
林德伯格-列维(独立同分布)中心极限定理★★★★★
最后
更新:
2025-12-12 08:31
查看:
426
次
反馈
能力测评
会员8.2元/月
赞助
林德伯格-列维(独立同分布)中心极限定理★★★★★
林德伯格-列维中心极限定理;德莫弗一拉普拉斯中心极限定理;高尔顿钉板实验
## 大数定律与中心极限定理的区别 大数定律研究的是一系列随机变量 $\left\{X_n\right\}$ 的均值 $\bar{X}_n=\frac{1}{n} \sum_{i=1}^n X_i$ 是否会依概率收敛于其期望 $E \bar{X}_n$ 这个数值,而中心极限定理进一步研究 $\bar{X}_n$ 服从什么分布。若 $\left\{X_n\right\}$ 满足一定的条件(大量、微小),当 n 足够大时, $\bar{X}_n$ 近似服从正态分布,这就是中心极限定理的主要思想,这也体现了正态分布的重要性与普遍性。 > 不同于大数定律,中心极限定理,不是从随机变量某个值的稳定性的角度来考虑稳定性的,而是**从分布的稳定性**来考虑随机变量的稳定性。 ## 独立同分布释义 在解释林德伯格-列维中心极限定理前,先解释一下独立分布的意思。 独立和同分布描述的是随机变量之间两个**不同维度**的关系。 **独立**:关注的是变量之间是否相互影响。 知道 $X1$ 的结果,会不会改变我对$X2$ 结果的预测?如果独立,答案是不会。比如,抛硬币,第一次抛硬币的结果不会影响第二次。再如,车间送来一批产品,检测第一个是否合格不影响下一个是否合格,这些都是独立的意思。 **同分布** 通俗理解是**数据生成机制完全相同**,想象工厂生产一批产品。从同一条生产线、同一个工艺、同一个原料批次中产生,随机抽取产品测量其尺寸。那么,我们有足够的理由认为,每个产品的“母体”都是一样的。 如果用$X_i$ 代表第 $i$ 个产品的尺寸。同分布的意思是:每一个产品都来自同一个“母体”,其尺寸的波动(概率分布)是相同的。测量第1个产品和第1000个产品,它们尺寸的分布规律(均值、方差、形状)是一样的。 独立、同分布由此产生有下面四种组合: ### 独立同分布 例如从一个批人群中**有放回地**随机抽取样本。每个人被抽中的概率始终相同,且每次抽取不影响下次。 再如测量学生的身高,通过多测量几次,每次测量彼此不影响而且每次测量服从统一分布。 再如测量一批产品质量,每个产品质量不互相影响,而且服从统一分布。(这是我们研究的终点) ### 同分布但不独立 变量来源规则相同,但彼此有联系。例如从一个很少人群中**无放回地**抽样。虽然每个人最初被抽中的概率相同(同分布),但一旦某人被抽中,剩下的其他人被抽中的概率就变了,所以变量间不独立。 ### 独立但不同分布 变量互不干扰,但来源规则不同。例子先抛一枚均匀硬币(分布A),再掷一个不均匀的骰子(分布B)。这两次实验是独立的,但它们的概率分布完全不同。 ### 不独立不同分布 比如研究温度和时间的关系,通常一天温度随时间变换,而且分布也不同,这种基本上不是数学上要研究的,可以参考后续课程 随机数学。 ## 林德伯格-列维中心极限定理 **林德伯格-列维中心极限定理**又称作**独立同分布中心极限定理** 设随机变量序列 $X_1, X_2, \cdots, X_n, \cdots$ 相互独立,服从同一分布,其数学期望 $E X_k=\mu_k$ , 方差 $D X_k=\sigma_k^2>0, k=1,2, \cdots$ , 则随机变量 $$ Y_n=\dfrac{\sum_{k=1}^n X_k-E\left(\sum_{k=1}^n X_k\right)}{\sqrt{D\left(\sum_{k=1}^n X_k\right)}}=\dfrac{\sum_{k=1}^n X_k-n \mu}{\sqrt{n} \sigma} $$ 的分布函数$F_n(x)$ 对于任意 $x$ 满足 $$ \lim _{n \rightarrow \infty} F_n(x)=\lim _{n \rightarrow \infty} P\left\{\dfrac{\sum_{k=1}^n X_k-n \mu}{\sqrt{n} \sigma} \leqslant x\right\}=\int_{-\infty}^x \dfrac{1}{\sqrt{2 \pi}} e^{-\frac{t^2}{2}} d t $$ 这就称随机变量序列 $\left\{X_n\right\}$ 服从独立同分布的中心极限定理. 证明略. > **林德伯格-列维中心极限定理 描述了一个非常神奇且强大的现象:无论一个总体(或原始数据)的分布形状如何(无论是钟形的、均匀的、偏斜的甚至是奇怪的形状),只要从这个总体中反复抽取足够多的样本,并计算每个样本的平均值,那么这些样本平均值的分布将总会近似于一个正态分布(即钟形曲线)。简单来说:样本均值的分布会趋于正态。** 从上面结论容易知道,当 $n$ 充分大时,近似地有 $$ \boxed{ Y_n=\dfrac{\sum_{k=1}^n X_k-n \mu}{\sqrt{n \sigma^2}} \sim N(0,1) . } $$ 或者说,当 $n$ 充分大时,近似地有 $$ \boxed{ \sum_{k=1}^n X_k \sim N\left(n \mu, n \sigma^2\right) } $$ ### 理解: 林德伯格-列维中心极限定理 设 $X_1, X_2, ..., X_n$ 是独立同分布的随机变量序列,且具有相同的期望(均值)和方差: **总体均值**:$E(X_i) = \mu$ **总体方差**:$D(X_i) = \sigma^2 > 0$ (方差存在且不为零) 记这些随机变量的**样本均值**为: $$ \bar{X}_n = \frac{X_1 + X_2 + ... + X_n}{n} $$ 那么,当样本量 $n$ 很大时($n \to \infty$),样本均值 $\bar{X}_n$ 的标准化变量会**依分布收敛于标准正态分布**。 标准化变量 $Z_n$ 的计算公式为: $$ Z_n = \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} $$ 林德伯格-莱维中心极限定理的结论就是: $$ Z_n = \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \ \xrightarrow{d}\ N(0,1) \quad (n \to \infty) $$ 其中 $\xrightarrow{d}$ 表示“依分布收敛”,$N(0,1)$ 表示均值为0、方差为1的标准正态分布。 关键要点和解释 1. **独立同分布**:这是该定理成立的核心前提。要求每个样本点都是独立抽取的,并且都来自同一个总体分布。 2. **样本量要“足够大”**:多大会“足够大”? 如果原始总体分布本身就很接近正态分布,那么即使样本量很小(比如 $n=15$),样本均值的分布也可能看起来是正态的。 如果原始总体分布与正态分布相差较多(如高度偏斜、多峰),通常需要样本数超过30,这个30是一个经验值。 3. **标准化过程**:公式 $\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}}$ 非常重要。 * $\bar{X}_n$ 的均值仍然是 $\mu$。 * $\bar{X}_n$ 的标准差(也称为**均值的标准误**)是 $\sigma / \sqrt{n}$。这意味着样本量越大,样本均值的变化范围(波动性)就越小。 * 减去均值 $\mu$ 再除以标准误 $\sigma / \sqrt{n}$,就是将样本均值的分布“转换”为均值为0、标准差为1的标准正态分布。 ## 中心极限定理的通俗解释 中心极限定理通俗的解释就是: >①样本的平均值约等于总体的平均值。②不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。 上面第
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
马尔可夫Markov大数定律
下一篇:
德莫弗一拉普拉斯中心极限定理
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com