科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
连续型(标准正态分布与3σ原则-Part2)
最后
更新:
2025-05-18 07:48
查看:
342
次
反馈
同步训练
连续型(标准正态分布与3σ原则-Part2)
## 标准正态分布 称 $\mu=0, \sigma=1$ 时的正态分布 $N(0,1)$ 为**标准正态分布**.也称为**高斯分布**。 标准正态分布的**密度函数**为 $\varphi(u)$,其图像如下 $$ \varphi(x)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{x^2}{2}}, \quad-\infty<x<\infty, $$ {width=600px} 从标准正态分布的密度函数可以看到: (1)因为密度函数是偶函数,所以函数图像关于$y$轴对称 (2)密度函数定义域为$(-\infty,+\infty)$ 在$-3 \sigma - 3 \sigma$之间占据了几乎所有面积,所以,$-3 \sigma - 3 \sigma$ 被称为 $3 \sigma$ 原则 ### 分布函数 正态分布的分布函数 $\Phi(u)$ $$ \Phi(x)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^x \mathrm{e}^{-\frac{t^2}{2}} \mathrm{~d} t, \quad-\infty<x<\infty . $$ 这个函数是积不出来的,所以只能使用积分符号写着。他的函数图像如下: 函数在 $x=u$ 时取到0.5. {width=300px} 由于标准正态分布的分布函数不含任何未知参数, 故其值 $\Phi(X)=P(X \leqslant x)$ 完全可以算出, **性质1** 当 $x>0$ 时, $\Phi(x)$ 的值可以查概率函数值表得到,且$P(a<X \leq b)=\Phi(b)-\Phi(a)$ **性质2** 当 $x<0$ 时,由密度函数对称性可得 $\Phi(x)=1-\Phi(-x)$ ,特别地,有 $\Phi(0)=\frac{1}{2}$ ; **性质3** 若 $X \sim N\left(\mu, \sigma^2\right)$ ,则 $P(a<X \leq b)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)$特别地 $P(X \leq b)=\Phi\left(\frac{b-\mu}{\sigma}\right) \quad P(X>a)=1-\Phi\left(\frac{a-\mu}{\sigma}\right)$ 这些等式都不难推得. > 这里请务必牢记,分布函数是一个累加值,例如 $\Phi(90)=80$ 表示分数$X$小于90分的有80人,$\Phi(60)=20$表示分数$X$小于60分的有20人,现在要求分数介于60~90分之间的人数,其计算方法就是$P(60 \le X \le 90)=\Phi(90)-\Phi(60)$, 这就是上面性质1的意思。 ### 如何理解正态分布的密度函数 假设某校的初中生身高服从 $X \sim N\left(170,6^2\right)$(单位cm)的正态分布,这里的$\mu$ 相当于平均身高,$\sigma$相当于身高误差。这句话转换为通俗语言就是:某城市初中生平均身高在170cm,其中大部分身高分布在$164cm-176cm$。 因为正态分布是连续性分布,总概率为1,这意味问某一点身高的概率始终为零,身高从 $-\infty$ 到 $+\infty$ 的总概率为1. 从数学计算可以的都如下结论 $$ \begin{aligned} & P(\mu-\sigma<X<\mu+\sigma)=2 \Phi(1)-1=0.6826, \\ & P(\mu-2 \sigma<X<\mu+2 \sigma)=2 \Phi(2)-1=0.9545, \\ & P(\mu-3 \sigma<X<\mu+3 \sigma)=2 \Phi(3)-1=0.9973 . \end{aligned} $$ 第一个等式表明,身高在 $164cm-176cm$ 的占比 68.26% 第二个等式表明,身高在 $158cm-182cm$ 的占比 95.45% 第三个等式表明,身高在 $152cm-188cm$ 的占比 99.73% ## 标准正态分布的数学期望与方差 正态分布的数学期望$E(X)=0$, 方差为$D(X)=1$ ## 正态分布的 $3 \sigma$ 原则 若 $X \sim N\left(\mu, \sigma^2\right)$, 则随机变量 $X$ 在 $\mu$ 的附近取值的概率较大, 在离 $\mu$ 较远处取值的概率较小. 设随机变量 $X \sim N\left(\mu, \sigma^2\right)$, 则 $$ P(\mu-k \sigma<X<\mu+k \sigma)=P\left(\left|\frac{X-\mu}{\sigma}\right|<k\right)=\Phi(k)-\Phi(-k)=2 \Phi(k)-1 $$ 当 $k=1,2,3$ 时,有 $$ \begin{aligned} & P(\mu-\sigma<X<\mu+\sigma)=2 \Phi(1)-1=0.6826, \\ & P(\mu-2 \sigma<X<\mu+2 \sigma)=2 \Phi(2)-1=0.9545, \\ & P(\mu-3 \sigma<X<\mu+3 \sigma)=2 \Phi(3)-1=0.9973 . \end{aligned} $$ 具体地, 如图所示, 随机变量 $X$ 取值 落在区间 $(\mu-\sigma, \mu+\sigma)$ 内的概率约为 $68.27 \%$ , 落在区间 $(\mu-2 \sigma, \mu+2 \sigma)$ 内的概率约为 $95.45 \%$, 落在区间 $(\mu-3 \sigma, \mu+3 \sigma)$ 内的概率约为 $99.73 \%$. {width=380px} 这是正态分布的重要性质被称为正态分布的 $3 \sigma$ 原则. 假如某随机变量取值的概率近似满足上面的值, 则可认为这个随机变量近似服从正态分布; 假如三式中有一个偏差较大, 则可以认为这个随机变量不服从正态分布. 这就是**正态分布的 $3 \sigma$ 原则**, 这个原则在 $X$ 的观察值较多 (成百上千个) 时, 常用于判断 $X$ 的分布是否近似服从正态分布. 在生产中某产品的质量要求常规定其上、下控制限, 若上、下控制限能覆盖区间 $(\mu-3 \sigma, \mu+3 \sigma)$, 则称该生产过程受控制, 并称其比值 $$ C_p=\frac{\text { 上控制限一下控制限 }}{6 \sigma} $$ 为过程能力指数. 当 $C_p<1$ 时, 认为生产过程不足; 当 $C_p \geqslant 1.33$ 时, 认为生产过程正常;当 $C_p$ 为其他值时, 常认为生产过程不稳定, 需要改进. ### 一般地,有下列结论: 设随机变量 $X \sim N(0,1), c>0 $ 则 $$ \begin{aligned} & P(|X|<c)=
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
连续型(正态分布-Part1)
下一篇:
连续性(一般正态分布化为标准正态分布-Part3)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com