科数网
学习首页
高中
高数
线代
概率
公式▼
高中数学公式
高等数学公式
线性代数公式
概率论公式
初中数学公式
在线学习
概率论与数理统计
第二篇 随机变量及其分布
正态分布
最后更新:
2023-12-27 08:12
查看:
299
次
反馈纠错
下载本文
正态分布
## 正态分布 正态分布是概率论与数理统计中最重要的一个分布, 高斯 (Gauss, 1777-1855) 在研究误差理论时首先用正态分布来刻画误差的分布, 所以正态分布又称为高斯分布. 中心极限定理表明:一个随机变量如果是由大量微小的、独立的随机因素的叠加结果, 那么这个变量一般都可以认为服从正态分布. 因此很多随机变量可以用正态分布描述或近似描述,譬如测量误差、产品重量、人的身高、年降雨量等都可用正态分布描述. ## 正态分布的密度函数和分布函数 若随机变量 $X$ 的密度函数为 $$ p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^2}{2 \sigma^2}}, \quad-\infty<x<\infty, $$ 则称 $X$ 服从正态分布, 称 $X$ 为正态变量, 记作 $X \sim N\left(\mu, \sigma^2\right)$. 其中参数 $-\infty<\mu<\infty, \sigma>0$.其密度函数 $p(x)$ 的图形如图 2.5.1 (a) 所示. $p(x)$ 是一条钟形曲线, 中间高、两边低、左右关于 $x=\mu$ 对称, $\mu$ 是正态分布的中心, 且在 $x=\mu$ 附近取值的可能性大, 在两侧取值的可能性小. $\mu \pm \sigma$ 是该曲线的拐点. ![图片](/uploads/2023-12/image_202312274bb1a22.png) 正态分布 $N\left(\mu, \sigma^2\right)$ 的分布函数为 $$ F(x)=\frac{1}{\sqrt{2 \pi} \sigma} \int_{-\infty}^x \mathrm{e}^{-\frac{(t-\mu)^2}{2 \sigma^2}} \mathrm{~d} t . $$ 它是一条光滑上升的 $S$ 形曲线, 见图 2.5.1(b). 图 2.5.2 给出了在 $\mu$ 和 $\sigma$ 变化时,相应正态密度曲线的变化情况. - 从图 2.5.2(a) 中可以看出: 如果固定 $\sigma$, 改变 $\mu$ 的值, 则图形沿 $x$ 轴平移, 而不改变其形状. 也就是说正态密度函数的位置由参数 $\mu$ 所确定, 因此亦称 $\mu$ 为位置参数. - 从图 2.5.2(b) 中可以看出: 如果固定 $\mu$, 改变 $\sigma$ 的值, 则分布的位置不变, 但 $\sigma$愈小, 曲线呈高而瘦, 分布较为集中; $\sigma$ 愈大, 曲线呈矮而胖, 分布较为分散. 也就是说正态密度函数的尺度由参数 $\sigma$ 所确定, 因此称 $\sigma$ 为尺度参数. ## 标准正态分布 称 $\mu=0, \sigma=1$ 时的正态分布 $N(0,1)$ 为标准正态分布. 通常记标准正态变量为 $U$, 记标准正态分布的密度函数为 $\varphi(u)$, 分布函数为 $\Phi(u)$, 即 $$ \varphi(u)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{u^2}{2}}, \quad-\infty<u<\infty, $$ ![图片](/uploads/2023-12/image_202312278832b47.png) $$ \Phi(u)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^u \mathrm{e}^{-\frac{t^2}{2}} \mathrm{~d} t, \quad-\infty<u<\infty . $$ 由于标准正态分布的分布函数不含任何未知参数, 故其值 $\Phi(u)=P(U \leqslant u)$ 完全可以算出,附表 2 对 $u \geqslant 0$ 给出了 $\Phi(u)$ 的值. 对于 $\Phi(u)$ 有 - $\Phi(-u)=1-\Phi(u)$. - $P(U>u)=1-\Phi(u)$. - $P(a<U<b)=\Phi(b)-\Phi(a)$. - $P(|U|<c)=2 \Phi(c)-1(c \geqslant 0)$. 这些等式都不难推得. ## 正态变量的标准化 正态分布有一个家族 $$ \mathscr{P}=\left\{N\left(\mu, \sigma^2\right):-\infty<\mu<\infty, \sigma>0\right\}, $$ 标准正态分布 $N(0,1)$ 是其一个中心成员. 以下定理说明:一般正态变量都可以通过一个线性变换 (标准化) 化成标准正态变量. 因此与正态变量有关的一切事件的概率都可通过查标准正态分布函数表获得. 可见标准正态分布 $N(0,1)$ 对一般正态分布 $N(\mu$, $\left.\sigma^2\right)$ 的计算起着关键的作用. 定理 2.5.1 若随机变量 $X \sim N\left(\mu, \sigma^2\right)$, 则 $U=(X-\mu) / \sigma \sim N(0,1)$. 例 2.5.2 设随机变量 $X$ 服从正态分布 $N\left(108,3^2\right)$, 试求: (1) $P(102<X<117)$; (2) 常数 $a$, 使得 $P(X<a)=0.95$. 解 利用公式(2.5.4) 及查附表 2 得 (1) $$ \begin{aligned} P(102<X<117) & =\Phi\left(\frac{117-108}{3}\right)-\Phi\left(\frac{102-108}{3}\right) \\ & =\Phi(3)-\Phi(-2)=\Phi(3)+\Phi(2)-1 \\ & =0.9987+0.9772-1=0.975 . \end{aligned} $$ (2) 由 $$ P(X<a)=\Phi\left(\frac{a-108}{3}\right)=0.95 \text {, 或 } \Phi^{-1}(0.95)=\frac{a-108}{3}, $$ 其中 $\Phi^{-1}$ 为 $\Phi$ 的反函数. 从附表 2 由里向外反查得 $$ \Phi(1.64)=0.9495, \quad \Phi(1.65)=0.9505, $$ 再用线性内插法可得 $\Phi(1.645)=0.95$, 即 $\Phi^{-1}(0.95)=1.645$, 故 $$ \frac{a-108}{3}=1.645 \text {, } $$ 从中解得 $a=112.935$. 从上例我们可以看出, 有些场合下给定 $\Phi(x)$ 的值 $p$, 可以从附表 2 中由里向外反查表来得到 $x_p$, 使 $\Phi\left(x_p\right)=p$ 或 $\Phi^{-1}(p)=x_p$, 这时 $x_p$ 称为标准正态分布的 $p$ 分位数. 在上例中 1.645 就是标准正态分布的 0.95 分位数, 更一般叙述见 2.7 .3 节. 分位数在统计中大量使用。 ##正态分布的 $3 \sigma$ 原则 设随机变量 $X \sim N\left(\mu, \sigma^2\right)$, 则 $$ P(\mu-k \sigma<X<\mu+k \sigma)=P\left(\left|\frac{X-\mu}{\sigma}\right|<k\right)=\Phi(k)-\Phi(-k)=2 \Phi(k)-1 $$ 当 $k=1,2,3$ 时,有 $$ \begin{aligned} & P(\mu-\sigma<X<\mu+\sigma)=2 \Phi(1)-1=0.6826, \\ & P(\mu-2 \sigma<X<\mu+2 \sigma)=2 \Phi(2)-1=0.9545, \\ & P(\mu-3 \sigma<X<\mu+3 \sigma)=2 \Phi(3)-1=0.9973 . \end{aligned} $$ 这是正态分布的重要性质. 假如某随机变量取值的概率近似满足 (2.5.5), 则可认为这个随机变量近似服从正态分布; 假如 (2.5.5) 三式中有一个偏差较大, 则可以认为这个随机变量不服从正态分布. 这就是正态分布的 $3 \sigma$ 原则, 这个原则在 $X$ 的观察值较多 (成百上千个) 时, 常用于判断 $X$ 的分布是否近似服从正态分布. 在生产中某产品的质量要求常规定其上、下控制限, 若上、下控制限能覆盖区间 $(\mu-3 \sigma, \mu+3 \sigma)$, 则称该生产过程受控制, 并称其比值 $$ C_p=\frac{\text { 上控制限一下控制限 }}{6 \sigma} $$ 为过程能力指数. 当 $C_p<1$ 时, 认为生产过程不足; 当 $C_p \geqslant 1.33$ 时, 认为生产过程正常;当 $C_p$ 为其他值时, 常认为生产过程不稳定, 需要改进. ## 图像 设随机变量 $X$ 的概率密度函数为 $$ f(x)=\frac{1}{\sqrt{2 \pi} \sigma} \cdot \mathrm{e}^{-\frac{(x-\mu)^2}{2 \sigma^2}}, \quad x \in R $$ 则称 $X$ 服从参数为 $\mu, \sigma^2$ 的正态分布, 记为 $X \sim N\left(\mu, \sigma^2\right)$. 服从正态分布的随机变量统称为正态随机变量. 正态分布的密度函数曲线图形 ![图片](/uploads/2023-01/image_202301034e14bfc.png) 正态分布概率密度函数的曲线特征: 1 密度函数 $f(x)$ 的图形关于 $x=\mu$ 对称; 2$ f(x)$ 在 $x=\mu$ 处取得最大值 $f(\mu)=\frac{1}{\sqrt{2 \pi} \sigma}$ ; 3 当 $|x| \rightarrow \infty$ 时, $f(x) \rightarrow 0$ ; ![图片](/uploads/2023-01/image_202301031a14d50.png) 正态分布概率密度函数的曲线特征: 4 当 $\sigma^2$ 较大时曲线比较平坦,当 $\sigma^2$ 较小时曲线比较陡峭. ![图片](/uploads/2023-01/image_20230103f6ec878.png) $$
上一篇:
均匀分布
下一篇:
标准正态分布
本文对您是否有用?
有用
(
0
)
无用
(
0
)
打赏作者
0
条评论
写评论
更多笔记
提交评论