科数网
数学题库
数学试卷
数学组卷
在线学习
电子教材
科数
试题
试卷
学习
教材
VIP
你好
游客,
登录
注册
在线学习
数学公式
概率论与数理统计
复习2:随机变量与分布
最后
更新:
2024-03-27 14:23
●
参与者
查看:
170
次
纠错
分享
参与项目
词条搜索
复习2:随机变量与分布
## 分布函数的定义 许多随机试验的结果与实数密切联系, 也有些随机试验结果从表面上看并不与实数相联系,但是我们可以通过映射让它与实数关联。 比如扔硬币,规定正面向上为1,反面向上为0,那么扔两次的结果就是: $\Omega=\{00,01,10,11\}$ 在上面这种映射里,这仅是映射的一种方式,就像扔硬币,你也可以映射“扔两次结果一样”的记做1,”扔两次结果不一样”的记做0,都是可以的,这不重要,重要的是他都可以映射为定义域为实数的函数。 为什么要做映射?因为数学喜欢研究抽象的。就像小时候学习,2个苹果加3个梨等于5个水果,我们抽象出$2+3=5$, 这样再遇到 2个橘子加3个香蕉就知道等于5个水果。 #### 定义(离散连续都适应) 给定一个随机变量 $X$ ,对任意实数 $x \in(-\infty,+\infty)$ 称函数 $F(x)=P(X \leq x)$ 为随机变量 $X$ 的分布函数. 对任意满足条件 $-\infty<a<b<+\infty$ 的实数 $a, b$ ,有 $P(a<X \leq b)=F(b)-F(a) .$ (1) 非负性: $0 \leq F(x) \leq 1$. (2) 规范性: $F(-\infty)=0, F(+\infty)=1$. (3) 单调不减性: 对于任意 $x_1< x_2 $, 有 $F\left(x_1\right) \leq F\left(x_2\right)$. (4) 右连续性: $F\left(x_0+0\right)=F\left(x_0\right)$. #### 典型例题 在上面性质(2)里,其本质是 $\lim _{x \rightarrow+\infty} F(x)=F(+\infty)=1 $ $ \lim _{x \rightarrow-\infty} F(x)=F(-\infty)=0$ 利用这2个结论可以求值。 例:已知分布函数 $$F(x)=\left\{\begin{array}{cc} 0 & x < 0 . \\ \Delta x^2 & 0 \leqslant x<1 \\ 1 & 1 \leqslant x \end{array}\right. $$ ,求A的值。 解:$ \lim_{x \rightarrow 1^{-}} A x^2=A=F(1)=1 . $ ## 02密度函数的性质 (1) 非负性: $f(x) \geq 0(-\infty< x < +\infty)$. (2) 规范性: $\int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1$. (3) 对于任意实数 $a$ 和 $b(a < b )$, 有 $P\{a < X \leq b\}=\int_a^b f(x) \mathrm{d} x$. (4) 对于连续型随机变量 $X$, 有 $P\{X=x\}=0$, 对 $\forall x \in R$ 成立. (5) 连续型随机变量的分布函数 $F(x)$ 是连续函数. (6) 在 $f(x)$ 的连续点处, 有 $F^{\prime}(x)=f(x)$. ## 03离散型分布函数 设 $X$ 为一随机变量, 若 $X$ 只取有限或可数个值, 则称 $X$ 为一个 (一维) 离散随机变量. 设其全部可能值为 $\left\{a_{1}, a_{2}, \ldots\right\}$, 则称 $p_{i}=P\left(X=a_{i}\right), i=1,2, \ldots$ 为 $X$ 的概率函数. 若将概率相同的伯努利 Bernoulli 试验独立地重复 $n$ 次, 则称其为 $n$ 重 Bernoulli 试验. **离散型分布** #### 0-1 分布 $X \sim B(1, p)$ $$ \begin{aligned} & P(X=k)=p^k(1-p)^{1-k},(k=0,1) . \\ & E X=p, \quad D X=p(1-p) . \end{aligned} $$ #### 二项分布 $X \sim B(n, p)$ $$ \begin{aligned} & P(X=k)=C_n^k p^k(1-p)^{n-k},(k=0,1, \cdots, n) . \\ & E X=n p, \quad D X=n p(1-p) . \end{aligned} $$ 0-1分布可以认为是二项分布里,$n=1$的特殊情况。 服从 0-1 分布. 又称 Bernoulli伯努利分布.在实际生活里,检查产品质量是否合格,电力是否超负荷,抛硬币等服从 0-1 分布。 #### Poisson 泊松分布 $X \sim P(\lambda)(\lambda>0)$ $$ \begin{aligned} & P(X=k)=\frac{\lambda^k}{k !} \mathrm{e}^{-\lambda},(k=0,1,2 \cdots) . \\ & E X=\lambda, \quad D X=\lambda . \end{aligned} $$ 在一天内, 来到某商场的顾客数,一本书中一页印刷错误数,某医院急诊病熟人,一个时间内交通事故数量, 在单位时间内,一电路受到外界电磁波的冲击次数. 1 平方米内,玻璃上的气泡数. ,铸件上的砂眼数. 在一定时期内, 某种放射性物质放射出来的 $\alpha$-粒子数,等等. > (小数定理) 在 $n$ 重 Bernoulli 试验中, 以 $p_{n}$ 代表事件 $A$ 在试验中出现的概率, 它与实验总数 $n$ 有关. $$ n \rightarrow \infty, n p_{n} \rightarrow \lambda $$ 那么 $$ n \rightarrow \infty,\left(\begin{array}{c} n \\ k \end{array}\right) p_{n}^{k}\left(1-p_{n}\right)^{n-k} \sim \frac{\lambda^{k}}{k !} \mathrm{e}^{-\lambda} $$ 上式表明,以 $n,p$为参数的二项分布的概率值可以有参数为$\lambda=np$的泊松分布的概率值近似。 **典型例题** 已知某种疾病的发病率为 0.001 , 某单位共有 5000 人. 问该单位患有这种疾病的人数不超过 5 人的概率为多少? 解 设该单位患有这种疾病的人数为 $X$, 则有 $X \sim b(5000,0.001)$, 而我们所求的为 $$ P(X \leqslant 5)=\sum_{k=0}^5\left(\begin{array}{c} 5000 \\ k \end{array}\right) 0.001^k 0.999^{5000-k} . $$ 这个概率的计算量很大. 由于 $n$ 很大, $p$ 很小, 且 $\lambda=n p=5$. 所以用泊松近似得 $$ P(X \leqslant 5) \approx \sum_{k=0}^5 \frac{5^k}{k !} \mathrm{e}^{-5}=0.616 . $$ #### 几何分布 $X \sim G(p)$ 在伯努利试验序列中, 记每次试验中事件 $A$ 发生的概率为 $p$, 如果 $X$ 为事件 $A$ 首次出现时的试验次数, 则 $X$ 的可能取值为 $1,2, \cdots$, 称 $X$ 服从几何分布, 记为 $X \sim G e(p)$,其分布列为$P(X=k)=(1-p)^{k-1} p, k=1,2, \cdots .$ $$ \begin{aligned} & P(X=k)=p(1-p)^{k-1},(0< p < 1 , k=1,2, \cdots) . \\ & E X=\frac{1}{p}, \quad D X=\frac{1-p}{p^2} . \end{aligned} $$ 在 $n$ 重 Bernoulli 试验中, 若 $n \rightarrow \infty$, 则称该试验为可列重 Bernoulli 试验. $$ P(X=k)=q^{k-1} p=(1-p)^{k-1} p, k=1,2, \ldots $$ 为服从几何分布. 记为 $X \sim G(p)$. > 几何分布的意义是, 进行可列重 Bernoulli 试验时第一次成功所需的次数. 所以有无限次可能的验证前提是必要的. 实际问题中有不少随机变量服从几何分布, 臂如, 某产品的不合格率为 0.05 , 则首次查到不合格品的检查次数 $X \sim G e(0.05)$. 某射手的命中率为 0.8 , 则首次击中目标的射击次数 $Y \sim G e(0.8)$. 掷一颗骰子,首次出现 6 点的投郑次数 $Z \sim G e(1 / 6)$. 同时掷两颗骰子, 首次达到两个点数之和为 8 的投掷次数 $W \sim G e(5 / 36)$. > 几何分布是唯一具有无记忆性的离散分布. #### 超几何分布 $X \sim H(N, M, n)$ 从一个有限总体中进行不放回抽样常会遇到超几何分布. 设有 $N$ 件产品, 其中有 $M$ 件不合格品. 若从中不放回地随机抽取 $n$ 件, 则其中含有的不合格品的件数 $X$ 服从超几何分布, 记为 $X \sim h(n, N, M)$. $$ P(X=k)=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n},(k=0,1, \cdots, \min \{n, M\}) . $$ 超几何分布是一种常用的离散分布, 它在抽样理论中占有重要地位.但是目前考试对此分布不做要求,因此不再介绍此分布的性质。 ## 04连续性分布函数 ### 连续性分布函数的定义 $F(x)=P(X \leq x)=P(\{\omega: X(\omega) \leq x\})=P\left(X^{-1}(-\infty, x]\right)$ ### 连续性密度函数的定义 若 $\exists f(x) \geq 0$, $F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t($ 也意味着 $F(x)$ 在 $\mathbb{R}$ 上绝对连续, 因为没有规定 $f(x)$ 必须连续所以不一定可导.), 那么 $F^{\prime}(x)=f(x)$, 称 $f(x)$ 为 $F(x)$ 的概率密度函数. **连续型分布 ** #### 均匀分布 $X \sim U(a, b)$ $$ \begin{aligned} & f(x)= \begin{cases}\frac{1}{b-a}, & a< x < b, \\ 0, & \text { 其他. }\end{cases} \\ & E X=\frac{a+b}{2}, D X=\frac{(b-a)^2}{12} \text {. } \\ & \end{aligned} $$ $$ F(x)=\left\{\begin{array}{l} 0, x \leq a \\ \frac{x-a}{b-a}, a< x < b \\ 1, x \geq b \end{array}\right. $$ 均匀分布又被称为平顶分布, 它的背景可视作随机点 $X$ 等可能地落在区间 $(a, b)$上.均匀分布在实际中经常使用, 譬如一个半径为 $r$ 的汽车轮胎, 因为轮胎圆周上的任一点接触地面的可能性是相同的, 所以轮胎圆周接触地面的位置 $X$ 服从 $(0,2 \pi r)$ 上的均匀分布, 这只要看一看报废轮胎的四周磨损程度几乎是相同的就可明白均匀分布的含义了. #### 指数分布 $X \sim E(\lambda)(\lambda>0)$ $$ \begin{aligned} & f(x)= \begin{cases}\lambda \mathrm{e}^{-\lambda x}, & x>0, \\ 0, & \text { 其他. }\end{cases} \\ & E X=\frac{1}{\lambda}, \quad D X=\frac{1}{\lambda^2} . \end{aligned} $$ $$ F(x)=\left\{\begin{array}{l} 1-\mathrm{e}^{-\lambda x}, x \geq 0 \\ 0, x<0 \end{array}\right. $$ 指数分布是一种偏态分布, 由于指数分布随机变量只可能取非负实数, 所以指数分布常被用作各种 “寿命” 分布, 譬如电子元器件的寿命、动物的寿命、电话的通话时间、随机服务系统中的等待时间等都可假定服从指数分布. 指数分布在可靠性与排队论中有着广泛的应用. > 指数分布是唯一具有无记忆性的连续分布. 以下例子说明了泊松分布与指数分布的关系. 如果某设备在长为 $t$ 的时间 $[0, t]$ 内发生故障的次数 $N(t)$ (与时间长度 $t$ 有关)服从参数为 $\lambda t$ 的泊松分布, 则相继两次故障之间的时间间隔 $T$ 服从参数为 $\lambda$的指数分布. 解 设 $N(t) \sim P(\lambda t)$, 即 $$ P(N(t)=k)=\frac{(\lambda t)^k}{k !} \mathrm{e}^{-\lambda t}, \quad k=0,1, \cdots . $$ 注意到两次故障之间的时间间隔 $T$ 是非负随机变量, 且事件 $\{T \geqslant t\}$ 说明此设备在 $[0, t]$ 内没有发生故障, 即 $\{T \geqslant t\}=\{N(t)=0\}$, 由此我们得 当 $t<0$ 时, 有 $F_r(t)=P(T \leqslant t)=0$; 当 $t \geqslant 0$ 时,有 $$ F_T(t)=P(T \leqslant t)=1-P(T>t)=1-P(N(t)=0)=1-\mathrm{e}^{-\lambda t}, $$ 所以 $T \sim \operatorname{Exp}(\lambda)$, 即相继两次故障之间的时间间隔 $T$ 服从参数为 $\lambda$ 的指数分布. #### 正态分布 ①一般正态分布 $X \sim N\left(\mu, \sigma^2\right)$ $$ \begin{aligned} & f(x)=\dfrac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\dfrac{(x-\mu)^2}{2 \sigma^2}},(-\infty < x < +\infty, \sigma > 0 ) . \\ & E X=\mu, \quad D X=\sigma^2 . \end{aligned} $$ ② 标准正态分布 $X \sim N(0,1)$ $$ \varphi(x)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{x^2}{2}}(-\infty< x < +\infty) . $$ 对应的分布函数称为标准分布函数 $$ F(x)=P(X\leq x)=\frac{1}{\sqrt{2\pi}\sigma}\!\int_{-\infty}^{x}\mathrm{e}^{-\frac{(t-\mu)^{2}}{2\sigma^{2}}}\mathrm{d}t $$ (2)正态分布的性质: $\Phi(-x)=1-\Phi(x) ; \Phi(0)=\frac{1}{2} ; P\{|X| \leq a\}=2 \Phi(a)-1$. > 上 $\alpha$ 分位点 设 $X \sim N(0,1)$, 对于给定的 $\alpha(0<\alpha<1)$, 如果 $u_\alpha$ 满足条件: $$ P\left\{X>u_\alpha\right\}=\alpha $$ 则称 $u_\alpha$ 为标准正态分布的上 $\alpha$ 分位点. (3)标准正态分布与一般正态分布的关系 正态分布 $X \sim N\left(\mu, \sigma^2\right)$, 通过线性变换 $Z=\frac{X-\mu}{\sigma}$ 变为标准正态分布. (4)正态分布的 $3 \sigma$ 原则 设随机变量 $X \sim N\left(\mu, \sigma^2\right)$, 则 $$ P(\mu-k \sigma<X<\mu+k \sigma)=P\left(\left|\frac{X-\mu}{\sigma}\right|<k\right)=\Phi(k)-\Phi(-k)=2 \Phi(k)-1 $$ 当 $k=1,2,3$ 时, 有 $$ \begin{aligned} & P(\mu-\sigma<X<\mu+\sigma)=2 \Phi(1)-1=0.6826, \\ & P(\mu-2 \sigma<X<\mu+2 \sigma)=2 \Phi(2)-1=0.9545, \\ & P(\mu-3 \sigma<X<\mu+3 \sigma)=2 \Phi(3)-1=0.9973 . \end{aligned} $$ 这是正态分布的重要性质. 假如某随机变量取值的概率近似满足上式, 则可认为这个随机变量近似服从正态分布; 假如上面三式中有一个偏差较大, 则可以认为这个随机变量不服从正态分布. 这就是正态分布的 $3 \sigma$ 原则。 > 记住常用的积分结果 $$ \int_{-\infty}^{+\infty} \mathrm{e}^{-x^{2}} \mathrm{~d} x=\sqrt{\pi} \quad \int_{-\infty}^{+\infty} \mathrm{e}^{-x^{2} / 2} \mathrm{~d} x=\sqrt{2 \pi} $$ ### 补充两个分布,仅供了解,不做考试要求 下面的仅供了解即可。 #### Laplace 分布 Laplace 分布 (双指数分布, 重尾分布) 的概率密度函数为 $$ f(x)=C \mathrm{e}^{-\lambda|x|} . $$ 其中 $C=\frac{\lambda}{2}$ 为非独立参数, 须满足归一化条件. #### $\Gamma$ 分布 首先回顾 $\Gamma$ 函数的一些性质 (Euler 积分). $\Gamma$ 函数的形式为 $$ \Gamma(s)=\int_{0}^{+\infty} t^{s-1} \mathrm{e}^{-t} \mathrm{~d} t, s>0 $$ 并且, 形如幂函数和自然对数底数的幂的乘积的形式的积分 (尽管有因子) 都可以化成 $\Gamma$ 函数的形式 $$ \int_{0}^{+\infty} t^{\alpha-1} \beta^{\alpha} \mathrm{e}^{-\beta x}=\Gamma(\alpha) $$ 特殊的值 $$ \Gamma(1)=1 \quad \Gamma\left(\frac{1}{2}\right)=\sqrt{\pi} $$ 并且有递推公式 $$ \Gamma(s+1)=s \Gamma(s), s>0 $$ 根据这个可以得到 $$ \Gamma(n)=(n-1) !, n \in \mathbb{N}_{+} $$ 且 $$ \Gamma\left(n+\frac{1}{2}\right)=\left(n-\frac{1}{2}\right)\left(n-\frac{3}{2}\right) \cdots \frac{1}{2} \Gamma\left(\frac{1}{2}\right)=\frac{(2 n-1) ! !}{2^{n}} \sqrt{\pi} $$ $\Gamma$ 分布的概率密度函数为 $$ \gamma(x)=\frac{\beta^{\alpha} x^{\alpha-1} \mathrm{e}^{-\beta x}}{\Gamma(\alpha)} I_{(x>0)} $$ 其中参数 $\alpha, \beta$ 独立,因为 $f$ 在 $\mathbb{R}$ 上的积分恒为 1 . 其中 $\alpha$ 称为形状参数, $\beta$ 称为尺度参数.
上一篇:
复习1:基本概念与概率公式
下一篇:
复习3:一维随机变量和分布
本文对您是否有用?
有用
(
0
)
无用
(
0
)
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数论
群论
纠错
题库
高考
考研
关于
下载
科数网是专业专业的数学网站。