科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
连续型(指数分布与无记忆性)
最后
更新:
2025-06-06 21:13
查看:
445
次
反馈
同步训练
连续型(指数分布与无记忆性)
> 注:在概率论里,和连续分布相关的基本上都和“时间”相关,因为时间是连续的。泊松过程的三个重要分布在概率论和随机过程理论中经常出现,它们分别是:**[泊松分布](https://kb.kmath.cn/kbase/detail.aspx?id=527)**(Poisson Distribution):描述固定时间内发生事件的数量。**[指数分布](https://kb.kmath.cn/kbase/detail.aspx?id=531)**(Exponential Distribution):描述事件间隔时间的分布。**[伽马分布](https://kb.kmath.cn/kbase/detail.aspx?id=960)**(Gamma Distribution):描述多个事件发生时间的分布。点击他们的分布链接可以了解三者之间的区别和联系。 > 生活中,某个特定事件发生所需要的等待时间往往服从指数分布,例如,许多电子元件的使用寿命、电话的通话时间、母鸡下蛋的等待时间,球场等待进球的时间等都可以认为是服从指数分布的 ## 指数分布 如果随机变量 $X$ 的密度函数为 $$ f(x)=\left\{\begin{array}{cl} \lambda \mathrm{e}^{-\lambda x} & x>0 \\ 0 & \text { 其余 } \end{array}\right. $$ 则称 $X$ 服从参数为 $\lambda$ 的指数分布,记为 $X \sim E(\lambda),(\lambda>0)$. 指数分布的密度函数图像。 {width=300px} 指数分布的分布函数如下图 $$ F(x)=\left\{\begin{array}{cc} 1-\mathrm{e}^{-\lambda x} & x \geq 0 \\ 0 & x<0 \end{array}\right. $$ {width=300px} `例`设随机变量 $X$ 表示某餐馆从开门营业起到第一个顾客到达的等待时间(单位: $\min$ ),若 $X$ 服从指数分布,其概率密度为 $$ f(x)= \begin{cases}0.4 e^{-0.4 x}, & x>0, ~ \\ 0, & \text { 其他. }\end{cases} $$ 求等待至多 5 min 的概率以及等待 $3 \sim 4 min$ 的概率. 解 由题意知 $X$ 的分布函数为 $$ F(x)= \begin{cases}1-e^{-0.4 x}, & x>0, \\ 0, & \text { 其他. }\end{cases} $$ 可得 $$ \begin{gathered} P\{X \leqslant 5\}=F(5)=1-e^{-2} \approx 0.865, \\ P\{3 \leqslant X \leqslant 4\}=F(4)-F(3)=e^{-1.2}-e^{-1.6} \approx 0.099 . \end{gathered} $$ ## 为什么我们必须发明指数分布? 在理解指数分布前,建议已经阅读了[泊松分布](https://kb.kmath.cn/kbase/detail.aspx?id=527)。 为什么我们必须发明指数分布?答案是预测直到下一个事件(即成功,失败,到达等)的等待时间! 例如,我们要预测以下内容的时间间隔: - 直到客户完成浏览和实际购买的东西在你的商店(成功)的时间间隔 - 直到在阿里云硬件出现故障的时间间隔 - 你需要等待直到公交车到达的时间间隔 那么,我的下一个问题是:为什么直到发生下一个事件的时间概率密度是: $$ f_T(t)=\lambda \star e^{-\lambda t} $$ 进一步的,后续问题将是: $$ X \backsim \operatorname{Exp}(0.25) $$ 0.25 是什么意思?表示 0.25 分钟、小时或天,还是 0.25 个事件? > **指数分布 $X \sim \operatorname{Exp}(\lambda)$ 中 $\lambda$ 与泊松分布中 $X \sim \operatorname{P}(\lambda)$ 的 $\lambda$ 相同吗?** 请记住以下说明,为防止参数混淆,$X \sim \operatorname{Exp}(0.25)$ 中, 0.25 不是一个持续时间,它是一个事件速率,这与泊松过程参数 $\lambda$ 意义完全相同。 例如,您的博客每天有 500 位访问者,是一个事件速率,一小时内到达商店的顾客数量,每年发生的地震数量,一周内发生的车祸数量,页面上的错字数量等都是时间单位内的速率,它是泊松分布的参数 $\lambda$ 。 **但是,当我们对事件之间的经过时间建模时,我们倾向于用时间间隔而不是速率来表示,例如,计算机可以正常开机的年数是 10 年(而不是说每年 0.1 次故障),飓风每 7 年出现一次(而不是说每年出现$\frac{1}{7}$),客户每 10 分钟到达一次,依此类推。当您看到术语-指数分布的"均值"时,就是 $1 / \lambda$ ,这很好理解,只是为了表达方便。** 当您看到术语"衰减参数",或是术语"衰减率"时,就会开始困惑,该术语经常在指数分布中使用。所述衰减参数是用来表示时间(例如,每 10 分钟,每 7 年等),这是一个泊松分布速率参数 $(\lambda)$ 的倒数 $(1 / \lambda)$ 。想想看:如果您每小时获得 3 个客户 $(\lambda)$ ,则意味着您每 $1 / 3$ 小时获得1个客户( $1 / \lambda$ )意义相同。 因此,现在您可以回答以下问题: "$X \sim \operatorname{Exp}(0.25)$"是什么意思?这意味着泊松速率为 0.25 。在单位时间内(一分钟,一小时或一年),该事件平均发生 0.25 次。将此转换为时间项,假设您的单位时间为一个小时,那么直到事件发生需要 4 个小时(倒数 0.25 的倒数)。 **因此** >1.指数参数 $\lambda$ 与泊松过程 $(\lambda)$ 相同 2.指数分布中经常讨论 $1 / \lambda$ 3. $1 / \lambda$ 代表下一次发生的时间间隔 ## 让我们开始从头推出指数分布的密度公式(PDF) 我们的第一个问题是:为什么直到下一个事件发生时的时间的PDF为: $$ \lambda \cdot e^{-\lambda t} $$ 指数分布概率分布研究的是泊松过程的事件之间的时间间隔。 如果您考虑一下,那么直到事件发生的时间意味着在等待期间,没有一个事件发生。换句话说,这就是 Poisson( $X = 0$ ) $$ \begin{gathered} & P(X=k)=\frac{\lambda^k \cdot e^{-\lambda}}{k!} \\ & P(X=0)=\frac{\lambda^0 \cdot e^{-\lambda}}{0!}=e^{-\lambda} \end{gathered} $$ 关于泊松PDF要记住的一件事是,Poisson $(X=k)$ 发生的时间段仅为一个单位时间内。 如果要对"在持续时间 $t$ 内什么都没有发生"的概率分布进行建模,而不仅仅是在一个单位时间内,您将如何做? $$ \begin{aligned} P & =P(\text { 在 } t \text { 时间间隔内什么都没发生 }) \\ & =P(X=0 \text { 第 } 1 \text { 间隔内 }) * P(X=0 \text { 第 } 2 \text { 间隔内 }) * \ldots * P(X=0 \text { 第 } t \text { 间隔内 }) \\ & =e^{-\lambda} * e^{-\lambda} \ldots e^{-\lambda} \\ & =e^{-\lambda t} \end{aligned} $$ 处理思路像不像几何分布,其实这就是几何分布的微分形式而已 泊松分布假设事件彼此独立发生。因此,我们可以通过将 $P ( X =0$ 在单个时间单位内)$t$ 倍乘以计算在 $t$ 个时间单位内零成功的概率。 $$ P(T>t)=P(X=0 \text { 在 } t \text { 个单位时间内 })=e^{-\lambda t} $$ - $T$ :我们感兴趣的随机变量:直到第一个事件发生的等待时间的随机变量。 - $X$ :遵循泊松分布的单位时间内事件的数量。 - $P(T>t)$ :直到第一个事件的等待时间大于 t 个时间单位的概率; - $P(X=0$ ,以 $t$ 个时间单位):以 $t$ 个时间单位发生事件数为零的概率 密度函数PDF是分布函数CDF的微分,由于我们已经有了CDF(1-P(T>t)),因此可以通过对其进行微分来获得PDF。 $$ \begin{aligned} &P(T \leq t)=1-P(T>t)=1-e^{-\lambda t} \end{aligned} $$ 由此即可得到指数分布的密度函数PDF $$ \begin{aligned} &\frac{d}{d t}(C D F)=\frac{d}{d t}\left(1-e^{-\lambda t}\right)=\lambda e^{-\lambda t} \end{aligned} $$ ## 指数分布的无记忆特性 指数分布的无记忆特性可定义为: 定义: $$ P(T>a+b \mid T>a)=P(T>b) $$ 这意味着,给定一个指数随机变量 $T$ ,在它已经超过第一个周期 $a$ 的情况下,$T$ 超过两个周期之和 $(a+b)$ 的概率等于 $T$ 只超过第二个周期 $b$ 的概率。 指数分布的无记忆如何证明? $$ \begin{gathered} P(T>t)=e^{-\lambda t} \\ P(T>a+b \mid T>a)=\frac{P(T>a+b)}{P(T>a)} \\ =\frac{e^{-\lambda(a+b)}}{e^{-\lambda a}} \\ =e^{-\lambda b} \\ P(T>t)=e^{-\lambda b} \end{gathered} $$ ### 指数分布的无记忆是"有用的"属性吗? 使用指数分布对机械设备的寿命进行建模是否合理? 例如,如果设备已经使用了 9 年,则无记忆意味着设备将再使用 3 年(总共 12 年)的概率与使用新机器在接下来的3年中的概率完全相同年份。 $$ P(T>12 \mid T>9)=P(T>3) $$ 这个方程对您来说看起来合理吗? 对我们而言,事实并非如此。根据经验,设备越旧,发生故障的可能性就越大。为了对此特性建模(增加危险率),我们可以使用例如韦伯分布Weibull分布。 ### 那么,什么时候使用指数分布(恒定风险率)合适呢? 车祸。你发生车祸的概率并不会因为你在过去五小时内是否没有发生过车祸而增加或减少。这就是 λ 经常被称为危险率的原因。 ### 还有谁拥有无记忆的特性? 指数分布是唯一无记忆的连续分布。与之对应的离散分布--几何分布,是唯一无记忆的离散分布。下面是一些应用场景 a)等待时间建模 指数型随机变量值的小值较多,大值较少。例如,您正
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
连续型(均匀分布)
下一篇:
连续型(正态分布-Part1)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com