科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
连续型(伽马分布garmma)
最后
更新:
2025-07-22 20:04
查看:
1154
次
反馈
同步训练
连续型(伽马分布garmma)
> 注:在概率论里,和连续分布相关的基本上都和“时间”相关,因为时间是连续的。泊松过程的三个重要分布在概率论和随机过程理论中经常出现,它们分别是:**[泊松分布](https://kb.kmath.cn/kbase/detail.aspx?id=527)**(Poisson Distribution):描述固定时间内发生事件的数量。**[指数分布](https://kb.kmath.cn/kbase/detail.aspx?id=531)**(Exponential Distribution):描述事件间隔时间的分布。**[伽马分布](https://kb.kmath.cn/kbase/detail.aspx?id=960)**(Gamma Distribution):描述多个事件发生时间的分布。点击他们的分布链接可以了解三者之间的区别和联系。 ## 伽马分布 若随机变量 $X$ 的密度函数为 $$ p(x)= \begin{cases}\dfrac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0, \\ 0, & x<0,\end{cases} ...(1) $$ 则称 $X$ 服从伽马分布, 记作 $X \sim G a(\alpha, \lambda)$, 其中 $\alpha>0$ 为形状参数, $\lambda>0$ 为尺度参数. 其中的$\Gamma(\alpha)$ 定义如下 $$ \Gamma(\alpha)=\int_0^{\infty} x^{\alpha-1} \mathrm{e}^{-x} \mathrm{~d} x $$ **对于初次接触伽玛分布的同学,可能会被伽玛分布的密度函数吓跑,感觉太复杂了,请注意:正像正态分布里有$\sqrt{2 \pi}$一样,伽玛分布之所以带 $\Gamma(\alpha)$ 主要是为了让分布函数的值为1,平衡积分的值,我们只要抓住核心关键参数即可** 上面是教程书上常用的写法,为了和维基百科协同, 下面给出常用的另外两个写法,他们本质是一样的 #### 写法1 如果令(1)中 $\alpha=k$, $\lambda=\frac{1}{\theta} $ 则伽玛分布可以写成 $$ p(x)=\dfrac{1}{\Gamma(k) \theta^k} x^{k-1} e^{-\frac{x}{\theta}} ...(2) $$ 在这个写法里,$\lambda$ 使用了倒数, 为什么使用倒数呢?当我们对事件之间的经过时间建模时,我们倾向于用时间间隔而不是速率来表示,例如,计算机可以正常开机的年数是 10 年(而不是说每年 0.1 次故障),飓风每 7 年出现一次(而不是说每年出现 $\frac{1}{7}$ ),这很好理解,只是为了表达方便。想想看:如果您每小时获得 3 个客户 $(\lambda)$ ,则意味着您每 $1 / 3$ 小时获得 1 个客户 $(1 / \lambda)$ ,他们本质是一样的。 想象参考[泊松分布](https://kb.kmath.cn/kbase/detail.aspx?id=527) 里的解释。 #### 写法2 如果令(1)中 $\alpha=\alpha$, $\lambda=\beta $ 则伽玛分布可以写成 $$ p(x)=\dfrac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x} ...(3) $$ 这里,$\alpha$为事件发生的次数,$\frac{1}{\beta}$代表事件发生一次的概率, 从图形上看,α称为形状参数(shape parameter),主要决定了分布曲线的形状;β称为反尺度参数(inverse scale parameter),主要决定曲线有多陡 ### 伽马分布的密度函数图像 关于对密度函数的理解,参考本文后半部。 {width=600px} ## 伽玛函数 在理解伽玛分布前,先介绍一下伽玛函数,当您第一次看到伽玛函数时,你有没有想过为什么要创造这样一个看起来很复杂又无规律的积分函数?其实伽玛函数并不是凭空产生的。 伽玛函数的理由来自函数图像的绘图。在初中我们学过“描点”绘图,比如要绘出$y=x^2$的图像,其中$x$是实数,我们很容易想到,把实数$x$用自然数$n$代替,然后取$n=-2,-1,0,1,2$ 可以得到5个点,把这5个点用曲线连接起来,这就是$y=n^2$图像 如下 {width=300px} 然后我们就想当然的认为$y=x^2$和$y=n^2$长相类似,后者就是前者的粗略版。 有了这个想法,我们现在要问一个问题:$y=x!$的图像是多少(x!表示$x$的阶乘)(点击查看[阶乘](http://kb.kmath.cn/kbase/detail.aspx?id=200)定义 ) 我们已经知道$5!=5*4*3*2*1, 4!=4*3*2*1,... 1!=1$ 既然已经知道$n!$得值,那么把这些点连接起来,是不是就是$y=x!$的图形呢? 我们把问题在具体一点,那 $y=\frac{1}{2} !$ 是多少? 如果要验证我们就要知道 $y=\frac{1}{2} !$ 得值,为此,数学家重要得到了一个伽玛函数,伽玛函数有一个递推公式 $\Gamma(s+1)=s \Gamma(s)(s>0)$ ,现在我们已经知道 $\Gamma\left(\frac{1}{2}\right)=\sqrt{\pi}$ 而至于 $y=n !$ 的图形,也就可以画出来了。不过这已经超出了初等数学的范畴。 伽玛函数的推导已经在高等数学里介绍过,详见 [此处](https://kb.kmath.cn/kbase/detail.aspx?id=1456) > **核心结论来了:伽玛函数可以理解为阶乘函数。他把阶乘的定义域从正整数扩展到了实数** 进一步的,一说到阶乘,你想到了什么?当然是排列组合了,在高中的[排列组合](https://kb.kmath.cn/kbase/detail.aspx?id=200) 会遇到大量阶乘运算,但是传统的阶乘都是正整数运算,伽玛函数相当于把定义域从正整数扩展到了整个实数范围内。 现在我们捋一捋其中的逻辑关系: > **排列组合 $=>$ 阶乘运算 $<=$ 伽玛函数** 所以,阶乘运算相当于桥梁,联系起了 “排列组合”和“伽玛函数”的内在关系。 也因此,你会在概率论的密度函数里,会有大量的伽玛函数出现。 ## 为什么要引入伽玛分布 在理解Gamma分布前,让我们思考以下几个问题: 1.为什么我们要发明Gamma分布?(也就是说,为什么这个分布会存在?) 2.什么时候应该用Gamma分布来做模型? **我们为什么要发明Gamma分布?** 答案:为了预测未来事件发生前的等待时间。 嗯?难道这不是指数分布的研究的问题? 那么,指数分布和Gamma分布的区别是什么呢? **指数分布描述的是独立事件的等待时间。而Gamma分布描述的是直到 k 个事件发生时的等待时间**,简单的来说,指数分布解决的问题是“要等到一个随机事件发生,需要经历多久时间”,伽玛分布解决的问题是“要等到 k 个随机事件都发生,需要经历多久时间” 指数分布(Exponential Distribution)对应几何分布 伽马分布(Gamma Distribution)对应负二项分布 ## 推导伽玛分布的密度函数PDF 在指数分布中,我们从泊松过程推导出了指数分布的PDF(详见[此处](https://kb.kmath.cn/kbase/detail.aspx?id=531))。 要很好地理解Gamma分布,需要很好地理解它们。我们的学习顺序应该是:1.泊松分布,2.指数分布,3.gamma分布。 Gamma分布的PDF的推导与指数分布PDF的推导非常相似,除了一点--它是到第 k 个事件的等待时间,而不是第1个事件。 > $T$ :到第 $k$ 个事件的等待时间的随机变量(这是感兴趣的随机变量),其中事件的到达是由速率为 $\lambda$ 的泊松过程建模的。 $k$ :伽马的第一个参数,所等待的事件发生的次数。 $\lambda$ : Gamma的第二个参数,遵循泊松过程的事件发生率。 $P(T>t)$ :到第 $k$ 个事件的等待时间大于 $t$ 个时间单位的概率。 $P(X=k /$ 在 $t$ 时间范围内 $)$ :在 t 个时间单位内发生 $k$ 个事件的泊松概率。 常规方法,为了得到PDF,我们将首先找到CDF,然后对其进行微分即可。 分布函数$CDF$: $$ \begin{aligned} P(T \leq t) & =1-P(T>t) \\ & =1-P(0,1,2, \ldots K-1 \text { 事件发生在 }[0, t]) \\ & =1-\sum_{x=0}^{k-1} \frac{(\lambda t)^x e^{-\lambda t}}{x!} \end{aligned} $$ 第一步:与指数分布的推导完全相同,除了多个事件,而不是在 $T$ 期间的 0 个事件。 第二步:增加手动排他性事件的规则 第三步:$x$ 为事件发生的次数 对分布函数$CDF$求导,即可得到密度函数$PDF$: $$ \frac{d}{d t}(C D F)=\frac{d}{d t}\left(1-\sum_{x=0}^{k-1} \frac{(\lambda t)^x e^{-\lambda t}}{x!}\right) $$ 现在,让我们对它进行微分。 为了便于微分,我们把 $x=0$ 时的 $\left(e^{-\lambda t}\right)$ 项从求和中取出。  我们得到了Gamma分布的PDF。 这个推导看起来很复杂,但我们只是重新排列变量,应用微分的乘积法则,再到求和,并划掉一些常数项,毕竟常数项的微分等于 0 。 如果你看一下推导的最终输出,当 $k=1$ 时,你会发现它与指数分布的PDF相同。 由于 $k$ 是一个正整数( $k$ 事件的数量),$\Gamma(k)=(k-1)$ !其中 $\Gamma$ 表示gamma函数。最终结果可以改写为: $$ \begin{aligned} \frac{\lambda e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!} & =\frac{\lambda e^{-\lambda t} \lambda^{k-1} t^{k-1}}{(k-1)!} \\ & =\frac{\lambda^k t^{k-1} e^{-\lambda t}}{(k-1)!} \\ & =\frac{\lambda^k t^{k-1} e^{-\lambda t}}{\Gamma(k)} \end{aligned} $$ > 如果事件的到达遵循速率为 $\lambda$ 的泊松过程,那么直到 $k$ 个到达的等待时间遵循 $\Gamma(k, \lambda)$ 分布。 ## Gamma分布参数:一个shape一个scale?  第一:它有两种的参数集: -$(\alpha, \beta)$ -$(k, \theta)$ 对应不同参数集的PDF,当然了只是形式不同,参数的简单变形而已。 第二:对 scale 参数应有什么现实意义,暂时没有普遍共识。 让我们来梳理一下: 第一个问题是非常直接的,看上图后有直观的感受: -对于 $(\alpha, \beta)$ 参数形式:回顾一下,上面推导公式我们采用的是 $k$(事件的数量)和 $\lambda$(事件的速率)作为参数,那么,我们简单地 $k$ 替代为 $\alpha, \lambda$ 替代为 $\beta$ 。当然,PDF的格式与我们所得出的相同。 -对于 $(k, \theta)$ 参数化:$k$ 没有变化,只是 $\theta$ 是事件率 $\lambda$ 的倒数,它服从 $[$ 指数分布 $]]$(事件到达之间的平均时间)。 仅仅是PDF表达形式不同而已,所以两种参数化都会产生统一的模型。就像用参数来描述直线,有些人使用 $x$-轴 做为 截距,而有些人使用 $y$-轴 做为 截距,选择一种参数化而不是另一种参数化是一个习惯问题。仅限个人观点,使用 $\lambda$ 作为速率参数更有意义,因为我们是用泊松速率 $\lambda$推导出指数和Gamma分布,与指数分布的公式中的 $\lambda$ 保持统一,更容易记忆与理解。同时,我还发现 $(\alpha, \beta)$ 参数化公式更整洁。 第二,有些学者称 $\lambda$ 为尺度参数,而其他人则称 $\theta=1 / \lambda$ 为尺度参数。我认为,shape 或 scal e 参数实际上是一种错误的命名。我用不同的 $k$ 和 $\lambda$ 组合绘制了多个Gamma PDF $(k$ 和 $\lambda$ 有无限的参数选择,因此,有无限多的可能的Gamma分布,会明显发现 $k$ 和 $\lambda$ 都会改变 shape 和 scal $e$ 。认真给它们命名的人可以给它们起更直观的名字,如--事件数和泊松速率! > 眼见为实! 让我们来想象一下 K : 你等待发生的事件的数量。 $\lambda$ : 事件发生的速率,遵循泊松过程  对于一个固定的比率 $\lambda$ ,如果我们等待更多的事件 $k$ 发生,等待时间 $T$ 将更长,符合人的认知预期。  对于固定数量的事件 $k$ ,当事件率 $\lambda$ 较高时,我们等待的时间 $T$ 较短,当然符合我们的对世界的认知。 `例`假设某电话总机收到的电话数服从泊松过程,其中每分钟平均有5个.求第个电话后不到一分钟就有第二个电话的概率是多少? 解 泊松过程中两个泊松事件发生的时间间隔服从伽玛分布 $\beta=0.2, \alpha=2 . X$ 记为第一个电话与第二个电话的间隔时间, 则所求的概率为: $$ P(X \leqslant 1)=\int_0^1 \frac{1}{\beta^2} x e^{-x / \beta} d x=25 \int_0^1 x e^{-5 x} d x=1-e^{-5}(1+5)=0.96 . $$ > **再次分析在本例题里参数意义,因为要求的是“第二个电话概率”,所以事件数量$n=2$,但是伽玛分布通常使用$\alpha$表示事件次数,所以$\alpha=2$。其次,“每分钟平均有5个电话”那么这里$\lambda=5$ ,因为伽玛事件里,需要使用 $\lambda$ 的倒数,并记做$\beta$, 所以 $\beta=1/\lambda=1/5=0.2$ 关于为什么使用倒数,请参考本章[指数分布](https://kb.kmath.cn/kbase/de
其他版本
【高等数学】伽玛函数
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
阅读:正态分布的密度函数是如何推导出来?
下一篇:
连续型(贝塔Beta分布)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com