科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
连续型(贝塔Beta分布)
最后
更新:
2025-05-21 11:55
查看:
334
次
反馈
同步训练
连续型(贝塔Beta分布)
> 贝塔分布是统计人员常用的一种数据建模方式,和其它建模不同,他是对**概率**进行建模。比如盒子里有8个白球2个黑球,前面讨论都是对取得**白球数量**进行建模,而贝塔分布是对取得**白球的概率**进行建模 ## 贝塔分布 设 $a, b>0$ .如果随机变量 $X$ 服从下列的密度函数,则我们称呼随机变量服从参数为 $a$ 和 $b$ 的贝塔分布。 贝塔Beta分布的密度函数如下,我们记作 $X \sim B(a, b)$ . $$ \boxed{ f_{t,a, b}= \begin{cases}\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} t^{a-1}(1-t)^{b-1} & \text { 若 } 0 \leqslant t \leqslant 1 \\ 0 & \text { 其他. }\end{cases} } $$ Beta分布的密度函数图像如下 {width=400px} ### Beta 应用分布 Beta分布是一个概率的概率分布。它是一种通用的概率分布,可用于对不同场景中的概率进行建模: - 广告的点击率的分布; - 网站上购买的客户的转化率; - 读者为您的博客点赞的可能性; - 特朗普赢得一次竞选的可能性; - 乳腺癌女性的 5 年生存机会; 由于 Beta 分布对概率进行建模,因此定义域的边界介于 $0$ 和 $1$ 之间。 ## 解析贝塔分布 为了掌握 Beta 分布的底层逻辑,我们首先检查一下它的概率密度函数(PDF): $$ f(x ; \alpha, \beta)=\frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)} $$ 其中: $$ B(\alpha, \beta)=\frac{\Gamma(\alpha) \Gamma(\beta)}{\Gamma(\alpha+\beta)} $$ $\Gamma$ 是 gamma函数 **有什么直觉?** 让我们先暂时忽略系数 $ \frac{1}{B(\alpha, \beta)}$ ,只看分子 $x^{\alpha-1} *(1-x)^{\beta-1}$ ,因为 $ \frac{1}{B(\alpha, \beta)}$ 只是使该函数积分为 1 的规格化常数。 > 上面这句话是什么意思呢?因为密度函数的积分是分布函数,其值必须为1,为了最终积分结果为1,我们会人为增加一些“系数”平衡方程,比如正态分布里含有分母 $\sqrt{2 \pi}$ ,因此不要被Beta分布的复杂公式吓到。 仔细看Beta分母的分子项:$x$ 的幂乘以 $1-x$ 的幂看起来很熟悉。 我们以前看过,似曾相识的感觉,是!二项式分布 $$ P_{(y=k)}=\binom{m}{k} p^k *(1-p)^{m-k} $$ 我们从二项式分布的视角来看贝塔时,就容易理解了。  二项式分布和 beta 分布之间的区别在于,前者对成功次数 $x$ 进行建模,而后者对成功概率$p$进行建模。换句话说,概率是二项式的一个参数;在Beta中,概率是一个随机变量。 > **理解上面这句话后,再看Beta分布的参数$t$,其中要求 $0 \leqslant t \leqslant 1$ ,这是因为密度的取值范围就是0到1.** ## 理解贝塔分布里的 $\alpha, \beta$ 从二项式分布联想到,你能想到 $\alpha-1$ 作为成功的次数和 $\beta-1$ 作为失败的次数,就像二项式分布中的 $n$ 和 $n-x$ 。 $$ \begin{gathered} x^{\alpha-1} *(1-x)^{\beta-1} \\ P_{(y=x)}=\binom{n}{x} p^x *(1-p)^{n-x} \end{gathered} $$ > $\alpha$-代表成功的次数,类似于二项分布中的 $n$ 项。 $\beta$-代表失败的次数,类似于二项分布中的 $n-x$ 项。 您可以按照自己的想法选择 $\alpha$ 和 $\beta$ 参数。例如,如果您认为成功的概率非常高(如 $90 \%$ ),则可以将 $\alpha$ 设为 90 ,将 $\beta$ 设为 10 。反之,如果您认为失败的概率较高,则应将 $\beta$ 设为 $90, \alpha$ 设为 10 。 您可以按照自己的想法选择 $\alpha$ 和 $\beta$ 参数。例如,如果您认为成功的概率非常高(如 $90 \%$ ),则可以将 $\alpha$ 设为 90 ,将 $\beta$ 设为 10 。反之,如果您认为失败的概率较高,则应将 $\beta$ 设为 $90, \alpha$ 设为 10 。  随着 $\alpha$ 的增加(成功事件增多),概率分布的大部分将向右移动。另一方面,$\beta$ 的增加会使分布向左移动(更多失败事件)。 同样,如果我们同时确定 $\alpha$ 和 $\beta$ 都增加,则分布将变窄。 ## 例子:概率的概率 假设某人同意与你约会的可能性服从 Beta 分布,$\alpha=2, \beta=8$ 。 使用 Beta 分布,您的成功率大于 $50 \%$ 的概率是多少?用数学术语来说,我们想找到 $P(X>0.5)$ 。 $$ P(X>0.5)=1-C D F(0.5)=0.01953 $$ 计算 $P(X>0.5)=1-C D F(0.5)$ ,我们得到的概率是 0.01953 。不幸的是,这意味着成功率大于 $50 \%$ 的可能性很低。  ## 我们为什么使用Beta分布? 说到概率分布建模,有很多选项可供选择。你可能会问,为什么我们要使用 Beta 分布,而不是其他任意的概率分布呢? 如果我们只想创建一个概率分布来模拟概率,我们可以使用区间 $(0,1)$ 上的任意分布。创建一个分布应该很容易。只需使用任何在 0 到 1 之间不会无穷大且保持正值的函数,在这个区间( 0到 1)上进行积分,然后简单地用积分的结果除以该函数。这样就得到了一个概率分布,可以用来建立概率模型。这很有道理,听起来也很简单,但为什么我们坚持使用贝塔分布而不是任意概率分布呢? Beta分布有何特别之处? Beta分布是贝叶斯推断中伯努利,二项式,负二项式和几何分布(似乎是涉及成功与失败的分布)的共轭先验,在计算能力不足的情况下,共轭函数对于贝叶斯派来说简直就是救命稻草,而且如此的简单和优雅,像是被上帝亲过一样。 在贝叶斯推理中使用共轭先验(如贝塔分布)具有很
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
连续型(伽马分布garmma)
下一篇:
正态分布与伽玛函数
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com