切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
连续型(狄利克雷Dirichlet 分布)
最后
更新:
2025-12-20 11:05
查看:
94
次
反馈
能力测评
会员8.2元/月
赞助
连续型(狄利克雷Dirichlet 分布)
## 狄利克雷分布 应用背景:当你参加一个大型聚餐时,往往想去一桌人多的地方,也就是“聚集效应”;而自己去一张新的桌子的概率取决于“心情”($\alpha$,比如可能要帮别人占位置,那么$\alpha$较大,占新桌子的可能性也更大) **狄利克雷分布**是一种"分布的分布"(a distribution on probability distribution),由两个参数 $\alpha, G_0$ 确定,即 $G \sim D P\left(\alpha, G_0\right), ~ \alpha$ 是分布参数(concentration or scaling parameter),其值越大,分布越接近于均匀分布,其值越小,分布越concentrated。 $G_0$ 是基分布(base distribution)。 我们可以通过图1来形象的理解DP,可以把DP想象成黑箱,输入分布 $G_0$ ,输出分布 $G$ ,而 $\alpha$ 控制输出的样子。  **狄利克雷分布**(Dirichlet distribution)是一个随机变量连续多元随机分布,它是贝塔分布的多元一般化。它的支集是 $\left\{\left(x_1, \cdots, x_K\right): x_i \in\{0,1\} \forall i \in\{1, \cdots, k\}, \sum_{i=1}^K x_i=1\right\}$ 。对于 $K \geq 2$ ,一个参数为 $\alpha=\left(\alpha_1, \cdots, \alpha_K\right) \in R _{++}^K$ 的 $K$-阶狄利克雷分布随机变量的PDF是 我们有一组来源于混合高斯分布的数据集,希望对其进行聚类,然而我们并不知道这组数据是由几组高斯分布生成的(图1)。  问题特点 (1)聚类数量未知 (2)非参数化,即不确定参数,如果需要,参数数量可以变化 (3)聚类数量服从概率分布 $$ \begin{gathered} f\left(x_1, \cdots, x_K\right)=\frac{1}{B(\alpha)} \prod_{i=1}^K x_i^{\alpha_i-1} \\ B(\alpha)=\frac{\prod_{i=1}^K \Gamma\left(\alpha_i\right)}{\Gamma\left(\alpha_0\right)}, \alpha_0=\sum_{i=1}^K \alpha_i \\ \Gamma\left(\alpha_i\right)=\int_0^{\infty} t^{\alpha_i-1} e^{-t} d t \end{gathered} $$ ## 1. 定义与概率密度函数(PDF) ### (1)适用场景 若有一个**多项分布**的随机试验(结果分为 $K$ 类,每类的概率为 $\boldsymbol{p}=(p_1,p_2,\dots,p_K)$,满足 $\sum_{i=1}^K p_i=1$ 且 $p_i\ge0$),狄利克雷分布就是用来描述参数 $\boldsymbol{p}$ 的分布。 ### (2)PDF公式 若 $K$ 维随机向量 $\boldsymbol{P}=(P_1,P_2,\dots,P_K)$ 服从**狄利克雷分布**,记为 $\boldsymbol{P}\sim\text{Dir}(\boldsymbol{\alpha})$,其中 $\boldsymbol{\alpha}=(\alpha_1,\alpha_2,\dots,\alpha_K)$ 是**浓度参数**($\alpha_i>0$),则其概率密度函数为: $$ f(\boldsymbol{p};\boldsymbol{\alpha}) = \begin{cases} \frac{1}{B(\boldsymbol{\alpha})} \prod_{i=1}^K p_i^{\alpha_i-1}, & \sum_{i=1}^K p_i=1,\;p_i\ge0 \\ 0, & \text{其他} \end{cases} $$ 其中:
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
连续型(柯西分布Cauchy )
下一篇:
连续型(幂律分布)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com