科数网
首页
高中数学
高等数学
线性代数
概率统计
实变函数
复变函数
离散数学
数论
群论
搜索
公式
高中数学公式
高等数学公式
线性代数公式
概率论公式
初中数学公式
关于
高中
高数
线性
概率
复变
搜索
游客,
登录
注册
在线学习
概率论与数理统计
第三篇 多维随机变量及其分布
和的分布与卷积公式
最后
更新:
2025-01-10 09:21
●
参与者
查看:
180
次
纠错
分享
参与项目
词条搜索
和的分布与卷积公式
## 为什么引入卷积 在前面章节中, 我们研究了随机变量, 并取得了很大的成功. 关于随机变量, 最自然的问题就是它的概率密度是多少?不幸的是, 从 $X$ 和 $Y$ 的概率密度过渡到它们的和 $X + Y$ 的概率密度并不容易. 如果加入更多的随机变量, 那么情况会更糟. 因为我们还没有过多地讨论为什么要添加很多随机变量, 所以现在就来简单地介绍一下, 这强调了求出这些新的概率密度函数的必要性. 弄清楚如何做到这一点是本节的两大主题之一. 因为我们可以轻松地通过添加随机变量的相关应用来把几章内容补充完整,所以这里会给出一般化的例子. 科**学的重要教训之一是, 把一个复杂的问题简化成许多简单的问题**. 在化学课上, 你要学会把化合物分解成组成原子.在数论中, 你学习把整数分解成素数的乘积. 我们还可以给出很多其他的例子, 这些例子都说明了同一个原理:把一个复杂的物体分解成更简单的成分. 在概率论中, 我们也可以用这样做. 例如, 要想弄清楚抛掷 n 颗均匀骰子的结果, 只需要了解抛掷一颗骰子的可能结果, 并把所有结果组合起来就行了. 同样地, 我们也可以通过了解抛掷一枚均匀硬币的结果来理解抛掷 n 枚硬币的情形. 当然, 这个原理的宝贵价值不仅仅体现在抛掷硬币和骰子上. 想象一下, 我们正在试着理解消费者的行为:可能想了解电影市场的需求, 或者要为航空公司设计日程安排, 又或者要把产品送到市场. 可以尝试理解不同个体行为的可能性, 然后把它们组合在一起. ### 简单举例 假设有一个概率密度函数为 $f_X$ 的随机变量 $X$ 和另一个概率密度函数为 $f_Y$ 的随机变量 $Y$ ,我们想知道 $Z=X+Y$ 的概率密度函数是多少。如果这是我们所知道的全部信息,那么很遗憾,我们的运气很不好!和之前一样,当 $X$ 和 $Y$ 不相互独立时,问题就出现了。 不妨设 $$ f_X(x)= \begin{cases}1 & \text { 若 }-1 / 2 \leqslant x \leqslant 1 / 2 \\ 0 & \text { 其他 }\end{cases} $$ 以及 $$ f_Y(y)= \begin{cases}1 & \text { 若 }-1 / 2 \leqslant y \leqslant 1 / 2 \\ 0 & \text { 其他. }\end{cases} $$ 注意,$X$ 和 $Y$ 的概率密度函数是一样的,而 $X$ 和 $-X$ 也是如此!如果令 $Y=-X$ ,那么 $Z=X+Y$ 就始终为 0 ;但如果令 $Y=X$ ,那么 $Z=X+Y$ 就是 $2 X$ ,并且 $$ f_{2 X}(z)= \begin{cases}1 / 2 & \text { 若 }-1 \leqslant z \leqslant 1 \\ 0 & \text { 其他. }\end{cases} $$ 这里有个重要启示:只知道 $f_X$ 和 $f_Y$ 并不足以确定 $f_{X+Y}$ .幸运的是,如果我们还知道 $X$ 和 $Y$ 是相互独立的,那么情况就完全不同了。在这种情况下,世界将再次变得美好, 可以得到一个计算 $f_Z$ 的具体公式. ## 卷积定义 **定理1:** 设 $X$ 和 $Y$ 是定义在 $R$ 上的两个相互独立的连续型随机变量,它们的概率密度函数分别是 $f_X$ 和 $f_Y . X$ 和 $Y$ 的卷积记作 $f_X * f_Y$ ,其表达式为 $$ \left(f_X * f_Y\right)(z)=\int_{-\infty}^{\infty} f_X(t) f_Y(z-t) d t $$ 如果 $X$ 和 $Y$ 都是离散型随机变量,那么 $$ \left(f_X * f_Y\right)(z)=\sum_n f_X\left(x_n\right) f_Y\left(z-x_n\right) $$ 当然,要注意,除非 $z-x_n$ 等于 $Y$ 有正概率时的取值(即 $z-x_n$ 取某个具体的 $\left.y_m\right)$ ,否则 $f_Y\left(z-x_n\right)=0$ . 两个随机变量的卷积有很多奇妙的性质,其中就包括下面的定理. **定理2:** 设 $X$ 和 $Y$ 是定义在 $R$ 上的两个相互独立的连续型或离散型随机变量,它们的概率密度函数分别是 $f_X$ 和 $f_Y$ .如果 $Z=X+Y$ ,那么 $$ f_Z(z)=\left(f_X * f_Y\right)(z) $$ 另外,卷积是可交换的:$f_X * f_Y=f_Y * f_X$ . ### 证明定理1的卷积公式 证明:我们会给出关于连续型随机变量的证明,离散的情况与之相似. 先来证明与 $Z$ 的概率密度函数有关的论述.让 $f_Z$ 表示 $Z$ 的概率密度函数,并让 $F_Z$ 表示 $Z$ 的累积分布函数。我们总是可以通过微分累积分布函数来求出概率密度函数。于是 $$ F_Z(z)=\operatorname{P}(Z \leqslant z) $$ 这个概率该如何计算呢?不妨设 $X$ 的值是 $t$ .由于要求 $Z=X+Y$ 的值不超过 $z$ ,因此 $Y$ 的取值至多为 $z-t$ .从定义来看,这个概率就是 $F_Y(z-t)=\operatorname{P}(Y \leqslant z-t)$ .让 $t$ 取遍 $X$ 所有可能的取值,于是有 $$ F_Z(z)=\int_{t=-\infty}^{\infty} f_X(t) F_Y(z-t) d t $$ 现在在积分号下求微分.在数学课上,这一点的合理性必须要得到证明, 可以利用交换积分次序进行证明 我们有 $$ f_Z(z)=\frac{d}{d z} \int_{t=-\infty}^{\infty} f_X(t) F_Y(z-t) d t $$ $$ \begin{aligned} & =\int_{t=-\infty}^{\infty} \frac{d}{d z}\left[f_X(t) F_Y(z-t)\right] d t \\ & =\int_{t=-\infty}^{\infty} f_X(t) \frac{d}{d z} F_Y(z-t) d t \\ & =\int_{t=-\infty}^{\infty} f_X(t) f_Y(z-t) d t \\ & =\left(f_X * f_Y\right)(z) . \end{aligned} $$ 对于第二个结论,如果 $f_X$ 和 $f_Y$ 都是概率密度函数,那么证明会非常简单.我们刚刚证明了,当 $Z$ 是两个相互独立的随机变量 $X$ 与 $Y$ 的和时,$Z$ 的概率密度函数就是 $f_X * f_Y$ .因为加法是可交换的,所以 $Y+X$ 也等于 $Z$ ,进而有 $f_{X+Y}=f_{Y+X}$ 上面第二个定理说明了正确看待问题的重要性。我们可以通过写出每个式子分别等于多少来证明 $f_X * f_Y=f_Y * f_X$ ,然后通过变量替换来证明它们是等价的,但是,注意到加法是可交换的会更好.这是个典型的问题——你可以采用多种代数方法解决问题,但通常会有更好的方法. 在陈述了这样一个具有技巧性的结果并给出相关证明后,我们来看看它在实践中是如何发挥作用的.假设 $X$ 和 $Y$ 是相互独立的随机变量,它们具有相同的概率密度函数 $$ f(t)= \begin{cases}1 & \text { 若 }-1 / 2 \leqslant t \leqslant 1 / 2 \\ 0 & \text { 其他. }\end{cases} $$ 通过计算 $$ \int_{-\infty}^{\infty} f(t) f(z-t) d t $$ 可以求出 $Z=X+Y$ 的概率密度函数.然而,我们必须非常小心.学生们最容易犯的错误之一就是用 1 来替换 $f(t)$ 和 $f(z-t)$ ,并让 $t$ 在 $-1 / 2$ 和 $1 / 2$ 之间取值,而这种做法是错误的!这里的替换出了什么问题?问题在于,只有当 $-1 / 2 \leqslant u \leqslant 1 / 2$时,函数 $f(u)$ 才会等于 1 .如果 $f(t)=1$ .那么就意味着 $-1 / 2 \leqslant t \leqslant 1 / 2$ .如果 $f(z-t)=1$ ,那就表明了 $-1 / 2 \leqslant z-t \leqslant 1 / 2$ ,也就是说,$z-1 / 2 \leqslant t \leqslant z+1 / 2$ .因此,这个积分必须分情况讨论。 好吧,上面的内容让人觉得有点沮丧.有一点还不错,那就是只需要计算一个积分值,而不是分段定义的积分。但问题在于,最初的函数可能是个分段函数.如果该函数对所有的输入都有相同的定义,那么情况又是什么样的?虽然这确实有点帮助, 但存在一个根本的困难:积分很难计算 ## 卷积例题:掷骰子 下面考察一些卷积的例子.第一个例子是抛掷两颗均匀的骰子.假设两颗骰子掷出的结果是相互独立的。让 $X$ 表示第一颗骰子掷出的数字,$Y$ 表示第二颗骰子掷出的数字.于是,我们有 $$ f_X(k)=f_Y(k)= \begin{cases}1 / 6 & \text { 若 } k \in\{1,2,3,4,5,6\} \\ 0 & \text { 其他. }\end{cases} $$ 我们可以把 36 对可能的结果以及每 1 对所对应的 $X+Y$ 的取值全都列举了出来,并由此求出 $X+Y$ 的概率密度函数(如下表). ![图片](/uploads/2025-01/20eb37.jpg) 当抛掷两颗骰子时可以这样做,但随着骰子数量的增加,这种做法就变得不切实际了.幸运的是,卷积可以指导我们进行代数运算. 根据卷积的定义可知,如果 $Z=X+Y$ ,那么 $$ f_Z(z)=\left(f_X * f_Y\right)(z)=\sum_{k=-\infty}^{\infty} f_X(k) f_Y(z-k) $$ 由于当参数不属于 $\{1, \cdots, 6\}$ 时 $f_X$ 和 $f_Y$ 都等于 0 ,因此这里必须同时满足 $$ k \in\{1, \cdots, 6\} \quad \text { 且 } \quad z-k \in\{1, \cdots, 6\} \text {. } $$ 好的,这意味着什么呢?首先,由 $1 \leqslant k \leqslant 6$ 以及 $k$ 是个整数可知,我们可以限制和的大小.其次,$z$ 必须是整数.最后,不管选择哪个 $k$ ,总能找到某个合理的 $z$ .当然,我们不应该这么考虑.最好把 $z$ 看作是已知的,然后求出 $k$ 的可能取值.这两个条件意味着 $$ \{z-6, z-5, z-4, z-3, z-2, z-1\} \cap\{1,2,3,4,5,6\} $$ 例如,当 $z=2$ 时,$k$ 只能取 1 ,但如果 $z=8$ ,那么 $k$ 的可能取值有 $2, ~ 3, ~ 4, ~ 5$ 和 6 . 因此,现在只需要算出 $z$ 取 11 个整数值的概率密度,它们是介于 2 和 12 之间的整数.例如, $$ f_Z(8)=\sum_{k=2}^6 f_X(k) f_Y(8-k)=\sum_{k=2}^6 \frac{1}{6} \cdot \frac{1}{6}=\frac{5}{36} . $$ 这样继续进行下去,我们会看到 $$ f_Z(k)= \begin{cases}\sum_{k=1}^{z-1} \frac{1}{36}=\frac{z-1}{36} & \text { 若 } z \in\{2, \cdots, 7\} \\ \sum_{k=z-6}^6 \frac{1}{36}=\frac{13-z}{36} & \text { 若 } z \in\{7, \cdots, 12\} \\ 0 & \text { 其他. }\end{cases} $$ 下面讨论几个具体的随机变量函数的分布. ## 和的分布 设 $X$ 和 $Y$ 的联合密度为 $f(x, y)$ ,求 $Z=X+Y$ 的密度。 由定义可得 $Z=X+Y$ 的分布函数为 $$ F_Z(z)=P(Z \leqslant z)=\iint_{x+y \leqslant z} f(x, y) d x d y, $$ 其中积分区域 $G_z=\{(x, y) \mid x+y \leqslant z\}$ 是直线 $x+y=z$ 左下方的半平面,化成累次积分得 $$ F_Z(z)=\int_{-\infty}^{+\infty}\left[\int_{-\infty}^{z-y} f(x, y) d x\right] d y . $$ 固定 $z$ 和 $y$ ,对积分 $\int_{-\infty}^{z-y} f(x, y) d x$ 做变量变换,令 $x=u-y$ ,得 $$ \int_{-\infty}^{z-y} f(x, y) d x=\int_{-\infty}^z f(u-y, y) d u . $$ 于是 $$ F_Z(z)=\int_{-\infty}^{+\infty}\left[\int_{-\infty}^z f(u-y, y) d u\right] d y=\int_{-\infty}^z\left[\int_{-\infty}^{+\infty} f(u-y, y) d y\right] d u . $$ 由概率密度的定义, 即得 $Z$ 的概率密度为 $$ f_Z(z)=\int_{-\infty}^{+\infty} f(z-y, y) d y $$ 由 $X$ 和 $Y$ 的对称性, $f_Z(z)$ 又可写成 $$ f_Z(z)=\int_{-\infty}^{+\infty} f(x, z-x) d x . $$ 由此得到了两个随机变量的和的概率密度的一般公式。 特别地, 当 $X$ 和 $Y$ 相互独立时, 设 $(X, Y)$ 关于 $X 、 Y$ 的边缘概率密度分别为 $f_X(x)$ 、 $f_Y(y)$, 则有 $$ \begin{aligned} f_Z(z) & =\int_{-\infty}^{+\infty} f_X(z-y) f_Y(y) d y ; \\ f_Z(z) & =\int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) d x . \end{aligned} $$ 这两个公式称为**卷积(Convolution)公式**,记为 $f_X * f_Y(y)$ ,即 $$ \left.f_X * f_Y=\int_{-\infty}^{+\infty} f_X(z-y) f_Y(y) d y=\int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) d x . \quad \text { (连续卷积公式 }\right) $$ 同理, 若 $X$ 和 $Y$ 是两个相互独立的随机变量, 它们都取非负整数值, 其概率分布分别为 $\left\{a_r\right\} 、\left\{b_r\right\}$, 下面计算 $Z=X+Y$ 的概率分布。因为 $$ P(Z=k)=P(X=0, Y=k)+P(X=1, Y=k-1)+\cdots+P(X=k-1, Y=1)+P(X=k, Y=0) $$ 利用独立性的性质可得 $$ c_k=a_0 b_k+a_1 b_{k-1}+a_2 b_{k-2}+\cdots+a_k b_0 \text {, 其中 } c_k=P(Z=k), \quad k=0,1,2, \cdots \text {. (离散卷积公式) } $$ `例` 设 $X$ 和 $Y$ 是两个相互独立的随机变量. 它们都服从 $N(0,1)$ 分布, 其概率密度为 $$ \begin{aligned} & f_X(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}}, \quad-\infty<x<+\infty \\ & f_Y(y)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{y^2}{2}}, \quad-\infty<y<+\infty \end{aligned} $$ 求 $Z=X+Y$ 的概率密度. 解 由卷积公式得 $$ \begin{aligned} f_Z(z) & =\int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) d x=\frac{1}{2 \pi} \int_{-\infty}^{+\infty} e^{-\frac{x^2}{2}} \cdot e^{-\frac{(z-x)^2}{2}} d x \\ & =\frac{1}{2 \pi} e^{-\frac{z^2}{4}} \int_{-\infty}^{+\infty} e^{-\left(x-\frac{z}{2}\right)^2} d x \xlongequal{t=x-\frac{z}{2}} \frac{1}{2 \pi} e^{-\frac{z^2}{4}} \int_{-\infty}^{+\infty} e^{-t^2} d t \\ & =\frac{1}{2 \pi} e^{-\frac{z^2}{4}} \sqrt{\pi}=\frac{1}{2 \sqrt{\pi}} e^{-\frac{z^2}{4}}, \quad \text { 即 } Z \sim N(0,2) . \end{aligned} $$ ## 定理 设 $X 、 Y$ 相互独立,且 $X \sim N\left(\mu_1, \sigma_1^2\right), Y \sim N\left(\mu_2, \sigma_2^2\right)$ 则 $Z=X+Y$ 仍然服从正态分布,且 $Z \sim N\left(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2\right)$. `例`设 $X$ 和 $Y$ 是两个相互独立的随机变量, 其概率密度分别为 $$ f_X(x)=\left\{\begin{array}{ll} 1, & 0 \leqslant x \leqslant 1 \\ 0, & \text { 其他 } \end{array}, \quad f_Y(y)= \begin{cases}e^{-y}, & y>0 \\ 0, & \text { 其他 }\end{cases}\right. $$ 求随机变量 $Z=X+Y$ 的概率密度。 解 因为 $X 、 Y$ 相互独立,所以由卷积公式知 $$ f_Z(z)=\int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) d x . $$ 由题设可知 $f_X(x) f_Y(y)$ 只有当 $0 \leqslant x \leqslant 1$ 且 $y>0$, 即当 $0 \leqslant x \leqslant 1$ 且 $z-x>0$ 时才不等于零.现在所求的积分变量为 $x, z$ 是参数, 当积分变量满足 $x$ 的不等式组 $0 \leqslant x \leqslant 1, z>x$ 时, 被积函数 $f_X(x) f_Y(z-x) \neq 0$. 下面针对参数 $z$ 的不同取值范围来计算积分. 当 $z<0$ 时, 上述不等式组无解, 故 $f_X(x) f_Y(z-x)=0$; 当 $0 \leqslant z \leqslant 1$ 时, 不等式组的解为 $0 \leqslant x \leqslant z$; 当 $z>1$ 时, 不等式组的解为 $0 \leqslant x \leqslant 1$. 所以 $$ f_Z(z)=\left\{\begin{array}{ll} \int_0^z e^{-(z-x)} d x=1-e^{-z}, & 0 \leqslant z \leqslant 1 \\ \int_0^1 e^{-(z-x)} d x=e^{-z}(e-1), & z>1 \\ 0, & \text { 其他 } \end{array} .\right. $$
上一篇:
二维连续型随机变量函数的分布
下一篇:
多变量的卷积
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习导航:
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数论
群论
搜索
纠错
题库
高考
考研
关于本站
广告赞助
App下载
科数网是专业专业的数学网站。