科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
科数
题库
在线学习
赞助
你好
游客,
登录
注册
在线学习
概率论与数理统计
第二篇 一维随机变量及其分布
离散型(超几何分布)
最后
更新:
2025-02-24 10:05
查看:
310
次
反馈
刷题
离散型(超几何分布)
> 抽查一个产品,质量可能合格或者不合格,这是[**两点分布**](https://kb.kmath.cn/kbase/detail.aspx?id=959),为了检查一批产品质量是否合格,我们可以抽查$n$个产品(每个产品都有合格或者不合格两种可能),这是[**二项分布**](https://kb.kmath.cn/kbase/detail.aspx?id=526) 。但是实际情况更好复杂。对于一个产品,不仅仅只有合格或者不合格两个结果,有时候可能有更多的结果。比如抽查产品的结果使用“正品,次品,废品”表示这是[**多项分布**](https://kb.kmath.cn/kbase/detail.aspx?id=2549), 在抽查产品里,我们不断的抽取直到首次抽到正品的概率这是[**几何分布**](https://kb.kmath.cn/kbase/detail.aspx?id=529),下面的定义将介绍负二项分布:在抽查的产品里,我们抽取一个是不合格的,抽取一个是不合格的,一共抽取了$r$次,第$r+1$次才出现合格的,这种分布就是[**负二项分布**](https://kb.kmath.cn/kbase/detail.aspx?id=1569)。 在上面的抽查检查里,默认都是**放回检验**,但是有时候抽查完不放回,这种**不放回检验**就是本节介绍的超几何分布。可以证明,当样品量很大时,放回和不放回区别不大,比如从1000个产品里抽取5个检验是否合格,那么每次检验把这5个放回或者不放回对整体影响不大。 下面介绍的是泊松分布。特别的,二项分布的泊松近似,常被应用于研究稀有事件,比如某种疾病的发病率为0.001,现在单位有5000人,问患这种疾病不超过5人的概率?这可以用二项分布计算,但是计算量很大,使用泊松分布就可以近似计算,详见[泊松定理](https://kb.kmath.cn/kbase/detail.aspx?id=1568)。 ## 超几何分布的二项近似 设有 $n$ 件产品, 其中 $M$ 件次品. 现从中不放回任取 $n$ 个产品 $(n \leq N)$. 则这 $n$ 个产品中所含的次品 $X$ 的分布律为 $$ \begin{gathered} P(X=k)=\frac{\left(\begin{array}{c} M \\ k \end{array}\right)\left(\begin{array}{c} N-M \\ n-k \end{array}\right)}{\left(\begin{array}{c} N \\ n \end{array}\right)} \\ k=\max \{0, n+M-N\}, 2, \cdots, \min \{M, n\} . \end{gathered} $$ 我们称 $X$ 服从参数为 $n, N$ 和 $M$ 的**超几何分布**. 记 $p=\frac{M}{N}$ ,可以证明,有 $$ \lim _{N \rightarrow \infty} \frac{\left(\begin{array}{c} M \\ k \end{array}\right)\left(\begin{array}{c} N-M \\ n-k \end{array}\right)}{\left(\begin{array}{c} N \\ n \end{array}\right)}=\left(\begin{array}{l} n \\ k \end{array}\right) p^k(1-p)^{n-k} . $$ ### 超几何分布可用二项分布近似 在实际应用中,当 $n \lt \lt N$ 时,即抽取个数 $n$ 远小于产品总数 $N$ 时,每次抽取后,总体中的不合格 品率 $p=\frac{M}{N}$ 改变很微小,所以不放回抽样可以近似地看出放回抽样,这时超几何分布可用二项分布近似,以减少计算量。 ## 超几何分布的数学期望和方差 若 $X \sim h(n, N, M)$, 则 $X$ 的数学期望为 $$ E(X)=\sum_{k=0}^r k \frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}=n \frac{M}{N} \sum_{k=1}^r \frac{\binom{M-1}{k-1}\binom{N-M}{n-k}}{\binom{N-1}{n-1}}=n \frac{M}{N} $$ 又因为 $$ \begin{aligned} E\left(X^2\right) & =\sum_{k=1}^{\prime} k^2 \frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}=\sum_{k=2}^r k(k-1) \frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}+n \frac{M}{N} \\ & =\frac{M(M-1)}{\binom{N}{n}} \sum_{k=2}^r\binom{M-2}{k-2}\binom{N-M}{n-k}+n \frac{M}{N} \end{aligned} $$ $$ =\frac{M(M-1)}{\binom{N}{n}}\binom{N-2}{n-2}+n \frac{M}{N}=\frac{M(M-1) n(n-1)}{N(N-1)}+n \frac{M}{N} $$ 由此得$X$的方差为 $$ D(X)=E\left(X^2\right)-[E(X)]^2=\frac{n M(N-M)(N-n)}{N^2(N-1)} . $$ 关于更多概率分布表见[附录1:常见概率分布表](https://kb.kmath.cn/kbase/detail.aspx?id=1490)
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
离散型(负二项分布)
下一篇:
离散型(泊松分布)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。