【超几何分布的期望推导】在概率论与数理统计中,超几何分布是一种离散型概率分布,常用于描述在不放回抽样情况下,成功事件出现次数的概率分布。其应用场景包括从有限总体中抽取样本、质量检测、抽奖等。本文将对超几何分布的期望进行详细推导,并通过表格形式总结关键内容。
一、超几何分布的基本概念
超几何分布适用于以下场景:
- 从一个包含 $ N $ 个元素的总体中,其中有 $ K $ 个“成功”元素;
- 从中随机抽取 $ n $ 个样本(不放回);
- 设随机变量 $ X $ 表示这 $ n $ 个样本中“成功”元素的数量;
- 则 $ X $ 的分布称为超几何分布,记为 $ X \sim H(N, K, n) $。
二、超几何分布的期望推导
1. 公式定义
超几何分布的概率质量函数(PMF)为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}, \quad \text{其中 } k = 0, 1, 2, ..., \min(n, K)
$$
2. 期望公式
超几何分布的期望值为:
$$
E(X) = n \cdot \frac{K}{N}
$$
3. 推导过程(简要)
设总体有 $ N $ 个元素,其中 $ K $ 个是“成功”元素,其余为“失败”元素。我们从总体中不放回地抽取 $ n $ 个样本,定义每个样本是否为“成功”为一个指示变量 $ X_i $,其中:
$$
X_i =
\begin{cases}
1 & \text{若第 } i \text{ 个样本为成功} \\
0 & \text{否则}
\end{cases}
$$
则总的成功数为 $ X = X_1 + X_2 + \cdots + X_n $
由于每次抽样不放回,各 $ X_i $ 不独立,但它们的期望值相同。因此:
$$
E(X) = E(X_1) + E(X_2) + \cdots + E(X_n) = n \cdot E(X_1)
$$
对于任意一个样本,其为成功的概率为:
$$
P(X_1 = 1) = \frac{K}{N}
$$
所以:
$$
E(X) = n \cdot \frac{K}{N}
$$
三、关键信息总结表
| 项目 | 内容 |
| 分布名称 | 超几何分布 |
| 记号 | $ X \sim H(N, K, n) $ |
| 定义 | 从 $ N $ 个元素中不放回抽取 $ n $ 个,其中 $ K $ 个为成功 |
| 概率质量函数 | $ P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} $ |
| 期望 | $ E(X) = n \cdot \frac{K}{N} $ |
| 说明 | 期望值类似于二项分布的期望,但考虑了不放回抽样的影响 |
| 应用场景 | 抽样检查、抽奖、有限总体中的成功次数统计 |
四、结论
超几何分布的期望公式 $ E(X) = n \cdot \frac{K}{N} $ 与二项分布的期望相似,但反映了不放回抽样带来的影响。该公式在实际应用中非常有用,尤其是在处理有限总体问题时,能更准确地预测成功事件的平均数量。理解这一公式的推导过程有助于加深对概率分布本质的认识。


