在概率论与数理统计中,超几何分布是一种重要的离散型概率分布,主要用于描述从有限总体中进行不放回抽样时的成功次数的概率分布。超几何分布的应用场景非常广泛,例如在质量控制、生物医学等领域。
一、超几何分布的基本概念
假设有一个总体,其中包含 \( N \) 个元素,其中有 \( K \) 个属于某一特定类别(记为成功)。从中随机抽取 \( n \) 个样本(不放回),设 \( X \) 表示抽到的成功数,则 \( X \) 的概率质量函数为:
\[
P(X = k) = \frac{\binom{K}{k} \cdot \binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0, 1, 2, \dots, \min(n, K)
\]
这里,\( \binom{a}{b} \) 表示组合数,即从 \( a \) 个元素中选取 \( b \) 个元素的方法数。
二、数学期望的推导
对于超几何分布,其数学期望 \( E(X) \) 可以通过以下方法推导:
1. 分解法:将 \( X \) 分解为多个独立的指示变量。设 \( X_i \) 表示第 \( i \) 次抽样是否成功(若成功则取值为 1,否则为 0),则有:
\[
X = X_1 + X_2 + \cdots + X_n
\]
其中,每个 \( X_i \) 的期望为:
\[
E(X_i) = P(\text{第 } i \text{次抽样成功}) = \frac{K}{N}
\]
2. 线性性质:利用期望的线性性质,可得:
\[
E(X) = E(X_1) + E(X_2) + \cdots + E(X_n) = n \cdot \frac{K}{N}
\]
因此,超几何分布的数学期望为:
\[
E(X) = n \cdot \frac{K}{N}
\]
三、方差的推导
接下来我们计算超几何分布的方差 \( D(X) \)。根据方差的定义:
\[
D(X) = E(X^2) - [E(X)]^2
\]
1. 计算 \( E(X^2) \):首先需要求出 \( X^2 \) 的期望。由于 \( X = X_1 + X_2 + \cdots + X_n \),且 \( X_iX_j \) (当 \( i \neq j \))表示同时抽到两个成功的概率,我们有:
\[
E(X^2) = E\left(\sum_{i=1}^n X_i^2 + \sum_{i \neq j} X_iX_j\right)
\]
其中:
- \( E(X_i^2) = E(X_i) = \frac{K}{N} \)
- \( E(X_iX_j) = P(\text{第 } i \text{次和第 } j \text{次都成功}) = \frac{K(K-1)}{N(N-1)} \)
将这些结果代入后,可以得到:
\[
E(X^2) = n \cdot \frac{K}{N} + n(n-1) \cdot \frac{K(K-1)}{N(N-1)}
\]
2. 计算方差:结合 \( E(X^2) \) 和 \( [E(X)]^2 \),最终得到:
\[
D(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N-n}{N-1}
\]
四、总结
综上所述,超几何分布的数学期望和方差分别为:
\[
E(X) = n \cdot \frac{K}{N}, \quad D(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N-n}{N-1}
\]
这两个公式是超几何分布的重要特性,广泛应用于实际问题的分析中。理解和掌握它们有助于更好地解决涉及不放回抽样的概率问题。