在概率论与数理统计中,超几何分布是一种重要的离散型概率分布。它通常用于描述从有限总体中不放回抽样时,某种特定事件发生的次数的概率分布。例如,在一个装有红球和白球的袋子中随机抽取若干个球,且每次抽取后不再放回的情况下,红球出现的次数就服从超几何分布。
超几何分布的基本概念
假设我们有一个总共有N个元素的集合,其中M个元素属于某一类(比如红色),剩下的N-M个元素不属于该类。现在从这个集合中无放回地抽取n个元素,定义随机变量X表示抽到的属于该类的元素数量,则X服从超几何分布。
其概率质量函数为:
\[ P(X=k) = \frac{\binom{M}{k} \cdot \binom{N-M}{n-k}}{\binom{N}{n}}, \quad k=0,1,\ldots,\min(n,M) \]
期望值的推导
对于超几何分布,其期望值可以通过以下公式计算得出:
\[ E(X) = n \cdot \frac{M}{N} \]
这一结果可以直观理解为:每次抽样的成功概率为\( \frac{M}{N} \),因此经过n次抽样后预期的成功次数就是上述表达式。
方差的推导
超几何分布的方差公式为:
\[ Var(X) = n \cdot \frac{M}{N} \cdot \left(1 - \frac{M}{N}\right) \cdot \frac{N-n}{N-1} \]
这里的额外因子\( \frac{N-n}{N-1} \)反映了由于不放回抽样导致的样本间相关性的影响。
实际应用示例
假设一家公司有100名员工,其中有30人是技术人员。如果随机挑选5名员工参加培训会议,那么选出的技术人员人数X服从超几何分布。根据上面给出的公式,我们可以计算出X的期望值和方差分别为6和4.29(四舍五入到两位小数)。
通过以上分析可以看出,尽管超几何分布在实际问题中有广泛的应用场景,但其数学性质相对复杂,尤其是方差部分包含了多个参数相互作用的因素。因此,在处理具体问题时需要仔细考虑所有相关条件,并正确应用相应的公式进行计算。