《每天一点统计学——随机变量与概率分布》中已经初步了解了二项式分布的基本概念和性质:
实验中只有两种可能的结果:“成功”和“失败”,它们是随机决定的,相互排斥。
在每个实验中,成功的概率是P,失败的概率是1-P,成功和失败的概率是常数或接近常数。
每个测试都是相互独立的,每个测试的结果不受其他测试结果的影响。
这里以一个高考选择题数学单选题为例,完成二项式分布公式的推导,希望能告诉大家在生活中如何使用二项式分布。
数学几乎被遗忘了,在这里我们不试图得到正确的答案,但我们可以知道几个事实:
每道选择题只有一个正确答案,其他三个都是错误答案,每道题的结果只有正确和错误。
每道题对的概率为0.25,错的概率为0.75,它们的概率之和只有1;
每个问题相互独立,互不影响。
这是一个二项式分布的现实问题。首先,用概率树画出做题结果的分布:
概率树
通过《每天一点统计学——排列与组合》中所学的知识,我们可以很容易地得到以下结果:
其中X代表问题总数,r代表正确问题数,P(X=r)代表在问题总数X中做对r题的概率。
在三道选择题中做对R题,其实是一道组合题。你从P(X=r)中找到什么规律了吗?
3题做对R题的概率计算公式
二项分布公式
假设每道题的正确概率为P,每道题的错误概率为1-p,即q,正确回答n道题中r道题的概率为:
二项式分布公式
查看组合的计算公式:
结合
00-1010顺便提一下下面的二项式分布期望和方差计算公式。方差可以代表数据的可变性,期望值可以指导决策: