二項分布とは
二項分布は、複数回のベルヌーイ試行に基づく確率分布です。成功確率 $p$ のベルヌーイ試行を $n$ 回行ったときの成功回数が従う分布を、成功確率 $p$ の二項分布といい、$Bin(n, p)$ と表します。$Bin(1, p)$ とすれば、ベルヌーイ分布を表します。
二項分布の例
- コイン投げ
コインを10回投げて、表が出る回数を考えるとしましょう。表が出る確率 $p$ は 0.5 で、裏が出る確率も 0.5 です。このとき、例えば5回表が出る確率は二項分布を使って計算できます。 - 製品の品質チェック
ある工場で製品が製造され、そのうちの10個をランダムに選んで検査します。各製品が合格する確率が 0.9 だとすると、8個以上が合格する確率を二項分布で計算できます。
確率関数
二項分布の確率関数は、以下のように表されます:
$\begin{align*} P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}, \quad x = 0, 1, … , n \end{align*}$
ここで、
- $P(X=x)$は確率変数 $X$ が特定の値 $x$ をとる確率を表します。
- $\begin{align*} \binom{n}{x}\end{align*}$ は $n$ 回の試行のうち $x$ 回成功する場合の組み合わせの数を表す二項係数であり、
$\begin{align*} \binom{n}{x} = {}_{n}C_{x} = \frac{n!}{x!(n-x)!} \end{align*}$ です。
期待値とその導出
二項分布の期待値は、以下のように表されます:
$E[X] = np$
実際に導出してみましょう。
$\begin{align*}
E[X] &= \sum_{x=0}^{n} xP(X=x) \\
&= \sum_{x=0}^{n} x\binom{n}{x} p^x (1-p)^{n-x} \\
&= \sum_{x=0}^{n} x\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}\\
&= \sum_{x=0}^{n} \frac{n(n-1)!}{(x-1)!(n-x)!} pp^{x-1} (1-p)^{n-x} \\
&= np \sum_{x=0}^{n} \frac{(n-1)!}{((n-1)-(x-1))!(x-1)!}p^{x-1} (1-p)^{n-x} \\
&= np
\end{align*}$
ここで、
$\begin{align*} \frac{(n-1)!}{((n-1)-(x-1))!(x-1)!}p^{x-1} (1-p)^{n-x} \end{align*}$
は二項分布の確率関数であり、$\sum$ が付くことによって確率の第二の公理より、
$\begin{align*} \sum_{x=0}^{n} \frac{(n-1)!}{((n-1)-(x-1))!(x-1)!}p^{x-1} (1-p)^{n-x} = 1\end{align*}$
となります。
上記の導出方法は少し手間ですが、以下の方法で簡単に期待値を求めることもできます。
$Bin(n, p)$ に従う確率変数 $X$ は、$Bin(1, p)$ に独立に従う $Y_1, … ,Y_n$ を用いて、$X = Y_1 + … + Y_n$ と考えられます。よって期待値の線形性から、
$E[X] = E[Y_1 + … + Y_n] = E[Y_1] + … + E[Y_n] = nE[Y_1] = np$
分散とその導出
二項分布の分散は、以下のように表されます:
$V[X] = np(1-p)$
実際に導出してみましょう。
まずは、$E[X^2]$ を求めます。
$\begin{align*}
E[X^2] &= \sum_{x=0}^{n} x^2P(X=x) \\
&= \sum_{x=0}^{n} x^2\binom{n}{x} p^x (1-p)^{n-x} \\
&= \sum_{x=0}^{n} x^2\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}\\
&= \sum_{x=0}^{n} (x(x-1) + x)\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}\\
&= \sum_{x=0}^{n} x(x-1)\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x} + \sum_{x=0}^{n} x\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}
\end{align*}$
ここで、右辺第二項は期待値なので $np$ になります。
$\begin{align*}
&= \sum_{x=0}^{n} x(x-1)\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x} + np \\
&= \sum_{x=0}^{n} \frac{n!}{(x-2)!(n-x)!}p^x (1-p)^{n-x} + np \\
&= n(n-1)p^2\sum_{x=0}^{n} \frac{(n-2)!}{((n-2)-(x-2))!(x-2)!}p^{x-2} (1-p)^{n-x} + np \\
&= n(n-1)p^2 + np
\end{align*}$
最後は、期待値導出の際と同じく確率の第二の公理を利用しています。
以上より分散は、
$\begin{align*}
V[X] &= E[X^2]-E[X]^2 \\
&= n(n-1)p^2 + np-(np)^2 \\
&= np(1-p)
\end{align*}$
確率母関数とその導出
二項分布の確率母関数は、以下のように表されます:
$G(s) = E[s^X] = (ps + (1-p))^n$
実際に導出してみましょう。
$\begin{align*}
G(s) &= \sum_{x=0}^{n}s^x \binom{n}{x} p^x (1-p)^{n-x} \\
&= \sum_{x=0}^{n} \binom{n}{x} (sp)^x (1-p)^{n-x}
\end{align*}$
ここで、二項定理を適用します。
$\begin{align*}
&= (ps + (1-p))^n
\end{align*}$
二項分布の再生性
二項分布には再生性という性質があります。
再生性とは、ある確率分布に独立に従う複数の確率変数の和もまた元の確率分布に従うという性質です。つまり二項分布の再生性とは、二項分布に独立に従う複数の確率変数の和も、二項分布に従うということを指します。
二項分布の再生性を示してみましょう。
$X_1 \sim Bin(n_1, p)$、$X_2 \sim Bin(n_2, p)$ の2つの確率変数を考えます。ここで「$\sim$」というチルダ記号は、「分布に従う」という意味を持ちます。
この2つの確率変数の和 $X_1 + X_2$ の母関数は、$E[s^{X_1 + X_2}]$ と表せます。こちらを変形していきます。
$\begin{align*}
E[s^{X_1 + X_2}] &= E[s^{X_1} s^{X_2}]\\
&= E[s^{X_1}]E[s^{X_2}]\\
&= (ps + (1-p))^{n_1} (ps + (1-p))^{n_2}\\
&= (ps + (1-p))^{n_1 + n_2}
\end{align*}$
となり、これは $Bin(n_1 + n_2, p)$ の確率母関数に一致します。
再生性については確率分布の再生性でも解説しているので、併せてご覧ください。
まとめ
二項分布は、二つの結果が得られるベルヌーイ試行を繰り返した場合に、成功や表の回数がどのように分布するかを示す確率分布です。コイン投げや品質管理など、さまざまな現実の問題に応用されており、確率論や統計学の基本的な概念の一つです。