ポアソン分布とは
ポアソン分布は、一定期間内や特定の範囲内で、稀に起こる現象の発生何回が従う確率分布です。この分布は、平均発生率が一定であり、独立したイベントが起こる場合に使用されます。ポアソン分布は平均パラメータ $\lambda$ を用いて $Po(\lambda)$ と表します。
ポアソン分布の例
- コールセンターの電話応答
コールセンターにかかってくる電話の回数は、一定の時間内にランダムに発生します。例えば、1時間あたりにかかってくる電話の件数が平均して10件の場合、1時間に実際にかかってくる電話の回数はポアソン分布に従うと考えることができます。 - 交通事故の発生件数
ある都市の特定の交差点で、1年間に発生する交通事故の件数を考える場合、事故の発生は稀で、各事故が他の事故に影響を与えない(独立している)と仮定すると、ポアソン分布でモデル化できます。
確率関数
ポアソン分布の確率関数は、以下のように表されます:
$\begin{align*}P(X=x) = \frac {\lambda ^x}{x!}e^{-\lambda}, \quad x = 0, 1, 2… \end{align*}$
ここで、
- $P(X=x)$ は、確率変数 $X$ が特定の値 $x$ をとる確率を表します。
- $\lambda$ は0より大きい平均パラメータです。
期待値とその導出
ポアソン分布の期待値は、以下のように表されます:
$E[X] = \lambda$
実際に導出してみましょう。
$\begin{align*}
E[X] &= \sum_{x=0}^{\infty} xP(X=x) \\
&= \sum_{x=0}^{\infty} x \frac {\lambda ^x}{x!}e^{-\lambda}\\
&= \lambda \sum_{x=0}^{\infty} \frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda}
\end{align*}$
$\begin{align*}\frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda} \end{align*}$ はポアソン分布の確率関数です。
よって確率の第二の公理を利用して、
$\begin{align*}
&= \lambda
\end{align*}$
分散とその導出
ポアソン分布の分散は、以下のように表されます:
$V[X] = \lambda$
実際に導出してみましょう。
まずは、$E[X^2]$を求めます。
$\begin{align*}
E[X^2] &= \sum_{x=0}^{\infty} x^2P(X=x) \\
&= \sum_{x=0}^{\infty} x^2 \frac {\lambda ^x}{x!}e^{-\lambda}\\
&= \lambda \sum_{x=0}^{\infty} x \frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda}\\
&= \lambda \sum_{x=0}^{\infty} ((x-1) + 1) \frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda}\\
&= \lambda \left(\sum_{x=0}^{\infty} (x-1) \frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda} + \sum_{x=0}^{\infty} \frac {\lambda ^{x-1}}{(x-1)!}e^{-\lambda} \right)\\
&= \lambda(\lambda + 1)\\
&= \lambda^2 + \lambda
\end{align*}$
よって、
$\begin{align*}
V[X] &= E[X^2]-E[X]^2 \\
&= \lambda^2 + \lambda-(\lambda)^2\\
&= \lambda
\end{align*}$
確率母関数とその導出
ポアソン分布の確率母関数は、以下のように表されます:
$G(s) = E[s^X] = e^{\lambda(s-1)}$
実際に導出してみましょう。
$\begin{align*}
G(s) &= \sum_{x=0}^{\infty} s^x \frac {\lambda ^x}{x!}e^{-\lambda}\\
&= e^{-\lambda}\sum_{x=0}^{\infty} \frac{(s\lambda)^x}{x!}
\end{align*}$
ここで指数関数のマクローリン展開を用いて、
$\begin{align*}
&= e^{-\lambda} e^{s\lambda}\\
&= e^{\lambda(s-1)}
\end{align*}$
この確率母関数から、ポアソン分布は再生性を持つことが分かります。つまり $X_1 \sim Po(\lambda_1)$、$X_2 \sim Po(\lambda_2)$ に関して、$X_1 + X_2 \sim Po(\lambda_1 + \lambda_2)$ となります。
再生性については確率分布の再生性でも解説しているので、併せてご覧ください。
二項分布のポアソン近似
二項分布を特定の条件下でポアソン分布で近似することができます。この近似が有効なのは、二項分布の試行回数 $n$ が大きく、成功確率 $p$ が非常に小さい場合です。このとき、二項分布はポアソン分布に近づきます。
実際に証明してみましょう。
$X \sim Bin(n, p)$として、$\lambda = np$ を固定したまま $n→\infty$ のときの極限を求めます。
$\begin{align*}
P(X=x) &= \binom{n}{x}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}\\
&= \frac{n(n-1)…(n-x+1)}{x!} \left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n}\left(1-\frac{\lambda}{n}\right)^{-x}\\
&= \frac{\lambda^x}{x!} \left(1-\frac{1}{n}\right) \left(1-\frac{2}{n}\right) … \left(1-\frac{x}{n} + \frac{1}{n}\right) \left(1-\frac{\lambda}{n}\right)^{n}\left(1-\frac{\lambda}{n}\right)^{-x}\\
&→\frac{\lambda^x}{x!}e^{-\lambda}
\end{align*}$
ここで、$\begin{align*}\left( 1 + \frac{x}{n}\right)^n→e^x \end{align*}$ となることを用いています。
このように、ポアソン分布に収束することをポアソンの少数法則といいます。
まとめ
ポアソン分布は、一定の時間や空間内で稀に発生する事象の回数を記述するための便利な確率分布です。電話の着信回数や交通事故の発生、システムアクセスの頻度といった様々な現象に対して応用され、特に独立して発生する稀な事象をモデル化する際に強力なツールとなります。二項分布との関連性を理解し、適切な場面で使用することが統計分析において重要です。