ガンマ分布とは
ガンマ分布は、待ち時間や寿命のデータを扱う場合に役立つ分布であり、$Ga(\nu, \alpha)$ と表します。$\nu$ は形状母数、$\alpha$ は尺度母数といいます。また、ガンマ分布はベイズ法においてパラメータの事前分布として用いられることもあります。ガンマ分布は指数分布と一般化した形としても知られ、$\nu = 1$ および $\alpha = 1/\lambda$ とすると指数分布になることが確認できます。

ガンマ分布の例
- 生存時間
生存時間解析において使用されます。例えば、患者が特定の治療を受けた後に生存する時間の分布をモデル化する際にガンマ分布が使われます。この分布は、治療効果の評価や患者の予後の予測に役立ちます。 - イベント待ち時間
ポアソン過程のインターイベントタイム(イベント間の時間間隔)をモデル化する際に利用されます。例えば、コールセンターにおける電話がかかってくる時間間隔や、故障が発生するまでの時間間隔をモデル化する際に使用されます。
確率密度関数
ガンマ分布の確率密度関数は、以下のように表されます:
$\begin{align*}
f(x) = \frac {x^{\nu-1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}, \quad x, \nu, \alpha > 0
\end{align*}$
ここで、$\Gamma(\nu)$ はガンマ関数
$\begin{align*}
\Gamma(\nu) := \int_{0}^{\infty}x^{\nu-1}e^{-x}dx
\end{align*}$
を表します。また、ガンマ関数の性質として以下があり、2はガンマ分布の期待値の導出などで利用されます。
- $\Gamma(1) = 1$
- 任意の実数 $x \geq 1$ に対して $\Gamma(x + 1) = x\Gamma(x)$ が成り立ち、特に任意の非負整数 $n$ に対し $\Gamma(n + 1) = n!$
- $\Gamma(1/2) = \sqrt{\pi}$
期待値とその導出
ガンマ分布の期待値は、以下のように表されます:
$E[X] = \nu \alpha$
実際に導出してみましょう。
$\begin{align*}
E[X] &= \int_{0}^{\infty}xf(x)dx\\
&= \int_{0}^{\infty}x\frac {x^{\nu-1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu} e^{-\frac{x}{\alpha}}}{\frac{\Gamma(\nu+1)}{\nu}\frac{\alpha^{\nu+1}}{\alpha}}dx\\
&= \nu\alpha\int_{0}^{\infty}\frac {x^{\nu} e^{-\frac{x}{\alpha}}}{\Gamma(\nu+1)\alpha^{\nu+1}}dx
\end{align*}$
$\begin{align*}\frac {x^{\nu} e^{-\frac{x}{\alpha}}}{\Gamma(\nu+1)\alpha^{\nu+1}}\end{align*}$ は $Ga(\nu+1, \alpha)$ の確率密度関数であるので、確率の第二の公理より、
$\begin{align*}
&= \nu\alpha
\end{align*}$
分散とその導出
ガンマ分布の分散は、以下のように表されます:
$V[X] = \nu \alpha^2$
実際に導出してみましょう。
まずは、$E[X^2]$ を求めます。
$\begin{align*}
E[X^2] &= \int_{0}^{\infty}x^2f(x)dx\\
&= \int_{0}^{\infty}x^2\frac {x^{\nu-1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu+1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu+1} e^{-\frac{x}{\alpha}}}{\frac{\Gamma(\nu+2)}{(\nu+1)\nu}\frac{\alpha^{\nu+2}}{\alpha^2}}dx\\
&= (\nu+1)\nu\alpha^2\int_{0}^{\infty}\frac {x^{\nu+1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu+2)\alpha^{\nu+2}}dx\\
&= (\nu+1)\nu\alpha^2
\end{align*}$
よって、
$\begin{align*}
V[X] &= E[X^2]-E[X]^2\\
&= (\nu+1)\nu\alpha^2-(\nu\alpha)^2\\
&= \nu \alpha^2
\end{align*}$
モーメント母関数とその導出
ガンマ分布のモーメント母関数は、以下のように表されます:
$\begin{align*}
M(t) = E[e^{tX}] = (1-\alpha t)^{-\nu}, \quad t < \frac{1}{\alpha}
\end{align*}$
実際に導出してみましょう。
$\begin{align*}
M(t) &= \int_{0}^{\infty}e^{tx}\frac {x^{\nu-1} e^{-\frac{x}{\alpha}}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu-1} e^{x\left(\frac{t\alpha-1}{\alpha}\right)}}{\Gamma(\nu)\alpha^\nu}dx\\
&= \int_{0}^{\infty}\frac {x^{\nu-1} e^{-\frac{x}{\frac{\alpha}{1-\alpha t}}}}{\Gamma(\nu)\left(\frac{\alpha}{1-\alpha t}\right)^{\nu}(1-\alpha t)^{\nu}}dx\\
&= (1-\alpha t)^{-\nu}\int_{0}^{\infty}\frac {x^{\nu-1} e^{-\frac{x}{\frac{\alpha}{1-\alpha t}}}}{\Gamma(\nu)\left(\frac{\alpha}{1-\alpha t}\right)^{\nu}}dx\\
&= (1-\alpha t)^{-\nu}
\end{align*}$
ガンマ分布の再生性
ガンマ分布は再生性を持ちます。これは、互いに独立な確率変数 $X_1$ ~ $Ga(\nu_1, \alpha)$ と $X_2$ ~ $Ga(\nu_2, \alpha)$ の和 $X_1 + X_2$ のモーメント母関数が、
$\begin{align*}
E[e^{t(X_1+X_2)}] &= E[e^{tX_1}]E[e^{tX_2}]\\
&= (1-\alpha t)^{-\nu_1}(1-\alpha t)^{-\nu_2}\\
&= (1-\alpha t)^{-(\nu_1+\nu_2)}
\end{align*}$
となり、$X_1 + X_2$ ~ $Ga(\nu_1+\nu_2, \alpha)$ となることから分かります。
再生性については確率分布の再生性でも解説しているので、併せてご覧ください。
まとめ
ガンマ分布は、確率論や統計学において非常に柔軟で応用範囲が広い分布です。気象データ、保険、医療、通信、経済学など、さまざまな分野でガンマ分布を用いたモデルが活用されています。