対数正規分布とは
対数正規分布は正の範囲をとる分布で、右裾が長い点が特徴的な分布です。名前の通り、対数正規分布に従う確率変数の対数値は正規分布に従います。対数正規分布に従う確率変数の対数値の平均を $\mu$ および分散を $\sigma^2$ として $\Lambda(\mu, \sigma^2)$ と表します。多くの実世界のデータに適合するため、様々な分野で使われています。

対数正規分布の例
- 収入
収入データは一般的に対数正規分布に従います。多くの人が平均的な収入を持つ一方で、非常に高い収入を得ている少数の人が存在するためです。 - 株価変動
株式市場のデータは、短期間での価格変動が対数正規分布に従うことが多いです。株価は時間とともに乗法的に変動することが多いためです。
確率密度関数
対数正規分布の確率密度関数は、以下のように表されます:
$\begin{align*}
f(x) = \frac{1}{\sqrt{2\pi\sigma^2} x}\exp\left(-\frac{(\log{x}-\mu)^2}{2\sigma^2}\right), \quad x > 0
\end{align*}$
期待値とその導出
対数正規分布の期待値は、以下のように表されます:
$\begin{align*}
E[X] = \exp\left(\mu + \frac{\sigma^2}{2}\right)
\end{align*}$
実際に導出してみましょう。
$\begin{align*}
E[X] &= \int_{0}^{\infty}xf(x)dx\\
&= \int_{0}^{\infty}x\frac{1}{\sqrt{2\pi\sigma^2} x}\exp\left(-\frac{(\log{x}-\mu)^2}{2\sigma^2}\right)dx\\
&= \int_{0}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(\log{x}-\mu)^2}{2\sigma^2}\right)dx
\end{align*}$
ここで、$\begin{align*}t = \frac{\log{x}-\mu}{\sigma}\end{align*}$ と置換します。$\begin{align*}dx = \sigma x dt\end{align*}$ 、$-\infty < t < \infty$ なので、
$\begin{align*}
&= \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{t^2}{2}\right)\sigma x dt\\
&= \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2}\right)\exp(\mu+\sigma t) dt\\
&= \frac{1}{\sqrt{2\pi}}\exp(\mu)\int_{-\infty}^{\infty}\exp\left(-\frac{t^2}{2} + \sigma t\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\exp(\mu)\int_{-\infty}^{\infty}\exp\left(-\frac{(t-\sigma)^2-\sigma^2}{2}\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\exp(\mu)\exp\left(\frac{\sigma^2}{2}\right)\int_{-\infty}^{\infty}\exp\left(-\frac{(t-\sigma)^2}{2}\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\exp\left(\mu + \frac{\sigma^2}{2}\right)\sqrt{2\pi}\\
&= \exp\left(\mu + \frac{\sigma^2}{2}\right)
\end{align*}$
最後は、ガウス積分を利用しています。
とここまで長々と計算しましたが、こんなことをせずとも簡単に期待値を導けます。
$Y \sim N(\mu, \sigma^2)$ のとき、$X = e^Y$ は対数正規分布に従います。$X$ の原点まわり $t$ 次モーメントは $E[X^t] = E[e^{tY}]$ と書けますが、$E[e^{tY}]$ は正規分布のモーメント母関数を意味しています。つまり、$t = 1$ とすれば正規分布のモーメント母関数から簡単に対数正規分布の期待値を求めることができます。実際、
$\begin{align*}
M_Y(t) = E[e^{tY}] = \exp\left(\mu t + \frac{\sigma^2t^2}{2}\right)
\end{align*}$
において $t = 1$ をすると、
$\begin{align*}
M_Y(1) = E[e^{Y}] = \exp\left(\mu + \frac{\sigma^2}{2}\right) = E[X]
\end{align*}$
となり、先ほど求めた対数正規分布の期待値と一致します。
分散とその導出
対数正規分布の分散は、以下のように表されます:
$V[X] = \exp(2\mu + \sigma^2)(\exp(\sigma^2)-1)$
実際に導出してみましょう。
まずは、$E[X^2]$ を求めます。
$\begin{align*}
E[X^2] &= \int_{0}^{\infty}x^2f(x)dx\\
&= \int_{0}^{\infty}x^2\frac{1}{\sqrt{2\pi\sigma^2} x}\exp\left(-\frac{(\log{x}-\mu)^2}{2\sigma^2}\right)dx\\
&= \frac{1}{\sqrt{2\pi\sigma^2}}\int_{0}^{\infty}x\exp\left(-\frac{(\log{x}-\mu)^2}{2\sigma^2}\right)dx
\end{align*}$
ここで、$\begin{align*}t = \frac{\log{x}-\mu}{\sigma}\end{align*}$ と置換します。$\begin{align*}dx = \sigma x dt\end{align*}$ 、$-\infty < t < \infty$ なので、
$\begin{align*}
&= \frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^{\infty}x\exp\left(-\frac{t^2}{2}\right)\sigma xdt\\
&= \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}\exp(2\mu + 2\sigma t)\exp\left(-\frac{t^2}{2}\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}\exp\left(-\frac{(t-2\sigma)^2-4\mu-4\sigma^2}{2}\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\exp\left(\frac{4\mu + 4\sigma^2}{2}\right)\int_{-\infty}^{\infty}\exp\left(-\frac{(t-2\sigma)^2}{2}\right)dt\\
&= \frac{1}{\sqrt{2\pi}}\exp\left(\frac{4\mu + 4\sigma^2}{2}\right)\sqrt{2\pi}\\
&= \exp(2\mu+2\sigma^2)
\end{align*}$
よって、
$\begin{align*}
V[X] &= E[X^2]-E[X]^2\\
&= \exp(2\mu+2\sigma^2)-\left(\exp\left(\mu + \frac{\sigma^2}{2}\right)\right)^2\\
&= \exp(2\mu+2\sigma^2)-\exp(2\mu + \sigma^2)\\
&= \exp(2\mu + \sigma^2)(\exp(\sigma^2)-1)\\
\end{align*}$
とここまで長々と計算しましたが、やっぱり分散も簡単に求められます。
先ほど正規分布のモーメント母関数から簡単に対数正規分布の原点まわり $t$ 次モーメントを求められることを説明しました。分散も正規分布のモーメント母関数を使って導けます。先ほどと同じように $Y \sim N(\mu, \sigma^2)$ とすると、
$\begin{align*}
V[X] &= E[X^2]-E[X]^2\\
&= E[e^{2Y}]-E[e^{Y}]^2\\
&= \exp\left(2\mu + \frac{4\sigma^2}{2}\right)-\left(\exp\left(\mu + \frac{\sigma^2}{2}\right)\right)^2\\
&= \exp(2\mu + 2\sigma^2)-\exp(2\mu + \sigma^2)\\
&= \exp(2\mu + \sigma^2)(\exp(\sigma^2)-1)
\end{align*}$
となり、対数正規分布の分散と一致しました。
モーメント母関数と特性関数
対数正規分布のモーメント母関数は存在しません。
特性関数に関してもテイラー級数が発散してしまうなどの理由で閉じた表現が難しいですが、ランベルトのW関数で近似式が得られます。詳細は割愛します。
まとめ
対数正規分布は、自然界や金融などさまざまな分野で観察されるデータのモデリングに有用な分布です。データが対数正規分布に従うかどうかだけでなく、その対数が正規分布に従うかどうかも検討することで、より適切な分析が可能になります。