確率論や統計学では、確率変数の分布が完全には分からない場合でも、特定の事象の発生確率について上限を求めることができる不等式がいくつか存在します。その中でも基本的なものの一つがマルコフの不等式であり、これを発展させたものがチェビシェフの不等式です。本記事では、それぞれの不等式の意味や関係について解説します。
マルコフの不等式
マルコフの不等式は、非負の確率変数に対して適用され、大きな値を取る確率の上限を与える不等式です。
定理:
確率変数 $X$ が非負でその期待値 $E[X]$ が有限であるとき、任意の $a > 0$ に対して
$\begin{align*}
P(X \ge a) \le \frac{E[X]}{a}
\end{align*}$
が成り立ちます。
直感的な理解:
この不等式は、「$X$ の平均値 $E[X]$ が小さければ、大きな値 $a$ を取る確率も小さい」ことを示しています。たとえば $X$ が収入を表すとすれば、平均収入が低いならば特定の高収入以上の確率は小さくなるという直感と一致します。
証明:
指示関数 $I_{X \ge a}$ を考えます。この関数は $X \ge a$ のとき1、そうでないとき0の値をとります。
$X$ は非負の確率変数なので、次の不等式が成り立ちます:
$\begin{align*}
X \ge a I_{X \ge a}
\end{align*}$
両辺の期待値を取ると、
$\begin{align*}
E[X] \ge E[a I_{X \ge a}] = aE[I_{X \ge a}]
\end{align*}$
ここで、指示関数の期待値は以下のようにその事象の確率に等しくなります。
$\begin{align*}
E[I_{X \ge a}] &= 1\times P(X \ge a) + 0\times P(X < a) \\ &= P(X \ge a)
\end{align*}$
したがって、
$\begin{align*}
E[X] \ge aP(X \ge a)
\end{align*}$
これを変形してマルコフの不等式の形を得ます:
$\begin{align*}
P(X \ge a) \le \frac{E[X]}{a}
\end{align*}$
チェビシェフの不等式
マルコフの不等式を発展させることで、確率変数が平均からどの程度離れるかを評価できるのがチェビシェフの不等式です。
定理:
確率変数 $Y$ の期待値を $\mu$、分散を $\sigma^2$ とすると、任意の $k > 0$ に対して
$\begin{align*}
P(|Y-\mu| \ge k) \le \frac{\sigma^2}{k^2}
\end{align*}$
が成立します。
証明:
マルコフの不等式において確率変数 $X$ の平均からの偏差の二乗を考え、$X = (Y-\mu)^2,\ a = k^2$ とすると
$\begin{align*}
P((Y-\mu)^2 \ge k^2) \le \frac{E[(Y-\mu)^2]}{k^2} = \frac{\sigma^2}{k^2}
\end{align*}$
$P((Y-\mu)^2 \ge k^2) = P(|Y-\mu| \ge k)$ であるため、
$\begin{align*}
P(|Y-\mu| \ge k) \le \frac{\sigma^2}{k^2}
\end{align*}$
が得られます。
マルコフの不等式とチェビシェフの不等式の関係
- マルコフの不等式は、非負の確率変数の期待値を使って大きな値を取る確率の上限を求める
- チェビシェフの不等式は、マルコフの不等式を分散を利用する形に拡張して確率変数が平均からどの程度離れるかを評価する
- チェビシェフの不等式は特定の分布を仮定せずに適用できるため、確率変数の分布が不明な場合でも大まかな確率評価ができる
まとめ
マルコフの不等式とチェビシェフの不等式は、確率変数の分布が分からなくてもその確率の上限を求めることができる強力なツールです。これらの不等式を理解しておくことで、確率論や統計学のさまざまな場面で活用することができます。