読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

微分方程式によるポアソン分布の導出

前口上

 おそらく, 確率論や数理統計学の(正統的な)入門書ならば, ポアソン分布の確率関数,
 P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}
(k=1,2,... ; λ>0 定数) が二項分布の極限から導かれることがちゃんと書いてあると思う.

ポアソン分布 - Wikipedia

 ここでは, 二項分布からではなく, 以下の三つの仮定から, ポアソン分布の確率関数を導出する.

 なんでそんなことをするのかというと, 確率過程の勉強をしたくて, ポアソン過程が確率過程のいちばん基本的なものの一つだから, なんかポアソン分布とかのことをおさらいしとこうと思ったからだ.

仮定

I. 互いに排反する区間では, 現象が起こる確率は独立である.

 時間間隔 (0, t) 内に起きる事象の数 X(t) と, (t, t+h), h>0 内に起きる事象の数 X(t+h)-X(t) は独立である.

 まず記号 X(t)事象の数を表す確率変数であることを認識する.

f:id:abrahamcow:20140307124635p:plain

 時間の重なりがないところ同士では独立,というシンプルな仮定だ.

f:id:abrahamcow:20140307124217p:plain

II. 非常に小さい区間で現象が起こる確率は, その区間の長さに比例する.

 すなわち,
 P[X(t+h)-X(t)=k] =\lambda h + o(h)

ここで, o(h)

 \lim \frac{o(h)}{h}=0

となる関数. λ>0.

 この式の意味を理解するために, まず h は「小さい数」だというイメージを持ってほしい. どのくらい小さいか, ということはあまり気にしなくていい.
そして o(h)h よりもっと小さい数だ。 h より高位の無限小と呼んだりする.

III. 非常に小さい区間で現象が 2 回以上起こる確率は, その区間で現象が 1 回起こる確率に比べて, 無視できるほど小さい.

 すなわち,

 P[X(t+h)-X(t)=k]=o(h)
 (k>1)

 この三つの仮定からポアソン分布を導出する.

導出

まず,
 P_r (t)=P[X(t)=r]
と置く。

「と置く」というのは, 数学独特の言い回しで,
 P_r (t)
という記号を今後,
 P[X(t)=r]
という意味で使いますよ, という宣言だ.

 さて, 事象
 \{X(t+h)=r\}
は下記三つに場合分けできる.

場合 (1) :
\{X(t)=r, X(t+h)-X(t)=0\},

f:id:abrahamcow:20140307163009p:plain

場合 (2) :
 \{X(t)=r-1, X(t+h)-X(t)=1 \},

f:id:abrahamcow:20140307163028p:plain

場合 (3) :
 \{X(t+h)=r-k, X(t+h)-X(t)=k\},
 k>1
f:id:abrahamcow:20140307163039p:plain

これらは互いに排反である.

ここから, 三つの仮定より,

 P_r(t+h)=(1- \lambda h) + P_{r-1} \lambda h +o(h)

となる.

f:id:abrahamcow:20140307164753p:plain

これを以下のように式変形する.

 P_r(t+h) \\
= (1- \lambda h) + P_{r-1} \lambda h +o(h) \\
= P_r(t)-P_r(t)\lambda h +P_{r-1}(t) \lambda h + o(h),
移行して,
 P_r(t+h) -P_r(t) = -P_r(t)\lambda h +P_{r-1}(t) \lambda h + o(h)
h で割り,
 \frac{P_r(t+h) -P_r(t)}{h} = -P_r(t)\lambda  +P_{r-1}(t) \lambda  + \frac{o(h)}{h}.
極限をとり,
 \lim_{h \to 0} \frac{P_r(t+h) -P_r(t)}{h} = -P_r(t)\lambda  +P_{r-1}(t) \lambda  + \frac{o(h)}{h}.

 r=0 のとき,
 P'_0 (t) = -\lambda P_0 (t),

 r≠0 のとき,
 P'_0 (t) = -\lambda P_r (t)+\lambda P_{r-1}(t),
 (r=1, 2, \ldots, )

なる微分方程式がそれぞれ構成される.

 まず r=0 の場合を解く.
 P'_0 (t) = -\lambda P_0 (t)
 \frac{d P_0(t)}{dt} = -\lambda P_0 (t)
 \frac{1}{P_0(t)}dP_0(t) = -\lambda dt
両辺積分して,
 \int \frac{1}{P_0(t)}dP_0(t) = \int -\lambda dt
 \log|P_0(t)| = -\lambda t+C
C は積分定数.
これを
 P_0(t) = e^{-\lambda t+C}
と書き直す.
C は任意なので,
 e^{C}=C
と改めて置いて構わない.
 P_0(t) = C e^{-\lambda}
となる.

 このような形の微分方程式を, 変数分離形微分方程式と呼ぶ.

 さて, t=0 で 1 件も発生しない確率は 1 である.
 すなわち初期条件は,
 P_0(0)=1.
これを考慮すれば, C=1 なので
 P_t(0)=e^{-\lambda}
が得られる.

 これを r=1 の場合の微分方程式に代入して解く.
 線形 1 階常微分方程式の解の公式に黙々と当てはめる.

 y' + p(x)y=q(x)
の解は,
 y=e^{-\int p(x) dx} \left[\int q(x) e^{p(x)dx}dx \right]

すなわち,
 P_1(t) = \lambda t e^{-\lambda t}.

 同様にして
 P_r(t),
(r>2) が次々求められ, 結果ポアソン分布ができあがる.

 一応, 数学的帰納法でちゃんと証明しておこう.

 r=k のとき,
 P(X=k)=\frac{e^{-\lambda t}(\lambda t)^k}{k!}
が成り立つと仮定する(帰納法の仮定).

 r=k+1 のとき,
 P_{k+1}'(t)+\lambda P_{k+1}(t)\\
= \lambda P_k(t) \\
= \frac{\lambda^{k+1} t^k e^{-\lambda t}}{k!}

再び線形 1 階常微分方程式の解の公式の解の公式より,

 P_{k+1}(t) \\
= e^{-\lambda t} \left[ \int \frac{\lambda^{k+1} t^k e^{-\lambda t}}{k!} e^{\lambda t} dt +C \right]
 = \frac{\lambda^{k+1} e^{-\lambda t}}{k!}\left[ \int t^k dt +C \right ] \\
 = \frac{e^{-\lambda t}(\lambda t)^k}{k!} + Ce^{-\lambda t}

初期条件
 P_{k+1}(0)=0
より,

 P_{k+1}(t) = \frac{e^{-\lambda t}(\lambda t)^k}{k!}.

以上。

参考文献

理工系の確率論

理工系の確率論

入門・演習 数理統計

入門・演習 数理統計

微分方程式

微分方程式

統計学入門 (基礎統計学)

統計学入門 (基礎統計学)

関連エントリ

abrahamcow.hatenablog.com