廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

正規分布の確率密度関数の式を読む

السلام عليكم

 正規分布確率密度関数は、
f(x)=\frac{1}{\sqrt{2\pi\sigma^{2}}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2} \right)
で表される。

 はじめてみる数式は、なにやらごちゃごちゃしたひとかたまりの文字列にみえる。
 はじめてみるアラビア語がどっからどこまでが一文字なのかすらわからないのと同じだ。

 でも文字をおぼえ、単語をおぼえ、慣用句や定型的な言いまわしをおぼえ……ってしているうちにだんだん解像度が上がってくる。

 ここでは正規分布確率密度関数の式に対して、そういうことをやりたいと思う。

ガウス積分

 物理学者のケルビンは「数学者とは
 \int^{\infty}_{-\infty} e^{-x^2} dx=\sqrt{\pi}
が2+2=4 と同じくらい当たり前の人たちである。」といったらしい。

  \int^{\infty}_{-\infty} e^{-x^2} dx
にはガウス積分という名前がついている。

 計算方法についてはウィキペディアなどを見て欲しい。
ガウス積分 - Wikipedia

正規分布

 さて、
 \int^{\infty}_{-\infty} e^{-x^2} dx=\sqrt{\pi}
は当たり前としよう。

 ここで、
x=\frac{z}{\sqrt{2}}
と変数変換すると、
dx=\frac{1}{\sqrt{2}}dz
より
 \int^{\infty}_{-\infty} e^{ -\left( \frac{z}{ \sqrt{2} } \right)^2 } \frac{1}{\sqrt{2}} dz=\sqrt{\pi}
 \frac{1}{\sqrt{2}} \int^{\infty}_{-\infty} e^{-\frac{z^2}{2}}  dz=\sqrt{\pi}
 \frac{1}{\sqrt{2 \pi}} \int^{\infty}_{-\infty} e^{-\frac{z^2}{2}}  dz=1
となる。

 全区間で積分して 1 になるので、
f(x)=\frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2} \right)
は、確率密度関数になっている。

 これは標準正規分布確率密度関数である。

 また、
 \int^{\infty}_{-\infty} e^{-x^2} dx=\sqrt{\pi}

x=\frac{z-\mu}{\sqrt{2}\sigma}
で変数変換すると、
dx=\frac{1}{\sqrt{2}\sigma}dz
より、
 \int^{\infty}_{-\infty} e^{ -\left( \frac{z - \mu}{ \sqrt{2} \sigma} \right)^2 } \frac{1}{\sqrt{2}\sigma} dz=\sqrt{\pi}
 \frac{1}{\sqrt{2 \pi \sigma^2}} \int^{\infty}_{-\infty} e^{-\frac{(z-\mu)^2}{2}}  dz=1
となる。

f(x)=\frac{1}{\sqrt{2\pi\sigma^{2}}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2} \right)
正規分布確率密度関数である。

 μ は正規分布の山の位置(ロケーション)を左右するパラメータ、σ は正規分布の山の形状(シェイプ)を左右するパラメータである。

f:id:abrahamcow:20140511021516p:plain
 μ が変わると山の位置がずれる。σ が大きくなるとの山の裾野が広がる。

中心極限定理

 正規分布が強力なのは、中心極限定理があるからだ。

 中心極限定理は、標本の大きさ n が十分大きいとき、標本平均
 \frac{1}{n} \sum^{n}_{i=1} X_i
の分布は、正規分布によって近似できるということを示している。

 母集団の分布が正規分布がでなくても、サンプルサイズが大きければ標本平均の分布が正規分布で近似できるというのはとても便利な性質だ。

 第 3 講:中心極限定理(pdf)中心極限定理の 証明の概略が書かれている。

 ここでは母集団分布に積率母関数が存在するという定理より強い仮定を置いているが、特性関数を使えばこの仮定は必要なくなる。

 Central limit theorem - Wikipedia, the free encyclopedia

参考文献

弱点克服大学生の確率・統計

弱点克服大学生の確率・統計

スバラシク実力がつくと評判のラプラス変換キャンパス・ゼミ

スバラシク実力がつくと評判のラプラス変換キャンパス・ゼミ

入門・演習 数理統計

入門・演習 数理統計

おまけ

 グラフを描画する R のコード。

curve(dnorm(x),xlim=c(-8,8),xlab="",ylab="",col="blue4",lwd=3)
curve(dnorm(x,mean=2),add=TRUE,col="red4",lwd=3)
curve(dnorm(x,sd=2),add=TRUE,col="yellow4",lwd=3)
#nihongo()
legend("topleft",legend=c("μ=0, σ=1", "μ=2, σ=1", "μ=0, σ=2"),
       col=c("blue4","red4","yellow4"), lty=1,lwd=3)