読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

高校数学の復習からはじめる二項分布の導出

前置き

 ぼくは大学の数学科を卒業してるんだけど、高校のとき、確率とか場合の数とか順列組み合わせとか習っていなかった。
 ぼくは定時制かつ単位制の高校に通っていたので、どの授業を履修するか好きに選べた。数学のカリキュラムは数学 1、数学 2、数学 3、数学 A、数学 B、数学 C、数学演習、数学基礎とかなんか、すごいいっぱい分かれていて、数学 1、数学 2、数学 3、数学演習、数学基礎はとったんだけど、数学 A、数学 B、数学 C はとってなかった。
 数学 A のなかに確率とか場合の数とか順列組み合わせが入ってるなんて知らなかった。なんか A、B、C なんて 1、2、3 のおまけみたいなものかと思ってた。

 でも数学では、人から教わるにしても結局は自分で考えて納得するしかない、みたいなところがある。
 大学の数学科の同級生が、確率、統計のゼミで「二項分布とか、正規分布とか、いろいろ教わったけど、どういうときにどれを使えばいいのか分からない」と言っていた。

 ぼくは高校で確率とか教わってなかったので、自分で勉強するしかなかったんだけど、結果的にそのやり方は悪くなかったんじゃないかと思っている。

 教わって覚えるよりも、自分のペースで手を動かしながら導出してった方が、実用的に身についてたりすることもあるんじゃないか。(もちろん全部をいちいちそのやり方でやっていたら、数学を勉強するのに数学の歴史くらい長い時間がかかってしまうので、人から教わるのも大事だし、意味は分からないけどとりあえず計算はできる、という状態も後々役に立ったりする。なにごとも時と場合による。)

 そう思ってこの文を書いてる。

本文

 独創性のない先生はよく確率の話に例としてコイン投げとかを使う。
 独創性はぼくもないので、コイン投げの比喩を使う。

 問 1:3 回コインを投げて内 2 回が表である確率はいくらか? ただしコインを 1 回投げて表が出る確率は p とする。

 まず、場合の数をすべて数え上げてみる。

 3 回コインを投げて内 2 回が表である場合の数は、

 (1) 表、表、裏
 (2) 表、裏、表
 (3) 裏、表、表

の 3 通りだ。

 このように場合の数を数え上げるときには組み合わせという強力な手段があった。

 これは以下のような図

f:id:abrahamcow:20140309013138p:plain

を書くと分かりやすい。3 回コインを投げて内 2 回が表である場合の数は、3 つのコインから表になるコインを 2 個選ぶのと同じように考えることができる。

 3 個から 2 個を選ぶ組み合わせは

 _{3}\mathrm{C}_2 = \frac{3 \cdot 2 \cdot 1}{2 \cdot 1} =3

と計算できる。

 次に、
 (1) 表、表、裏
 となる確率を考える。

 コインを 1 回投げて表が出る確率は p だった。

 裏がでる確率は事象の確率なので 1 - p と表せる。

f:id:abrahamcow:20140309014947p:plain

 表、表、裏ならばその確率は掛け算
  p \times p \times (1-p)=p^2(1-p)
で表せる。

 (2) 表、裏、表
 (3) 裏、表、表
も同様。

 結果、3 回コインを投げて内 2 回が表である確率は、

3 p^2(1-p)

となる。

 実は、これを一般化したものが、二項分布の確率関数だ。

 問2:n 回コインを投げて内 k 回が表である確率はいくらか? ただしコインを 1 回投げて表が出る確率は p とする。

 n 個から k 個を選ぶ組み合わせは

 _{n}\mathrm{C}_k

と表せる。

 また n 個のコインが下の図のようになる確率は、

f:id:abrahamcow:20140309031958p:plain

p^{k}(1-p)^{n-k}

と書ける。

 なので、結果

 n 回コインを投げて内 k 回が表である確率は、

 _{n}\mathrm{C}_{k}  p^k(1-p)^{n-k}

となる。

 これが二項分布の確率関数である。


付記:
 数学の本はたいてい一般的な定義があって、定理があって証明があって最後に例題、という構成になっている。

 でも、いきなり一般的な n とか k とか p について考えるのは難しいので、こういうのにはまず適当な数字を入れてみるといいと思う。

 また、高校では組み合わせを

 _{n}\mathrm{C}_{k}

と表すが、大学では

 \left( \begin{array}{c} n \\ k \\ \end{array} \right)

と表すことが多い。

 これは、カッコにしたほうが中に長い式とかを入れたときに見やすくて便利だからだ。

 数学の記号は単に記号に過ぎない。
 なので場合によって意味が変わったり、書き方が変わったりする。

 「数学の記号は単に記号に過ぎず、場合によって意味が変わったり、書き方が変わったりする」ということも、おさえておくといいと思う。

参考文献

忘れてしまった高校の数学を復習する本―高校数学ってこんなにやさしかった!?

忘れてしまった高校の数学を復習する本―高校数学ってこんなにやさしかった!?

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)