読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

誤差の範囲とはなにか?

「誤差10%ですが」ってなんだよ……。

【2+2=?】数学者「きっかり4」統計学者「だいたい4。誤差10%ですが」弁護士「2+2をいくつにしたいんです?」


ブラックジョーク発信bot (@blackjoker_bot) 2013年3月20日

この文章は、ちょっと書いては書きかけのまま放置、ちょっと書いては書きかけのまま放置を繰り返していたので、時事ネタが変に飛び飛びでいつの話してんだかよくわからない感じになってしまった。

新聞などでたまに見かける「誤差の範囲」という言葉は状況によって意味が異なる。

  1. 物理学分野のニュースだと「有意水準 0.0001% で検定して棄却されない」という意味になるようだ。
  2. アメリカの大統領の支持率についてのニュースだと、「95% 信頼区間に含まれる」ときに「誤差の範囲」だという。
  3. 測定機器についてのニュースだと、 ±1標準偏差の範囲を「誤差の範囲」としているようだ。

ここでは「有意水準」や「信頼区間」 については説明しない。それらについて知りたい方は他のページを参照して欲しい。

物理学分野のニュースだと「有意水準 0.0001% で検定して棄却されない」という意味になるようだ

例えばこの記事、

素粒子ニュートリノが光より速く飛ぶとの実験結果を昨年9月に報告した名古屋大などの国際研究チーム「OPERA」は8日、測定精度を高めた再実験の結果、ニュートリノの速度は光速と誤差の範囲で同じだったとして、「超光速」の当初報告を撤回した。京都市で開かれているニュートリノ・宇宙物理国際会議で正式に発表した。


2012年6月8日  msn. 産経ニュース:強調は引用者

誤差の範囲という言葉が出てくるが、よくわからない。

一方、こちらならわかる。

今回の成果では、CMS、ATLAS共に、実験によって未知の新粒子が生まれた確率を99.9999%以上とはじきだした。この確度であれば物理的に「発見」と認定できる。


2012年7月5日 朝日新聞デジタル(リンク切れ?)

ここから、どうも物理学の分野では、0.0001% 有意になってはじめて正式に「発見」とみなすのだ、という慣習があることが推測できる。シックスナインってやつですな。

仮説検定でよく使われる優位水準は 5%、1% とか 0.1% なので 0.0001% というのは相当きびしい。でも物理学は科学的な「事実」を探っているわけなのでこういうピュアーなことになるのだろう。

アメリカの大統領の支持率についてのニュースだと、「95% 信頼区間に含まれる」ときに「誤差の範囲」だという

例えばこの記事に誤差の範囲という言葉が出てくる。

一方、NBCとウォール・ストリート・ジャーナル(WSJ)の調査では、オバマ大統領の支持率は47%、ロムニー氏が44%で、大統領のリード幅は3ポイントと誤差の範囲となった。

2012年6月28日 朝日新聞デジタル:オバマ米大統領支持率、激戦州でロムニー氏をリード=世論調査

僕はこの本を読んでこの意味がわかった。

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))


ていねいに説明してあるので長くなるが、引用する。

そう、世論調査会社が主張しているのは、もっとずっと慎ましいことだ。つまり彼らは、サンプルの 1000 人ではなく該当地域の有権者に漏れなく電話をかけ、「全数調査」を行なったとしたら、1000 人を対象とする世論調査の結果は、20 回に 19 回の割合で、全数調査の結果プラスマイナス 3.1% の範囲に収まるだろう、と主張しているのだ。

あるいは、こう言ってもいい。同じよう な世論調査を 20 回続けて行なったら(つまり、毎回ランダムに選んだ 1000 人の成人居住者に電話をかけ、どう投票するかを尋ねたら)、その結果は、およそ 19 回が「正しい」答え(つまり、その時点で住民が世論調査会社に回答する真の投票動向)からプラスマイナス 3.1% の範囲に収まる。


運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ)) (漢数字は算用数字に改めた)

アメリカの新聞では世論調査のときに 95% 信頼区間を「誤差の範囲」として併記する習慣があるようだ。

測定機器についてのニュースだと、 ±1標準偏差の範囲を「誤差の範囲」としているようだ

例えばこの記事に誤差の範囲という言葉が出てくる。

個人線量計は不良品でなくとも、使っていくうちに一定の誤差が生じることがある。調査した製品はいずれも、取り扱い説明書で誤差の範囲を10~15%としていた。同センターは販売前の品質の点検と、誤差補正などアフターサービスの充実を業者に要請した。


朝日新聞デジタル:市販の個人線量計、誤差40%の機種も テストで判明

文中の「同センター」というのは国民生活センターのことで、こちらの記事のほうが調査結果がより詳しく書かれている。
国民生活センター、デジタル個人線量計6製品を調査

対象になった商品の一つ、DoseRAE2 についてはこんなページがあり、「測定誤差範囲」が書かれている。

で、ウィキペディアによると、測定機器の精度は測定における標準偏差で表されることが多いらしい。

ここから、おそらく測定機器についてのニュースだと、 ±1標準偏差の範囲を「誤差の範囲」としているんじゃないかと思う。

まとめ

たぶん新聞記者自身も「誤差の範囲」がなんなのかよくわかってなくて、伝聞伝聞で字句を変えずに書いてるんだと思う。だからこんなややこしいことになる。

新聞社にいるような人たちはたぶん一人ひとりは大なり小なりジャーナリズムの理想みたいなものを持ってるんだと思うけど、なんでそれが組織になったとたんにルーチンワークの伝言ゲームになってしまうのか……。これはとても不思議なおもしろい現象で、僕にとっても他人事じゃないなあと思いました。

あと、僕は「学術用語っぽいけど実は学術用語じゃない言葉」には注意が必要だと思っている。そういうのが出てくる文章は、書いてる人自身がなにを書いてるかわかってない、またはなにかをごまかしてることが多い気がする。例を挙げるとプラズマクラスターとかナノイーとかマイナスイオンとかエクリチュールとかネオテニーとか。メルトダウンもそうかもしれない。もちろん「イオン」「プラズマ」「ネオテニー」などは本来厳密な定義がある言葉なんだろうけど、でも、もともとの意味から離れた使われ方をされるケースがよくある。

統計学は根っこに確率があるので、「この『差』が偶然生じたものである可能性はこれくらいです」なら言えるけど、「ここからここまでは誤差! ここからこっちは誤差じゃない!」とビシっと決めたりはできない。

というわけで「誤差の範囲」も要注意ワード入りしよう。軽い感じで「うーんそれくらい誤差の範囲じゃなーい」という使われ方ならいい。でも、ビシッと「それは誤差の範囲です!」というニュアンスだったら要注意だ。書いてる人自身がなにを書いてるかわかってない、またはなにかをごまかしている可能性大だ。