読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

3D円グラフとともに滅するべき棒グラフの省略表現

ポリシー Excel グラフ

本稿の主張

棒グラフをかくときは、縦軸をつけ、原点を 0 にしましょう。

あと、大学の先生の教育面での取り組みがもっと評価される世の中になって欲しいです。

はじめに:ちゃんと叱ってくれる先生は評価しよう

3D円グラフ

ふと思い立って「3D円グラフ」で検索してみたところ、なんとトップに奥村先生のページが!

f:id:abrahamcow:20141207001846p:plain
3D円グラフを使うのはやめよう | Okumura's Blog

ツイッターでも検索してみたところ、「3D円グラフ」→「避けるべき可視化」という認識がかなり浸透している模様です。

f:id:abrahamcow:20141207011108p:plain
3d円グラフ - Twitter Search

これは素晴らしいことだと思います。サイエンス・コミュニケーションの貴重な成功事例です。

以前ある人が、
「奥村先生、変なグラフみつけてくるのが趣味みたいになってますよね〜」
と言っているのを耳にしたことがあります。

しかし、奥村先生のダメな統計グラフ批判はそういう観点で捉えるべきではないと思います。

「3D円グラフ」→「ダメ」という専門家から見たら当たり前の指摘も、一歩外に出ればぜんぜん当たり前の認識ではないのです。

大学というのは不思議な場所で、「大学の先生」は教育者なのに、教育は業績として評価されにくく、研究で評価されるようなところがあります。

  • 研究者:今までだれもやってなかったことを見つけ出してやる仕事
  • 教育者:その学問の専門家から見れば当たり前の「定説」をきちんと伝える仕事

という、相反することを同時にやっていかなきゃいけないのです。

実際、専門家から見たら当たり前のことだって、ぼくら素人からすればちゃんと言ってくれないとわからないのですが、専門家がわざわざそんな仕事をするインセンティブは非常に少ないのです。

むしろ「ダメなものをちゃんと叱る」をやろうとすると仕事増えるし、あちこち角が立ってめんどくさいことになったりするし、金にはならないし、いいことなしです。

奥村先生の3D円グラフ批判は、業績として評価されにくい教育・啓蒙をボランティアで根気強く行い成功させたという、非常にガッツのある行為として評価されて欲しいと思います。

省略棒グラフ

一方、奥村先生が「ユーレイ棒グラフ」(ユーレイ棒グラフ | Okumura's Blog )と呼んで批判している、縦軸を省略した棒グラフはどうでしょうか。

f:id:abrahamcow:20141207014002p:plain
検索結果画面の上位に来るのは、途中を省略した棒グラフを支援・肯定するページが多いようです。

うーむ、省略棒グラフに関しては、まだまだ根気強い批判が必要かもしれません。

というわけで、それをやります。

ケーススタディExcel による実践

縦軸を省略した棒グラフがなぜだめなのか、詳しくは下記エントリをご覧いただければと思います。


原点がゼロでないグラフ、2軸のグラフ - 廿TT

棒グラフは比例尺度(比率尺度、比尺度ともいう)を表すものなので、比の関係が保たれていなくてはなりません。
(尺度の説明は データの種類 等を参照してください。)

棒グラフを見るとき、われわれは一つの棒を絵画のように鑑賞しているわけではなく、一連の棒の高低をくらべるという「統計的な」見方をしているのです。

統計グラフのウラ・オモテ―初歩から学ぶ、グラフの「読み書き」 (ブルーバックス)

統計グラフのウラ・オモテ―初歩から学ぶ、グラフの「読み書き」 (ブルーバックス)

ではケーススタディです。

下図は棒グラフの足が切られた「ユーレイ棒グラフ」です。

f:id:abrahamcow:20141207021055j:plain
http://www.tokyo-np.co.jp/article/economics/news/CK2014120502000126.html
(生乳は「せいにゅう」と読みます。「きにゅう」で変換しても漢字が出ませんでした。「なまちち」だと出ました。生乳 - Wikipedia

このデータを図示するには、どのようなやり方が適切でしょうか。

尺度の話が頭に入っていればすぐに答えが思い浮かぶと思います。
折れ線グラフがいいでしょう。

f:id:abrahamcow:20141207021608p:plain
(データは http://www.j-milk.jp/gyokai/database/milk-kiso.html の『1) 全国 (0002) 』より)

折れ線グラフ(の縦軸)は間隔尺度を表すものですので、原点が 0 である必要はありません。

生産量の減少傾向という、年度ごとの数字の「間隔」を見るのに適しています。

ちなみに Excel のグラフは、デフォルトだと目盛り線を細かく引きすぎるきらいがあるため、

f:id:abrahamcow:20141207023642p:plain

「軸の書式設定」から「目盛」を選んで、「目盛間隔」を多少広げてやると見栄えがよくなると思います。

もうひとつついでに、 Excel のグラフはさまざまなグラデーションや陰影をつける機能が用意されていますが、これも「ユーレイ棒グラフ」と同様、比の関係を読み取りにくくするおそれがあるので、使用は避けたほうが無難です。


ぼくの考えたグラフ三原則 - 廿TT

あ、あとぼくは東京新聞を槍玉に挙げることが多いですが( ロングテールSEOのためのパレート図の紹介と RGoogleAnalytics による実践 - 廿TT金融緩和の目的は「円安で輸出拡大を呼びこむこと」じゃありません - 廿TT など)、東京新聞が嫌いだとかダメだとか言いたいわけではないです。産経とか読売はハナからあんまり読んでないだけです。

例外:飛び抜けた値のある場合

縦軸を省略した棒グラフはだめ、という前提で話をしてきましたが、データに外れ値異常値のある場合、外れ値、異常値だけを切り出して図示するのは例外的にオッケーです。

つまり下図のような場合に、

f:id:abrahamcow:20141207025619p:plain

一回外れ値を取り出して、

f:id:abrahamcow:20141207033522p:plain

外れ値だけ別の軸(「第2軸」)に従うようにして、

f:id:abrahamcow:20141207033548p:plain

図形の挿入とかやってマメに編集して、

f:id:abrahamcow:20141207033431p:plain

棒グラフの頭の方を省略する行為は問題ありません。

ただし、「外れ値」というのは、

外れ値(はずれち、英:outlier )は、統計において他の値から大きく外れた値である。

外れ値 - Wikipedia

という、非常にあいまいな定義しかない言葉なので、なにをもって「外れ値」「異常値」とみなすか、というのは真剣に考えだすと難しい問題です。

外れ値や異常値の検出は、統計学的にもまだまだ(いろいろおもしろくて重要な)研究がなされていますが、ここはあまり深入りせず、

  • 棒グラフの足を切るのはダメ
  • 棒グラフの頭を切るのはオッケー(ただし本当にその必要があるかちょっと考えて)

くらいに捉えてください。

また、このように飛び抜けた値があるときは、対数目盛りを使用する、ということもよく行われます。

エクセルでは「軸の書式設定」から、「対数目盛を表示する」を選ぶと、

f:id:abrahamcow:20141207035052p:plain

下のように描画されます。

f:id:abrahamcow:20141207035137p:plain

ただ、ぼくは対数目盛りを使うんだったら、下のキャプチャのように(単位を明記した上で)対数を取った値をプロットしたほうが良いと思います。

f:id:abrahamcow:20141207035653p:plain

これについては、まだあまり考えがまとまっていないので、「対数目盛はダメだ。使うな」とまでは言い切れません。

しかし、ぼくが対数目盛りを好きになれない理由は述べます。グラフは尺度が線形であることが望ましいと思うからです。

線形というのは「足し算ができる」という意味です。

「とりあえず足し算ができる」というのは便利なので、線形性という性質は強力です。

グラフの尺度が線形というのは、「グラフのパネル内の比較対象どうしを物差しで測ったとき、足し算をすることができる」という意味です……が、この説明じゃわかりにくいですね……。

ま、対数目盛りの話は、「ユーレイ棒グラフ」にくらべれば些細な問題なので、「ふーんいろんな考えかたがあるんだなー」くらいに感じて頂ければと思います。

おわりに:教育者としてえらいと思う大学の先生

マクラで奥村先生に対するリスペクトの念を述べ、「大学の先生」は教育者なのに、教育は業績として評価されにくい、という話をしました。

ぼくとしては教育者として立派な先生方がいなくなってしまうと困るので、こういう方々がもっと評価されて欲しいという願いを込め、教育者としてえらいと思う大学の先生をぱっと思いつく範囲で適当に列挙して結びとさせて頂きます(順不同敬称略)。

以下に列挙する方々はぼくと直接面識がなく、主としてインターネット上での活動から知った人のみです。

直接お世話になった/なっている先生方には別の機会にお礼をいいます。

ここに名前があがっていないからといって尊敬してないわけではないです。

ほら、ぼくってけっこういろんな人に嫌われてるから、おれと直接関係があることがわかっちゃうと、迷惑を被る場合も多いのです。

田崎晴明

ホームページ:Hal Tasaki's Home Page in Japanese

フリーで公開してる数学の教科書 数学:物理を学び楽しむために とかすごいおもしろいです。
「物理をやりたくて大学に入ったのに、どうしてこんなに数学をやるんだ」と冒頭で延々と自問自答するのすごい。
あの悪名高き ε-δ 論法の説明とかも超わかりやすい。

やっかいな放射線と向き合って暮らしていくための基礎知識 も良いし、
「水からの伝言」を信じないでください とか、疑似科学批判も積極的にやってらっしゃいます。
田崎先生の疑似科学批判は「こんなエセ科学に騙されて、君たちおバカさんね」というような感じではなく、ビリーバー、肯定派の方をなんとか説得しようという誠実さにあふれた文体です。

黒木玄

ホームページ:黒木玄のウェブサイト

数学者なんだけど幅広い分野に関心を持っている方で、上記サイト内の文章いろいろおもしろいのでおすすめです。

ツイッター黒木玄 Gen Kuroki (@genkuroki) | Twitter)では、かけ算順序問題や経済関連の発言が多めです。

氏のかけ算順序問題への取り組みは、
かけ算の式の順序にこだわってバツを付ける教え方は止めるべきである
に集約されています。


高橋誠『かけ算には順序があるのか』福岡伸一書評評 - 廿TT


前野昌弘

ホームページ:ページ移転のお知らせ

微分ってなあに?(表紙) などの教材の親切さとわかりやすさ。こういうのをバンバン作れちゃう人をぼくは尊敬します。

菊池誠

ホームページ:Home Page of Kikuchi

血液型性格診断等のニセ科学問題での活動を通じて知りました。

とりあえず nise kagaku の文章がおすすめです。

ツイッターきく☆まこ。 (@kikumaco) | Twitter)では、放射能関連デマや、EM菌などの疑似科学に関する訂正を懇切丁寧にやって、結果「御用学者」だのなんだのと呼ばれるという光景が日夜くりひろげられており、胸が痛みます。

こういった科学知識の啓蒙活動がもっと評価される世の中になって欲しいです。