読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

比ではなく間隔を表したいときは(Clevelandの)ドットプロットを使おう

棒グラフの省略表現

棒グラフの足を切る省略表現がなぜ悪いのかは下リンク集を参考にしてください。

このような省略表現は上田『統計グラフのウラ・オモテ』、大久保、岡田『伝えるための心理統計』にも見られます。

これらは決して悪い本ではないだけに残念です。

統計グラフのウラ・オモテ―初歩から学ぶ、グラフの「読み書き」 (ブルーバックス)

統計グラフのウラ・オモテ―初歩から学ぶ、グラフの「読み書き」 (ブルーバックス)

伝えるための心理統計: 効果量・信頼区間・検定力

伝えるための心理統計: 効果量・信頼区間・検定力

f:id:abrahamcow:20150118115725j:plain
『統計グラフのウラ・オモテ』(p.91)

f:id:abrahamcow:20140625041212j:plain
『伝えるための心理統計』(p.146)

特に『統計グラフのウラ・オモテ』はグラフの「読み書き」という形で、回帰分析やコーホートなど、けっこう高度な統計手法を数学の予備知識がなくても理解できるように説明した大変ユニークな本ですのでこのブログでは何度もおすすめしています。が、この省略表現は真似しないでください。

代替案はドットプロット

量と量の「比」ではなく「間隔」を見せたい場合、棒グラフの棒を省略したいことがあります。

そのようなときは(Clevelandの)ドットプロットを使うとよいでしょう。

『統計グラフのウラ・オモテ』(p.91)のように内訳を見せたい場合、下図のようにします。

f:id:abrahamcow:20150118121728p:plain
グラフの例:ドットプロット

『伝えるための心理統計』(p.146)のような場合、R では gplots パッケージの plotCI パッケージを使うとかんたんに平均の点+信頼区間のエラーバーを書くことができます。

library(gplots)
data(state)
tmp   <- split(state.area, state.region)
means <- sapply(tmp, mean)
stdev <- sqrt(sapply(tmp, var))
n     <- sapply(tmp,length)
ciw   <- qt(0.975, n) * stdev / sqrt(n)
plotCI(x=means, uiw=ciw)

f:id:abrahamcow:20150118122015p:plain


というご意見もありますが、基本的な図示においては、余計な棒は排除したほうが無難だと思います。

ドットプロットの欠点はエクセルで書くのがめんどくさいという点です。


エクセルでドットプロット - 廿TT

なんとかならないものか……。