読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

仮説:できるビジネスマンにとって、散布図は2×2の表なのだ。

散布図は相関をみるために使おう。

f:id:abrahamcow:20140102031413p:plain

  • 正の相関:x軸の値とy軸の値にぼんやりとした比例の関係が見える
    • xが大きいときはyが大きい。xが小さいときはyが小さい。
  • 相関0:x軸の値とy軸の値に比例・反比例の関係は見られない
    • xが大きいときはyが大きいとは限らないし、逆にxが大きいときはyが小さいとも言えない。
  • 負の相関:x軸の値とy軸の値にぼんやりとした反比例の関係が見える
    • xが大きいときはyが小さい。逆にxが小さいときはyが大きい。

というと、納得してくれる人は多い。
しかし、アナリストとかコンサルタントとか呼ばれる職種の人々は、散布図をなかなかわかってくれないのだ。(※ぼく個人の経験ですのでアナリストとかコンサルタントとか呼ばれる職種の人々が一般的にみんなそうなのかは知らない)

その理由はおそらくこれだ。

散布図が2×2の表に分割されている。

散布図が2×2の表に分割されている場合、楕円で示したような関係、つまり相関関係を読み取るのは困難だろう。

散布図が2×2の表に分割できるのは、非常に特殊な場合にのみ限られることに注意して欲しい。

しかし、アナリストとかコンサルタントとか呼ばれる職種の人々は、おそらく無意識に散布図を2×2の表に分割して見てしまうのだ。

なぜか?

下の図2つを見て欲しい。

f:id:abrahamcow:20141122044512p:plain
ジョハリの窓 - Wikipedia


f:id:abrahamcow:20141122044537g:plain
N's spirit PPMとは PPM分析 PPMマトリックス


こういった表は、ビジネス本や自己啓発書などで非常によく見られる。

おそらくアナリストとかコンサルタントとか呼ばれる職種の人々の多くは、それらの影響を強く受けているのではないか。

というわけで、ビジネス本とか自己啓発書とか、滅びてくんね―かな、という愚痴でした。

おまけ

冒頭の散布図を描くRのコード。
2変量正規分布の密度関数の等高線に、2変量正規乱数のプロットをかぶせてある。

library(mvtnorm) 
mu <- c(0,0)
Sigma_1 <- matrix(c(1,0.7, 0.7,1), 2, 2)
Sigma_2 <- matrix(c(1,-0.7, -0.7,1), 2, 2)
Sigma_3 <- matrix(c(1,0, 0,1), 2, 2)
x1 <- seq(-3, 3, length=100)
x2 <- x1
z_1 <- outer(x1, x2,  function(x1,x2) {
  dmvnorm(matrix(c(x1,x2), ncol=2), mean=mu, sigma=Sigma_1)
})
z_2 <- outer(x1, x2,  function(x1,x2) {
  dmvnorm(matrix(c(x1,x2), ncol=2), mean=mu, sigma=Sigma_2)
})
z_3 <- outer(x1, x2,  function(x1,x2) {
  dmvnorm(matrix(c(x1,x2), ncol=2), mean=mu, sigma=Sigma_3)
})
rand1 <-rmvnorm(1000, mu, Sigma_1)
rand2 <-rmvnorm(1000, mu, Sigma_2)
rand3 <-rmvnorm(1000, mu, Sigma_3)
par(mfrow=c(1,3))
#nihongo()
contour(x1,x2,z_1, lwd=3, col="gold2", main="正の相関")
points(rand1, col=densCols(rand1),pch=16)
contour(x1,x2,z_3, lwd=3, col="gold2",main="相関0")
points(rand3, col=densCols(rand1),pch=16)
contour(x1,x2,z_2, lwd=3, col="gold2", main="負の相関")
points(rand2, col=densCols(rand1),pch=16)

参考文献

二変量正規分布の2D/3Dグラフィクス
こすけの日記: Rで高密度なデータの散布図
二変量正規分布の密度関数、楕円 - 廿TT ←ぼくの昔のブログ
有効なWikiNameではありません - RjpWiki

An Introduction to Multivariate Statistical Analysis

An Introduction to Multivariate Statistical Analysis

入門・演習 数理統計

入門・演習 数理統計

R/S‐PLUSによる統計解析入門

R/S‐PLUSによる統計解析入門