廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

{ggplot2} 集計済みデータのヴァイオリンプロット

データがこのようにすでに集計された状態で与えられたときに、複数カテゴリ間で分布を比較したい。

  value A B
1     1 1 3
2     2 2 2
3     3 3 1

ヴァイオリンプロットが使えることがわかった。

library(cowplot)
library(tidyr)
data <- data.frame(value = 1:3,
                   A = 1:3,
                   B = 3:1)
data2 <-data %>% gather(category,count,-value)
ggplot(data2, aes(x = category, y = value, violinwidth=count/max(count))) + 
  stat_identity(geom="violin")

f:id:abrahamcow:20170508213215p:plain

geom_violin を使っても描画されるんだけど、なんか警告がでる。