読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

(R + Google アナリティクス)2014年人気だった記事の集客力はどのくらい目減りしたか

Google アナリティクス R

前置き

コンテンツをつくるのはお金や手間がかかるので、ひとつひとつの記事が集客力を維持してくれるとうれしい。

そこで2014年のセッション数トップ10の記事が、2015年にはどのくらいセッション数があったか集計してみる。

集計には RGA パッケージを使う。

RGA の紹介は、
Rを使ったGoogle Analyticsデータの解析にはRGAパッケージがお手軽 - Qiita
などを参照されたい。

R のコード

library(RGA)
library(ggplot2)
library(scales)
library(dplyr)
library(tidyr)
#必要なパッケージを読み込んだ
authorize() 
prof <-list_profiles()
YPP <-get_ga(profile.id = prof$id[1],
              start.date = "2014-01-01", 
              end.date   = "2015-12-31",
              metrics    = "ga:sessions",
              dimensions = "ga:year,ga:pagePath")
#以上でデータ取得は完了
Y2014 <-YPP %>%
  dplyr::filter(year==2014) %>%
  dplyr::arrange(desc(sessions)) %>%
  dplyr::select(-year)
#2014年のランキング
Y2015 <-YPP %>%
  dplyr::filter(year==2015) %>%
  dplyr::arrange(desc(sessions)) %>%
  dplyr::select(-year)
#2015年のランキング
YPP2 <- full_join(Y2014,Y2015,by="page.path") %>%
  dplyr::rename(Y2014=sessions.x,Y2015=sessions.y) %>%
  dplyr::select(page.path,Y2014,Y2015) %>%
  dplyr::mutate(order=1:length(Y2014))
#2014年のランキングに2015年のランキングをくっつけた
#以下プロット
head(YPP2,10) %>%
  gather(year,sessions,-c(page.path,order)) %>%
  ggplot(aes(x=reorder(page.path,order),y=sessions))+
  geom_bar(aes(fill=year),stat="identity",position = "dodge")+
  scale_y_continuous(labels = comma)+
  theme_bw(20)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))+
  xlab("")

結果

f:id:abrahamcow:20160104044615p:plain

page.path Y2014 Y2015 order
/entry/2014/01/05/081748 5300 963 1
/entry/2014/01/25/232720 4543 3958 2
/entry/2014/02/06/003147 3625 1777 3
/entry/2014/10/19/190552 3575 1481 4
/entry/2013/03/21/223717 2844 1609 5
/entry/2014/10/20/020602 2669 1198 6
/entry/2014/03/05/001432 2664 2109 7
/entry/2013/08/03/160222 1785 1835 8
/entry/2014/03/23/064859 1732 2069 9
/entry/2013/12/28/210035 1312 208 10