廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

何時にツイートしたら一番みてもらえるか。Twitter アナリティクスデータの可視化。

Twitter Analytics からツイートのインプレッション(表示された回数)とかが見れる。

f:id:abrahamcow:20141126171132p:plain

ツイートが一番閲覧されやすい時間帯とかってあるのかな、と気になった。

とりあえずプロットしてみよう。

まずデータをエクスポートして R に読み込む。

dat1 <- read.csv(file.choose(),stringsAsFactors = FALSE)
> dim(dat1)
[1] 875  40

875行、40列といろんなデータが入ってるが、とりあえずツイートと時刻、インプレッション数は3列目〜5列目だ。

> head(dat1[,c(4:5)])
                    time impressions
1 2014-11-25 15:35 +0000          11
2 2014-11-24 16:47 +0000          51
3 2014-11-24 15:16 +0000          19
4 2014-11-23 20:56 +0000          47
5 2014-11-23 18:52 +0000          45
6 2014-11-23 18:11 +0000          48
> tail(dat1[,c(4:5)])
                      time impressions
870 2013-10-08 16:06 +0000           0
871 2013-10-05 09:40 +0000           0
872 2013-10-04 15:05 +0000           0
873 2013-10-02 17:27 +0000           0
874 2013-10-01 17:17 +0000           0
875 2013-10-01 15:21 +0000           0

2013-10-01 〜 2014-11-25までのツイートがエクスポートされている。(過去1年分?)

インプレッション数の折れ線グラフはこうやってかく。

library(ggplot2)
library(scales)

theme_set(theme_bw(base_size=15))

ggplot(dat1, aes(x=as.POSIXlt(dat1$time),y=impressions)) +
  geom_line(colour="grey50") +
  scale_x_datetime(labels = date_format("20%y/%m/%d")) +
  labs(x="")

f:id:abrahamcow:20141126172520p:plain

さて、ツイートが一番閲覧されやすい時間帯を知りたいので、日付を無視して、横軸に時刻、縦軸にインプレッションをとって、棒グラフにする。

tmp <- "2014/11/26"
#適当な日付をいれちゃう
t1 <-substr(dat1$time,12,16)
#時刻のところだけ切り出す
t2 <- as.POSIXlt(paste(tmp,t1))
p1 <- ggplot(data=dat1, aes(x=t2,y=impressions))
p1 + geom_bar(stat="identity")+
  scale_x_datetime(labels = date_format("%H:%M"),breaks=("2 hour"))+
  scale_y_continuous(labels = comma) +
  labs(x="")

f:id:abrahamcow:20141126173104p:plain

わりと一様に分布しているが、朝方4時ごろとかのインプレッションが少なくないのがちょっと意外だった。

ぼくのフォロワーは朝4時からツイッターやってるのか(おれもだけど)。

ソーシャルバズマーケティングとかやりたい方、こんな感じでいろいろ試してみてください。

……と書いたところ実際に試してみてくれた方がいました。こういうのはすごく嬉しいです。


Twitterに何時に投稿したらフォロワーに読まれやすいのか調べてみた - 唯物是真 @Scaled_Wurm こちらはPythonです。こちらの方のほうがやってること高度なので、この記事に興味を持たれた方は、ぜひご覧ください。


本ブログの Google アナリティクスよりデバイス別訪問推移(ggplot2 日付−時間スケール) - 廿TT こちらは R で時間オブジェクトを扱っているという意味で関連エントリとして挙げさせて頂きます。