読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

Google アナリティクス

{googleAnalyticsR} {ggplot2} Crossbar plot で滞在時間の分布を比べる

Crossbar plot は次のような図です。これがなにを表すかは場合によります。今回は箱の上の辺にデータの75%点、真ん中の線に中央値、箱の下の辺に25%点を割り当てました。いわば退化した箱ひげ図です。次の図はあるランディングページを経由した訪問の、月ご…

{googleAnalyticsR} {ggplot2} 内訳をドリルダウンしていく棒グラフ

ggplot2 で左から右に内訳をドリルダウンしていく棒グラフ(ツリーマップ?)を書きました。新規訪問で自然検索経由のデスクトップを利用している男性の25歳〜34歳のCVが多いことがわかります。ついで再訪問でソーシャル経由訪問のモバイルを利用している男…

R の treemapify パッケージで Google アナリティクスのデータをツリーマップに

ただパッケージ動かしてみたっていうだけなんですけど。インストール方法は GitHub - wilkox/treemapify: ggplot2 geoms for drawing treemaps に従ってください。ggplot の記法が使えて、facet とかできる点がいいと思いました。 #library(devtools) #inst…

Google アナリティクスとサーチコンソールのデータをマージして使う

統計ソフト R から Google アナリティクスのデータを引っぱってこれるパッケージ googleAnalyticsR の使い方は、 googleAnalyticsR の使い方(Version:0.1.0) - 廿TT にざっと書いた。サーチコンソールのデータを引っぱってこれるパッケージ searchConsoleR…

ゼロ過剰負の二項分布によるセッションの間隔のモデル(Google アナリティクス)

Google アナリティクスではセッションの間隔(daysSinceLastSession)という指標を見ることができる.これはサイトに訪れたユーザーの直前のセッションが何日前だったのかを示すものだ.ご覧の通り非常にゼロの多いデータで, しかもロングテールなので, これを…

Google アナリティクスのインタレストカテゴリを平行座標プロットで再クラスタリング

インタレストカテゴリとは Google ではオンラインでの活動や購買行動からユーザーの興味・関心を推測して、ユーザーを分類しています。この分類は「インタレストカテゴリ」と呼ばれています。Google アナリティクスでは、インタレストカテゴリには「アフィニ…

(R+Google アナリティクス)エラーバーで信頼下限をプロット

場面設定 当サイトは女性の訪問者が少ないので、女性の訪問者を増やしたいと思っている。サイト作りの参考にしようと女性の新規訪問の割合が多いランディングページをリストアップしたい。そこで新規セッション率で降順にソートをかけると、セッション数10〜…

R {Nippon} パッケージのコロプレス図(塗り分け地図)に凡例をつける

全国最低賃金 地域別最低賃金の全国一覧 |厚生労働省 の表をプロットしてみる.カラーパレットには RColorBrewer パッケージを使います. library(rvest) library(dplyr) url1 <-"http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/koyou_roudou/roudoukijun/…

負の二項分布を用いたリピート回数のモデル(Google アナリティクス)

序 負の二項分布は「試行が n 回成功するまでに失敗した回数 x の分布」として知られている( 負の二項分布 | r回の成功を得るのに必要な試行回数 )一方で, ポアソン分布のパラメータ λ がガンマ分布するような分布でもある( 可視化で理解する「負の二項分…

ゼロ切断ポアソン分布によるセッション数のモデル化とデータ拡大による潜在利用者数の推定

序 ゼロ切断ポアソン分布によるセッション数のモデル - 廿TT ではウェブサイトのセッション数をゼロ切断ポアソン分布としてモデル化し、ウェブサイトにアクセスしなかった人も含めた潜在的な利用者数 N を推定しようとした。しかし日によって N の推定値が大…

ゼロ切断ポアソン分布によるセッション数のモデル

あるウェブサイトの利用者が全部で N 人いるとして、N 人がある一定時間内に 回そのウェブサイトを利用するとします。一定時間内に一回以上サイトを訪れた利用者の数を n とすると、 n に相当するのがユーザー数です。一定時間内にサイトを訪れるユーザーの…

時系列で見て安定している KPI の探し方

要約 見よう見まねでぼくのブログの KPI を策定してみた。 折れ線グラフでスパイクをチェック 変動係数で散らばりをチェック 箱ひげ図で曜日効果をチェック 良き KPI とは KPI は時系列で見て安定していることが求められる。tokoroten 氏は KPI を乱高下させ…

Alluvial diagram で Google アナリティクスのデータをプロットして遊ぼう

Alluvial diagram(アルビアルダイアグラム)をかんたんにプロットできる ggalluvial パッケージが、Rで解析:Alluvial diagramsをプロットしませんか「ggalluvial」パッケージ で紹介されていた。これを使ってみようと思う。 入口ページと出口ページ まずは…

googleAnalyticsR の使い方(Version:0.1.0)

V4 API の概要 Google Analytics Core Reporting API V4 では以下のような機能が追加されました。 データの範囲を 2 つ指定できるようになった。 指標を四則演算して新たな指標を作り出すことができるようになった。 コホートレポートが扱えるようになった。…

Google アナリティクスデータから指標を偏差値化して記事を評価

偏差値好きな人多い印象あるけどぼくはあんまり好きじゃなかった。でもなんとなく Google アナリティクスデータで偏差値出してみたら、これはこれでけっこういいかも、と思った。次元(単位)のない量にして、複数の指標どうしを概観的に比較できる。セッシ…

新規率と直帰率の関係からランディングページの改善点を探る

はじめに [対談]SEO 辻正浩氏×アクセス解析 小川卓氏:検索キーワードが見えない時代のSEOとは? | Web担当者Forum で紹介されていた 検索結果における各ページのクリック数と掲載順位の関係をグラフにすると1つの曲線に集約される。曲線から大きく外れた…

Google アナリティクスデータの変化を検知するための CUSUM 管理図

問題 例えばソーシャルメディアで炎上してたりしたらサイトの訪問(セッション)数は伸びるだろう。セッション数を定点観測していればなんらかの異常があったときにすぐに対処できる……はずだ。Googleアナリティクスオタクの私が、毎日見ているたった1つのレ…

(R + Google アナリティクス)継続率を計算してみる

継続率にはいろんな定義がありえる。ここで計算するのは「ある日に初回訪問したユーザーのうち、x日以内に再訪問したユーザーの割合」のこと。Google アナリティクスのディメンション、sessionCount で訪問の回数がわかる。daysSinceLastSession で前回訪問…

状態空間モデルで自然検索トラフィックの成長を予測する

場面設定 コンテンツを増やせばそれだけ自然検索にヒットするページが増え、ウェブサイトのトラフィックは増加します。向こう一年間これだけ記事を書くぞ、というのが決まっていたとして、その計画から自然検索経由の訪問(セッション)数を予測できるでしょ…

(R + Google アナリティクス)ランディングページの集客力推移のヒートマップ

多くの訪問を集める主要ページにはこういう施策、テールの部分を支える裾野ページにはこういう施策、といった具合に、ランディングページを層別にして対策を立てる場合を考えます。このとき、訪問(セッション)数全体の推移を見ただけでは、どの層がどう変…

ggplot2 で Google アナリティクスデータの人口ピラミッド

下表のデータを人口ピラミッドの形で描いてみる。(もうちょっときれいに描ける人いそう。ご意見求む。) usergender userage bracket users female 18-24 628 female 25-34 1001 female 35-44 416 female 45-54 174 female 55-64 85 female 65+ 40 male 18-…

(R + Google アナリティクス)2014年人気だった記事の集客力はどのくらい目減りしたか

前置き コンテンツをつくるのはお金や手間がかかるので、ひとつひとつの記事が集客力を維持してくれるとうれしい。そこで2014年のセッション数トップ10の記事が、2015年にはどのくらいセッション数があったか集計してみる。集計には RGA パッケージを使う。R…

RGoogleAnalytics の使い方(Version 0.1.1)

R から API で Google アナリティクスのデータを引っ張ってくるパッケージ、RGoogleAnalytics を使えるようにするまでのメモです。パッケージのインストールは install.packages("RGoogleAnalytics") でいけます。まずは https://console.developers.google.…

(R + Google アナリティクス)ピボットテーブル感覚で探索的アクセス解析

課題設定 「当サイトでは、セッションは増加傾向にあるものの、リピーターが若干伸び悩み、ユーザーの定着に課題を感じている」ということにします。この課題をより具体的に把握するために、品質管理の七つ道具の一つ、層別を使います。 層別(スライシング…

(R + Google アナリティクス)スパークラインからはじめる探索的アクセス解析

はじめに 多くのWeb解析担当者という人たちは日々なにをやっているのでしょうか。おそらくみんな「注目すべき事象」と「その原因」を探しています。こういうとむずかしく感じるかもしれませんが、分解していくとその作業は単純です。「注目すべき事象」と「…

(R+Google アナリティクス)オッズ比で属性の影響を調べる

問 Google アナリティクスの管理画面を見ていたら、男性のセッションにくらべて、女性のセッションがだいぶ少ないことに気づきました。これは「このサイトが女性に認知されていない」ということでしょうか? それとも「女性が関心を持ちやすいような話題が、…

(R + Google アナリティクス)コーホート比較でユーザーの定着具合を測る

バズやキャンペーンの効果を測る 過去何回か記事がバズったことがある。このブログはごく個人的なものだが、仮にメディアを運営しているつもりになって考えるとすると、バズをきっかけにユーザーが定着してくれることが望ましい。そこでユーザーの再訪傾向を…

(R+Google アナリティクス)コロプレス図(塗り分け地図)

コロプレス図(塗り分け地図) R で地図上にデータを表示する方法はいろいろある。でもシェープファイルを用意しなきゃいけなかったりするのがめんどくさい。そんなときは choroplethr パッケージを使うのが楽でいいと思った。Google アナリティクスでは(た…

(R+Google アナリティクス)曜日・時間帯別セッション数のヒートマップ

(R+Google アナリティクス)日付・時間帯別セッション数のヒートマップ - 廿TT(R+Google アナリティクス)日付・時間帯別セッション数のヒートマップ - 廿TT の続きです。(R+Google アナリティクス)日付・時間帯別セッション数のヒートマップ - 廿TT で…

(R+Google アナリティクス)日付・時間帯別セッション数のヒートマップ

はじめに Google アナリティクスの iOS 向け公式アプリでは下図のようなヒートマップ(色付きテーブル)を見ることができる。きれいな図だがセグメント(層別)がしづらい。例えば、ソーシャル経由でサイトに訪問する場合とその他ではアクセスが集中しやすい…

(R + Google アナリティクス)何ページ目でセッションから離脱するか。ファンネルグラフによる可視化。

ファンネルグラフ ユーザーの回遊傾向を見る際、Webアクセス解析の分野では直帰率が低く抑えられているかチェックすることが多いようです。直帰率という指標は、もともとのデータを「直帰」「直帰でない」という情報に要約したものです。実際には「直帰」、…

(R + Google アナリティクス)何ページ目でセッションから離脱するか。残存率の可視化。

生存曲線による残存率の可視化 ランディングページ(LP)を評価する際は、直帰率が低く抑えられているかをチェックすることがよく行われます。Google アナリティクスの管理画面から LP ごとの直帰率を見てみます。 http://abrahamcow.hatenablog.com/entry/2…

(R + Google アナリティクス)ウォーターフォールチャート

ウォーターフォールチャート ウォーターフォールチャート(滝グラフ)を描く関数を書きました。ダウンロードしてご利用ください。ウォーターフォールチャートの見方、使い方は N's spirit ファクター分析とは 等を参考にしてください。 実践編 当ブログでは…

Google アナリティクスの「コンバージョン経路」レポートより始点と終点の図示(R でアトリビューション分析 2)

この記事の記述は若干古く、コードもあまりきれいじゃないので、abrahamcow.hatenablog.comのほうをご覧ください。 目的 Google アナリティクスの「コンバージョン経路のレポート」からはこんな感じのレポートが見れます。 MCF チャネル グループの経路 コン…

(R + Google アナリティクス)バルーンプロットの例。年齢層別デバイス使用状況。

バルーンプロットの紹介 下表はぼくの Google アナリティクスアカウントから持ってきたデータです。 deviceCategory userAgeBracket sessions desktop 18-24 1575 desktop 25-34 4787 desktop 35-44 2157 desktop 45-54 561 desktop 55-64 233 desktop 65+ 1…

(R + Google アナリティクス)パラレルチャート、レーダーチャート

レーダーチャート おそらく、レーダーチャート(風配図、スパイダープロットなどともいう)は何度かご覧になったことがあるでしょう。最大値を 1、最小値を 0 に標準化し、ある「切り口」で線を塗り分けることで、複数の指標を並べて集団の特徴を表せます。…

R でアトリビューション分析。Google アナリティクスの「コンバージョン経路」レポートを視覚化。

アトリビューション分析とは バズワードです。明確な定義はありません。広告の直接効果だけでなく、間接的な効果も含めて分析しようみたいな意味です。 コンバージョン経路 Google アナリティクスの管理画面を開いて「コンバージョン」→「マルチチャネル」→…

(R + Google アナリティクス)バブルチャートの書き方+マトリクス分析の注意点

バブルチャートの書き方 個人的にはあまり思い入れのない可視化なのですが、Google アナリティクス関連のエントリを書いているうちに、代表的な統計グラフは網羅してやろうという気分になって来たので、バブルプロットの書き方を簡単に紹介します。下図は各…

(R + Google アナリティクス)層別箱ひげ図、ストリップチャート、バイオリンプロットで訪問時のページビュー数を視覚化

状況設定 Googl アナリティクスでなんらかの「層別」に「サイトへの関心度合い」の指標を見たいときに使えそうな可視化を紹介します。今回は「チャネル(訪問経路)ごと」に「訪問時のベージビュー数」を見ることにします。 データ取得 RGoogleAnalytics で…

(R + Google アナリティクス)モザイクプロットでユーザーの構成比を把握

モザイクプロットの紹介 モザイクプロットはクロス集計表を図示するための統計グラフです。例えば2015年1月にこのブログにアクセスしたユーザーを、年代、性別ごとにクロス集計すると下表のようになります。 18-24 25-34 35-44 45-54 55-64 65+ female 292 4…

(R + Google アナリティクス)期間比較して特に増減の大きいトラフィックソースを図示する

状況設定 2015年1月に前月比でセッション(訪問数)が増加した。 そして「なんで増加したのか簡単に報告して」と依頼された。 こういうときに役立ちそうな可視化を紹介します。 RGoogleAnalytics でデータ取得 詳しくは、 RGoogleAnalytics をいじっている -…

(R+Google アナリティクス)バズやキャンペーンの事後の効果を図示する

目的 Webサイトへの訪問数を増やしたいとき、新しいコンテンツを作ったり、広告を打ったりすることがある。そういう場合、キャンペーンやコンテンツ施策が一時のアクセス増加にとどまらず、波及効果を生んでくれることが望ましい。その波及効果をなるべくシ…

ソーシャルバズマーケティングの後、傾向線(トレンド)が変わっているか。

追記 この記事に興味をもたれた方は、先に (R+Google アナリティクス)バズやキャンペーンの事後の効果を図示する - 廿TT (R+Google アナリティクス)バズやキャンペーンの事後の効果を図示する - 廿TT をご覧ください。こちらのほうが主張も R のコードも…

ブランド指名系検索キーワードの構成比を図示(R + Google アナリティクス)

はじめに 以前にこんなの、 マーケットバスケット分析による検索キーワードのグルーピングと視覚化 - 廿TT やったけど、検索キーワードの可視化に関しては、形態素解析とか〇〇分析とかよりも地道に文字列マッチングで処理したほうが有益な気がしなくもない…

RGoogleAnalytics の "yearMonth" と "date" を日付オブジェクトにかえる関数

動機(Motivation) RGoogleAnalytics で引っ張ってきた "yearMonth"(年月)と "date"(日付)は、 > head(datYM) yearMonth sessions 1 201310 182 2 201311 379 3 201312 759 4 201401 6250 5 201402 1847 6 201403 2232 > head(datDate) date sessions 1…

[SEO]目標ページビュー数に達するまでに必要な記事の数を Google ウェブマスターツールのインデックスステータスから計算してみる

はじめに このブログは個人のものですが、「廿TT」というメディアを運営しているつもりになってみます。当サイトの場合、集客を安定的に成長させることが可能なのは、自然検索トラフィックだと考えました。(RGoogleAnalytics で変化の要因を読みとく(変化…

R から API で Google アナリティクスのデータを読むこめるパッケージ, RGoogleAnalytics のクエリ作成方法

はじめに RGoogleAnalytics の使用方法は以下の4ステップに分割できる. ステップ1:パッケージのインストール ステップ2:オーサライズ ステップ3:クエリの作成 ステップ4:データ取得 「ステップ1:パッケージのインストール」は, install.packages("RGoog…

RGoogleAnalytics で変化の要因を読みとく(変化量と寄与率のグラフ+散布図)

変化量と寄与率のグラフ (折れ線付き積み上げ棒グラフ) R + Google アナリティクス日記、いろいろ書いたけど、 Google アナリティクス カテゴリーの記事一覧 - 廿TT いまにして思えば、いちばん最初にやるべきはこれだった。セッション(訪問数)全体の推…

M1F1なんてもう古い?! インターネットマーケティングで狙うべきユーザー層はここだった。

序文 M1とかF1とか、なんなのか意味わかってない。 M1層.M2層.M3層.F1層.F2層.F3層.C層.T層について(M1層とは、F1層とは) | ホームページ制作・ホームページファースト Google アナリティクス(ユニバーサルアナリティクス)で年齢や性別のデータが取れる…

Google アナリティクスデータKPI設計のための可視化。散布図行列で定点観測するエンゲージメント指標を絞り込む。

目的 Webアクセス解析データの可視化を以下の二つに大別するとすると、 定点観測型:重要な指標の傾向を整理して把握する 課題発見型:データをある側面から眺めて新たな仮説を立てる 今回やろうとしているのは前者です。 エンゲージメント指標 Webアクセス…