廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

Google アナリティクス

[SEO]目標ページビュー数に達するまでに必要な記事の数を Google ウェブマスターツールのインデックスステータスから計算してみる

はじめに このブログは個人のものですが、「廿TT」というメディアを運営しているつもりになってみます。当サイトの場合、集客を安定的に成長させることが可能なのは、自然検索トラフィックだと考えました。(RGoogleAnalytics で変化の要因を読みとく(変化…

R から API で Google アナリティクスのデータを読むこめるパッケージ, RGoogleAnalytics のクエリ作成方法

はじめに RGoogleAnalytics の使用方法は以下の4ステップに分割できる. ステップ1:パッケージのインストール ステップ2:オーサライズ ステップ3:クエリの作成 ステップ4:データ取得 「ステップ1:パッケージのインストール」は, install.packages("RGoog…

RGoogleAnalytics で変化の要因を読みとく(変化量と寄与率のグラフ+散布図)

変化量と寄与率のグラフ (折れ線付き積み上げ棒グラフ) R + Google アナリティクス日記、いろいろ書いたけど、 Google アナリティクス カテゴリーの記事一覧 - 廿TT いまにして思えば、いちばん最初にやるべきはこれだった。セッション(訪問数)全体の推…

M1F1なんてもう古い?! インターネットマーケティングで狙うべきユーザー層はここだった。

序文 M1とかF1とか、なんなのか意味わかってない。 M1層.M2層.M3層.F1層.F2層.F3層.C層.T層について(M1層とは、F1層とは) | ホームページ制作・ホームページファースト Google アナリティクス(ユニバーサルアナリティクス)で年齢や性別のデータが取れる…

Google アナリティクスデータKPI設計のための可視化。散布図行列で定点観測するエンゲージメント指標を絞り込む。

目的 Webアクセス解析データの可視化を以下の二つに大別するとすると、 定点観測型:重要な指標の傾向を整理して把握する 課題発見型:データをある側面から眺めて新たな仮説を立てる 今回やろうとしているのは前者です。 エンゲージメント指標 Webアクセス…

エンゲージメントを測る指標はエンゲージメント「率」だけじゃない。やみくもに割り算値をKPIにするのはよくない。

目的 Webアクセス解析データの可視化を以下の二つに大別するとすると、 定点観測型:重要な指標の傾向を整理して把握する 課題発見型:データをある側面から眺めて新たな仮説を立てる 今回やろうとしているのは前者です。KPI設計や定期レポーティングの参考…

直帰率と新規率の相関を調べて新規訪問者が回遊しやすいサイトになっているかチェックする

目的 Webアクセス解析データの可視化を以下の二つに大別するとすると、 定点観測型:重要な指標の傾向を整理して把握する 課題発見型:データをある側面から眺めて新たな仮説を立てる 今回やろうとしているのは後者です。直帰率や新規率(新規訪問の割合)は…

時系列データを可視化する折れ線グラフのピリオドの選び方、意外とむずかしい。

要旨 データを月次でみるか週次でみるか、というのは意外とむずかしい問題。時間の区切りを決めるのには、平滑化みたいな考え方が必要になる。 会計的な考え方と統計的な考え方は、折り合いをつけるのがむずかしい。でも必要だ。 家に帰るまでが遠足だし、稟…

広告クリエイティブ、ランディングページ、レコメンデーション等々についての雑感

本エントリの趣旨 ぼくはもともとインターネットとか好きで、以前ネット広告代理店に務めていて、Web解析とかやってた。それでいろいろ調べたりしてて気になったこととかあるので、ここで吐き出させていただく。統計的な考察とか評論とか、技術的ななにかと…

Web 解析データの平均滞在時間、本当は平均になっていないのでは?

本エントリの要約 Web 解析データの平均滞在時間は、「滞在時間÷訪問数」で計算される。でもこれは統計的な意味での「平均」(母平均の推定量)にはなっていない(気がする)。なぜなら Web 解析データの滞在時間は、「区間打ち切り」されたデータだからだ。…

ロングテールSEOのためのパレート図の紹介と RGoogleAnalytics による実践

モチベーション ロングテールSEOとは 検索エンジンからのサイトへの訪問数を増やしたい場合、みんながいっぱい検索してる人気のあるキーワード(ビッグワード)からのアクセス数を稼ぐのは競合とか多くて大変。それよりも、ニッチなキーワード(複合キーワー…

Google アナリティクスよりデバイス別訪問推移(ggplot2 日付−時間スケール)

プロット 昼間はデスクトップからのアクセスが多くて、夜はモバイル&タブレットが多いとか、そういう傾向が見つかったらおもしろいかな、と思ったけど、特にそういうのはなかったです。当ブログはトラフィック自体が多くないので、もうちょっと大規模なサイ…

ggmap パッケージで Google アナリティクスのデータを地図上にプロット

統計地図 このエントリは直接なにかの役に立ちますっていうものではなく、やってみた感が強い。Google アナリティクスでは IP アドレスから地理情報を取っているので、とりあえずプロットしてみた。まずは RGoogleAnalytics でデータ取得。 library("RGoogle…

Google アナリティクスデータのレポーティングを R で自動化しよう(ランディングページと検索キーワード)

はじめに これまで、R を活用したGoogle アナリティクスデータの可視化をいろいろと紹介してきました。Google アナリティクス カテゴリーの記事一覧 - 廿TTこのブログはたぶん統計屋とかエンジニアよりの人しか読んでいないんじゃないかと思いますが、本エン…

RGoogleAnalytics + ggplot2 による箱ひげ図とカレンダープロット

前置き これまで、アクセス解析の時系列データを表すための各種グラフを紹介してきました。 RGoogleAnalytics でとりあえず折れ線グラフ - 廿TT RGoogleAnalytics で変化の要因を読みとく(折れ線グラフ、帯グラフ、積み上げ棒グラフ) - 廿TT RGoogleAnalyt…

マーケットバスケット分析による検索キーワードのグルーピングと視覚化

検索キーワードを分類して整理したい Google アナリティクスの検索キーワードレポート、そのまま全部見るのは大変なので、なんらかの方法で要約したい。 セッション上位10件を見ると、「割れ窓理論」系のワードと「cd 収納術」系のワードに分けられそうな感…

Google アナリティクスのデータをツリーマップで可視化してユーザーをターゲティング

ツリーマップの紹介 R の treemap パッケージを使えば、かんたんにツリーマップを作成できます。 やってみましょう。まずは RGoogleAnalytics でデータを取得。 (RGoogleAnalytics をいじっている - 廿TT 参照) library(RGoogleAnalytics) query <- QueryB…

アクセス解析データと「誤差の範囲」(エラーバー付き棒グラフ)

95%信頼区間のエラーバー付き棒グラフ 当然ですが Web サイトへのアクセス数は増えたり減ったりします。なぜ増えたり減ったりしたのか、それを明らかにするのが Web 解析の目的の一つですが、偶然増えたり減ったりすることもあり得ます。どの程度の増減だっ…

ページビュー数の推移の集計など、単純作業に RGoogleAnalytics が便利

動機 これまで R + Google アナリティクス関連のエントリをいくつか書いてきた。 (Google アナリティクス - 廿TT を参照。)R は統計処理に特化した言語だが、もともとぼくが RGoogleAnalytics さわろうと思ったきっかけは、単に「Excel 苦手……。データ集計…

CVR、新規率、直帰率と「誤差の範囲」(信頼区間付き折れ線グラフ)

追記:関数化しました。abrahamcow.hatenablog.com 分母が違う場合の「割合」の比較 Web 解析の分野ではしばしば、なにかをなにかで割った値、「割合」を定期的に観察することが行われます。なかでもよく使われる指標は CVR(コンバージョンレート)、直帰率…

Google アナリティクスのページビュー数、セッション数、ユニークユーザー数を面グラフでまとめてプロット

アクセスの多さの指標 Google アナリティクスで見れる「アクセスの多さ」の指標の代表は、下記 3 つです。 pageviews(ページビュー数) visits (セッション、訪問数) visitors(ユニークユーザー数、ユーザー数、訪問者数) Google アナリティクスでは、2 …

RGoogleAnalytics で変化の要因を読みとく(変化率と寄与度のグラフ)

変化率と寄与度 下の図は当ブログのセッション(訪問数)の月次推移です。 GDP をみるときなどは GDP そのものでなく、GDP の成長率に注目したりします。アクセス解析の分野でも、目標を立てて指標を定期的にするときなどには変化率(増加率、成長率)に着目…

エノキタケみたいな棒グラフで Google アナリティクスランディングページ簡易レポート

RGoogleAnalytics でデータ取得、ggplot2 でプロット R のコード ランディングページ(LP)ごとの訪問数、ページビュー数、新規訪問数、滞在時間、直帰数、コンバージョン数をまとめて図示します。はじめに API でデータを取得します。 library("RGoogleAnal…

RGoogleAnalytics + gvisSankey でユーザーフローのインタラクティブなグラフ

ユーザーのフロー Google アナリティクスの『ユーザーのフロー』レポートでは、ページ遷移をインタラクティブに見ることができます。 こういう図をサンキーチャート(サンキーダイアグラム)と呼びます。サンキーダイアグラムはページ遷移の可視化に適した表…

Google アナリティクスの Page Depth を可視化 + KPI 割り算主義への懐疑

追記 本エントリを書いたときはまだ考えがまとまりきっていなかったので、主張にあいまいな部分があります。 この記事に興味を持たれたかたは下記の投稿を先にご覧になることをおすすめします。エンゲージメントを測る指標はエンゲージメント「率」だけじゃ…

Google アナリティクスの「リピートの回数や間隔」からユーザーの分布をヒートマップに

ヒートマップ(色付きテーブル)について ヒートマップ, 見た目はきれいだけどグラフとしての表現力は弱いと思っていた. 数値を位置や長さで表す折れ線グラフや棒グラフにくらべると, 数値を色の濃淡で表すヒートマップは, ぼんやりした感じだ.でも, ヒート…

RGoogleAnalytics で RFM 指標のヒストグラム

RFM 分析とは マーケティングの分野ではしばしば、 R(recency;リセンシー)直近の購買からの経過時間 F(frequency;フリクエンシー)観測期間中の購買回数 M(monetary;マネタリー)累計または平均購買金額 の 3 指標を見て優良顧客を識別することがある…

RGoogleAnalytics で変化の要因を読みとく(折れ線グラフ、帯グラフ、積み上げ棒グラフ)

折れ線グラフ 「変化の要因を読みとく」とか、つい大げさなタイトルをつけてしまったが、単に折れ線グラフと帯グラフ、積み上げ棒グラフの話。経時的な変化を見るには折れ線グラフがいい。折れ線グラフの書き方は以前にも書いた。 RGoogleAnalytics でとりあ…

RGoogleAnalytics でとりあえず折れ線グラフ

セットアップ、アカウントのオーサライズは下の記事を参照。 RGoogleAnalytics をいじっている - 廿TT # Loading the RGoogleAnalytics library library("RGoogleAnalytics") # 1. Authorize your account and paste the accesstoken query <- QueryBuilder(…

RGoogleAnalytics をいじっている

注意 下記情報は古くなってきたので、RGoogleAnalytics の使い方(Version 0.1.1) - 廿TTをご覧ください。 RGoogleAnalytics とは R から API で Google アナリティクスのデータをひっぱってこれるパッケージ。 やったこと 依存パッケージを先にインストー…

A/Bテスト、多変量テストの図示

追記 この文章はいろいろ話がまじっていて読みにくくなってしまっているようです。こちらのほうがわかりやすいかもしれません→A/Bテストをくり返すために知っておきたい標本の大きさと多重比較の話 - 廿TT下記のようなコメントを頂きました。 ryownet ABテス…

A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む)

本記事の編集方針 ※この記事に興味をもたれた方は、 A/Bテスト カテゴリーの記事一覧 - 廿TT も、必要に応じてご覧いただければと思います。本記事はもともとは、「A/Bテストの数理」への批判:「有意」とはなにか の続き的なエントリでした。しかし、予想外…

"(not provided)" を考慮した検索キーワードごとの訪問数の推定

Google アナリティクスから検索キーワードのデータをとってくると、" (not provided) " というのが入ってる。 これは「検索キーワードが取得できませんでした」という意味なので他のキーワードと同じ扱いはできない。 かといって取り除いてしまうのも(場合…

ブートストラップまがいの方法による "(not provided)" の推定

前回、前々回と Google アナリティクスから検索キーワードのデータをとってきたけど、" (not provided) " をスルーしていた。これは「検索キーワードが取得できませんでした」という意味なので他のキーワードと同じ扱いはできない。 かといって取り除いてし…

R による検索キーワードのネットワーク分析

(追記 10/31)この記事はあまりおもしろくないのでよろしければ マーケットバスケット分析による検索キーワードのグルーピングと視覚化 - 廿TT をご覧ください。 前回と同じデータを使ってネットワーク分析。訪問回数が 2 以上の語句だけを使った。検索キー…

R による検索キーワードのアソシエーション分析

(追記 10/31)この記事はあまりおもしろくないのでよろしければ マーケットバスケット分析による検索キーワードのグルーピングと視覚化 - 廿TT をご覧ください。 対象サイト:http://aaaaushisan.blogspot.jp/ 期間:2013年05月26日〜06月26日 対象データ:…

ゴール1

グーグルアナリティクスの目標URLをここにする。