廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

グラフ

打ち切りデータを扱うために前に書いた R の関数群をパッケージ化しました

R の自分用の関数がごちゃごちゃしてきたのでパッケージ化して整理しようとしているのです。tidysurv とかいう恐れ多い名前をつけてしまった……。GitHub - abikoushi/tidysurv: R package for censored data handlingまだ作りかけです。dplyr、ggplot2 と sur…

ggplot2 のためのいくつかの関数をパッケージ化しました

まだ説明とかぜんぜん書いてない。GitHub - abikoushi/ggsomestat: Some stat in ggplot2インストールは devtools::install_github("abikoushi/ggsomestat") で、たぶんいけます。練習用にsearchConsoleというsearchConsoleからとってきたデータが入ってます…

ggplot2 でミニ棒グラフ行列を描画する geom_barmatrix を書きました

library(tidyverse) geom_barmatrix <- function(mapping = NULL, data = NULL, stat = "identity",position ="identity", ..., width = NULL, binwidth = NULL, na.rm = FALSE, show.legend = NA, inherit.aes = TRUE) { layer( data = data, mapping = map…

TikzのBayesNetライブラリでプレート表現を書いてみる

プレート表現については、たしか『実践 ベイズモデリング 』などに解説がある。実践 ベイズモデリング -解析技法と認知モデル-作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2017/01/25メディア: 単行本(ソフトカバー)この商品を含むブログ (2件) を見…

目で見る尤度関数(『ベイズ統計の理論と方法』より)

『ベイズ統計の理論と方法』1.4節の例を R でやってみます。ベイズ統計の理論と方法作者: 渡辺澄夫出版社/メーカー: コロナ社発売日: 2012/03/01メディア: 単行本購入: 1人 クリック: 4回この商品を含むブログ (8件) を見る尤度関数が正規分布で近似できると…

Rcpp: カーネル密度推定のバンド幅を一個抜き交差検証法で決める

バンド幅 h をいろいろ変えて一個抜き交差検証法で評価した対数尤度が結構なめらかな形になったのでブレント法で最適なバンド幅を選んでみた。対象としたデータはこれ。h をいろいろ変えて一個抜き交差検証法で評価した対数尤度のプロットはこちら。選ばれた…

[googleAnalyticsR]調整済みオッズ比の四半期比較プロット

とりあえず図とコードだけ貼ります。縦の棒はオッズ比の95%信頼区間です。 library(googleAnalyticsR) library(tidyverse) library(lubridate) ##### ga_auth() account_list <- ga_account_list() ga_id <- account_list$viewId[3] gadata <- google_analyt…

精神疾患の軽症化

精神疾患の軽症化が進んでいる。統合失調症の新規発症が激減し、入院を要するレベルの気分障害がほとんどいなくなり、病棟経営の支えである慢性の統合失調症患者は急速に高齢化が進んでいる。地域移行を進めるまでもなく精神科病床数は今後10年で確実に激減…

色付きミニ棒グラフ(searchConsoleR)

色付き棒グラフ行列(ggplot2) - 廿TT で書いた theme_spark でもうちょっとあそんでみる。 theme_spark <- function (base_size = 11, base_family = "") { theme_grey(base_size = base_size, base_family = base_family) %+replace% theme(panel.backgro…

色付き棒グラフ行列(ggplot2)

『StanとRでベイズ統計モデリング』12章のデータを使いますStanとRでベイズ統計モデリング (Wonderful R)作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行本この商品を含むブログ (9件) を見るGitHub - MatsuuraKentaro…

[R+Google アナリティクス]リセンシーどこで切るチャート

アクセス解析の分野ではユーザーの離脱率や維持率を把握したいというニーズがあります。しかし、離脱するユーザーは単にサイトへの訪問を止めるだけで、わざわざ離脱を申告することはめったにありません。このような場合、例えば 「3ヶ月訪問がなければ離脱…

Rによる打ち切りデータのヒストグラム (ggplot2)

追記:一応パッケージ化しました。 abrahamcow.hatenablog.com 生存関数のプロットは便利だけど密度関数のプロットと比べると分布の形状を把握しにくい。そこで打ち切りデータのヒストグラムというのが提案されている(Huzurbazar, A. V. (2005). A Censored…

Rによる打ち切りデータの箱ひげ図

右打ち切りのあるデータを視覚化するのにはカプラン・マイヤープロットが便利です。しかし層の数が多くなると判例と見比べるのが大変になる。そこである程度情報を落としてプロットしてもいいかなと思い、打ち切りデータの箱ひげ図を提案にします。make_q_df…

スパークライン風のカプランマイヤープロット

層分けが多くなると凡例と見比べるのが大変なのでなんとかしたいと思った。普通にプロットする。はい。スパークライン風にプロットするとこんな感じかなあ。累積イベント発生率が25%に達する点、50%に達する点、75%に達する点に赤っぽい丸、最後のイベント発…

[googleAnalyticsR]再発事象のカプラン・マイヤープロット

survrec っていうパッケージもあるらしいけど慣れてないので survival を使います。どのチャネルが再来訪しやすいのか、何日くらいの間隔で何パーセントくらい戻ってくるのかがわかります。 library(googleAnalyticsR) library(tidyverse) library(survival)…

R でアクションペインティング

R でジャクソン・ポロックっぽい絵を作る関数を公開しました。JacksonPollock.R · GitHub source("https://gist.githubusercontent.com/abikoushi/2e9bcb28f13fdc299065e82a66c6b5f5/raw/f4989f55f9c0b453410c9db5fcd13ec4df5a45c5/JacksonPollock.R") Jacks…

よく状態空間モデルの説明で出てくる図を tikz で書く

¥documentclass[dvipdfmx]{standalone} ¥usepackage{tikz} ¥usetikzlibrary{shapes, positioning,arrows,automata} ¥begin{document} ¥begin{tikzpicture}[->, auto,thick] ¥node[state, fill=gray, text=white] (a1) {$¥alpha_1$}; ¥node[state, fill=gray,…

[searchConsoleR]CUSUM管理図で掲載順位の変化点を半自動検出

Search Console ではページごとの平均掲載順位(position)のデータが取れるけど、順位の変動を見張るのは大変である。そこでCUSUM管理図の考え方を使って、変化点の検出を半自動化してやろう。CUSUM管理図については Google アナリティクスデータの変化を検…

Google アナリティクス:マルチチャネルレポートの図示(アトリビューション分析)

googleAnalyticsR を使ってコンバージョン経路レポートを集計する関数を書いた。pathanal.R · GitHub内部で dplyr を使っています。アトリビューション分析というのは明確な定義のある用語ではないと思うけど、直接コンバージョンのあったセッションだけでな…

ggplot2 で内訳を左から右に詳細化していく棒グラフ

ggplot2 でラザニアプロット(ある値以上の値を合算したヒートマップ) - 廿TT に引き続き、新しい geom を作ってみたくて geom_drilldown.R · GitHub を書きました。ggplot2 で内訳を左から右に詳細化していく棒グラフ(ツリーマップ?)です。{googleAnaly…

ggplot2 でラザニアプロット(ある値以上の値を合算したヒートマップ)

geom_lasagna.R · GitHub を書きました。ラザニアプロットというのは要は時系列データについてのヒートマップ(色付きテーブル)です(ラザニアプロット(fields パッケージの image.plot にちょっと一工夫) - 廿TT)。さて、Web 解析の分野ではよく「エン…

ggplot2 で二項分布の成功確率パラメータの信頼区間

ggplot2 で移動平均(stat_ma) - 廿TT に引き続き、二項分布のパラメータの信頼区間を描画する stat_binomCI を書いた。stat_binomCI.R · GitHubGoogle アナリティクスのデータで試してみる。例1:ランディングページごとの直帰率の比較はこんな感じ。 lib…

ggplot2 で移動平均(stat_ma)

Extending ggplot2 (Extending ggplot2(和訳) - Qiita)を読んで自分でも新しい stat を作ってみたくなったので、手始めに練習として移動平均を描画する関数 stat_ma を書いてみました。stat_ma.R · GitHub library(ggplot2) source("https://gist.github…

{googleAnalyticsR} {ggplot2} 何秒でユーザが離脱したか、残存率の図示

直帰率や平均滞在時間よりも詳しくエンゲージメントを把握したい場合、次の図がおすすめです。何秒目に何パーセントのセッションが継続しているかを知ることができます。ここでは新規訪問とリピーター訪問で層別していますが、ランディングページや流入経路…

{googleAnalyticsR} {ggplot2} Crossbar plot で滞在時間の分布を比べる

Crossbar plot は次のような図です。これがなにを表すかは場合によります。今回は箱の上の辺にデータの75%点、真ん中の線に中央値、箱の下の辺に25%点を割り当てました。いわば退化した箱ひげ図です。次の図はあるランディングページを経由した訪問の、月ご…

{ggplot2} 集計済みデータのヴァイオリンプロット

データがこのようにすでに集計された状態で与えられたときに、複数カテゴリ間で分布を比較したい。 value A B 1 1 1 3 2 2 2 2 3 3 3 1 ヴァイオリンプロットが使えることがわかった。 library(cowplot) library(tidyr) data <- data.frame(value = 1:3, A =…

{googleAnalyticsR} {ggplot2} 内訳をドリルダウンしていく棒グラフ

ggplot2 で左から右に内訳をドリルダウンしていく棒グラフ(ツリーマップ?)を書きました。新規訪問で自然検索経由のデスクトップを利用している男性の25歳〜34歳のCVが多いことがわかります。ついで再訪問でソーシャル経由訪問のモバイルを利用している男…

R の treemapify パッケージで Google アナリティクスのデータをツリーマップに

ただパッケージ動かしてみたっていうだけなんですけど。インストール方法は GitHub - wilkox/treemapify: ggplot2 geoms for drawing treemaps に従ってください。ggplot の記法が使えて、facet とかできる点がいいと思いました。 #library(devtools) #inst…

R でシミュレーションする格子の上の SIR モデル

SIR モデルは感染症の流行過程のモデルで、詳しくは 感染症のモデル(SIRモデル)に入門した - 廿TT に書いた。あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識作者: 多田智史,石井一夫出版社/メーカー: 翔泳社発売日: 2016/12/17メデ…

Google アナリティクスとサーチコンソールのデータをマージして使う

統計ソフト R から Google アナリティクスのデータを引っぱってこれるパッケージ googleAnalyticsR の使い方は、 googleAnalyticsR の使い方(Version:0.1.0) - 廿TT にざっと書いた。サーチコンソールのデータを引っぱってこれるパッケージ searchConsoleR…