読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

失業と自殺は関係あるのか

男性に関して言えば、失業率と自殺率は強い相関を持つことが指摘されている。例えば データえっせい: 失業と自殺の時系列的相関 や『この経済政策が民主主義を救う』などを参照。この経済政策が民主主義を救う: 安倍政権に勝てる対案作者: 松尾匡出版社/メー…

エクセルで無相関検定:失業率と野菜摂取量の相関

町山智浩がアメリカでは貧しい人たちが野菜を食べれなくて困っているというような話をしていた。町山智浩 映画『Fed Up』が描くアメリカの飢餓・肥満問題を語る日本でもそういう現象があるだろうと思い、野菜摂取量と失業率の相関を調べてみた。使用したデー…

犯罪の検挙率のグラフ(モザイクプロット)

犯罪統計資料(統計表一覧 政府統計の総合窓口 GL08020103)によると、平成28年1~2月の検挙率は35.2%でした。過半数の犯罪は検挙されていません。しかしこの数字はシンプソンのパラドックスめいたところがあって、犯罪のうち、凶悪犯、粗暴犯、知能犯、風…

貸借対照表のグラフ(コロプラ)

特に理由はないけれど、コロプラの貸借対照表を図示してみた。貸借対照表 | 業績・財務 | IR情報 | 株式会社コロプラ library(readxl) dat_row <-read_excel("~/Downloads/colopl_financialdata_201512.xlsx",9,skip=1) tmp <-dat_row[,-c(1,3:4)] colnames(…

エクセルでドットプロット

ドットプロットをエクセルで作成する方法を紹介します。今回は 地域別最低賃金の全国一覧 |厚生労働省 のデータを例にとります。まず元データを入力。 まったく同じ行をもう一列作ります。 両方の列を選択して、「マーカー付き折れ線グラフ」を作成します。…

(R + Google アナリティクス)モザイクプロットでユーザーの構成比を把握

モザイクプロットの紹介 モザイクプロットはクロス集計表を図示するための統計グラフです。例えば2015年1月にこのブログにアクセスしたユーザーを、年代、性別ごとにクロス集計すると下表のようになります。 18-24 25-34 35-44 45-54 55-64 65+ female 292 4…

(R + Google アナリティクス)期間比較して特に増減の大きいトラフィックソースを図示する

状況設定 2015年1月に前月比でセッション(訪問数)が増加した。 そして「なんで増加したのか簡単に報告して」と依頼された。 こういうときに役立ちそうな可視化を紹介します。 RGoogleAnalytics でデータ取得 詳しくは、 RGoogleAnalytics をいじっている -…

リスティング広告出稿用のキーワード掛け合わせを R でかんたんに作れる関数を書いた

はじめに このエントリは実務マーケターの方に統計ソフト R を使ってもらう目的で書きました。マーケジンでも R に関する連載やってたし(実践!WebマーケターのためのR入門一覧:MarkeZine(マーケジン))、エンジニアとかアナリストとかじゃないふつうのW…

折れ線グラフに矢印を加える――利用と誤用

折れ線グラフ矢印問題 このような折れ線グラフがあったとします。このデータはエクセルの RAND 関数で作った乱数です。傾向を強調して分かりやすく見せたいがために、折れ線グラフに矢印を加えてプレゼンテーション、ドキュメンテーションを行うことがよくあ…

A/Bテスト、多変量テストに必要な期間を見積もる方法の紹介

大雑把な紹介 A/Bテスト、多変量テストと呼ばれるものはいろいろありますが、ここでは主にWeb広告のA/Bテスト、多変量テストの話をします。Web広告のA/Bテストでは、広告AとBを出し分けて、 クリック率=クリック数÷表示回数 コンバージョン率=コンバージョ…

指数近似、対数近似曲線の導出と近似曲線の選び方

導入 実務でデータの分析をやっている方、企業のマーケティングや Web 解析担当者の多くは R などの統計解析に特化したソフトウェアでなく、エクセルを使うことが多いだろう。この記事はそういう方に向けて、「統計モデル」というのがどういうものかを伝えた…

A/Bテスト、多変量テストのための「効果量」入門

本エントリの主張 A/Bテスト、多変量テストの施策判断のためには、 まず第一に棒グラフ 二番目にその信頼区間 必要に応じて、大まかな目安として「効果量」 を出すべきだ。あとこの文章は数学的な予備知識のない方にも読んで頂けるよう努力して書いてます。…

ロジックツリーにご用心。MECEから排反へ。

本記事の要約 コンサルティング業界でよく使われているロジックツリーはMECE(ミーシー)という語の定義が曖昧である。なので本記事では、ミーシーを高校数学 A で習う排反で代替する。あと最後にロジックツリーみたいな図を簡単に描画できる Graphviz とい…

3D円グラフとともに滅するべき棒グラフの省略表現

本稿の主張 棒グラフをかくときは、縦軸をつけ、原点を 0 にしましょう。あと、大学の先生の教育面での取り組みがもっと評価される世の中になって欲しいです。 はじめに:ちゃんと叱ってくれる先生は評価しよう 3D円グラフ ふと思い立って「3D円グラフ」で検…

ページビュー数の推移の集計など、単純作業に RGoogleAnalytics が便利

動機 これまで R + Google アナリティクス関連のエントリをいくつか書いてきた。 (Google アナリティクス - 廿TT を参照。)R は統計処理に特化した言語だが、もともとぼくが RGoogleAnalytics さわろうと思ったきっかけは、単に「Excel 苦手……。データ集計…

【ご提案】イノベーター理論の普及曲線とか捨てて、レベルレート図を使いましょう

代案を出せ ロジャースのイノベーター理論ってこれでいいの? - 廿TTぼくは ロジャースのイノベーター理論ってこれでいいの? - 廿TT で、ロジャースの『イノベーション普及学』で提示されたモデル(下図のようなやつ) は、根拠不明、ロジャース自身が自分…

Google アナリティクスの Page Depth を可視化 + KPI 割り算主義への懐疑

追記 本エントリを書いたときはまだ考えがまとまりきっていなかったので、主張にあいまいな部分があります。 この記事に興味を持たれたかたは下記の投稿を先にご覧になることをおすすめします。エンゲージメントを測る指標はエンゲージメント「率」だけじゃ…

原点がゼロでないグラフ、2軸のグラフ

前置き ここに書くことはすでに言い尽くされているような気がしますが、どうもなかなかご理解頂けていないようなので、改めてしつこく述べます。 経緯 下記のツイートを参照。なんだこりゃ。TV屋は相変わらずヘボなグラフ作ってんな・・・・原点がゼロじゃな…

A/Bテスト、多変量テストの図示(Excel 版)

データヴィジュアライゼーション via Excel A/Bテスト、多変量テストの図示 - 廿TT ↑このエントリのエクセル版です。 A/Bテスト、多変量テストの結果を可視化するエクセルシートを作りました。 よろしければ使ってください。→ http://zisatsu.web.fc2.com/mo…

Excel の近似曲線(指数近似・対数近似)

対数変換と一般化線形モデル - DTAL(旧RCEAL)留学記録 ↑この記事を見て思い出したこと。Excel の近似曲線は、「指数近似」が、 「対数近似」が、 を意味するようです。(a, c は回帰係数。ε は誤差項。詳しくは 対数変換と一般化線形モデル - DTAL(旧RCEA…

ぼくの考えたグラフ三原則

目次 Request for Comments(ご意見求む)の精神です。 良いグラフはフラットデザインである 良いグラフはものさしで測れる 良いグラフは色に頼りすぎない 1. 良いグラフはフラットデザインである ペンタッチの強弱はいらない 悪い例 https://www.facebook.c…