廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

ロジャースのイノベーター理論ってこれでいいの?

イノベーター理論とは

マーケティング界隈でイノベーター理論というのがある。

こんな風だ。

  1. イノベーター(Innovators:革新者):冒険心にあふれ、新しいものを進んで採用する人。市場全体の2.5%。
  2. アーリーアダプター(Early Adopters:初期採用者):流行に敏感で、情報収集を自ら行い、判断する人。他の消費層への影響力が大きく、オピニオンリーダーとも呼ばれる。市場全体の13.5%。
  3. アーリーマジョリティ(Early Majority:前期追随者):比較的慎重派な人。平均より早くに新しいものを取り入れる。ブリッジピープルとも呼ばれる。市場全体の34.0%。
  4. レイトマジョリティ(Late Majority:後期追随者):比較的懐疑的な人。周囲の大多数が試している場面を見てから同じ選択をする。フォロワーズとも呼ばれる。市場全体の34.0%。
  5. ラガード(Laggards:遅滞者):最も保守的な人。流行や世の中の動きに関心が薄い。イノベーションが伝統になるまで採用しない。伝統主義者とも訳される。市場全体の16.0%。
マーケティング用語集 イノベーター理論 - J-marketing.net produced by JMR生活総合研究所

これってどういう根拠で分類されてるんだろう、と思って原典の『イノベーション普及学』を図書館で借りて来たんだけど……

イノベーション普及学

イノベーション普及学

えっこれでいいの? と思った。

納得できない点 1

上記のイノベーターとかアーリーアダプターとかは、正規分布標準偏差を元に分類されている。

f:id:abrahamcow:20140814021746j:plain
(『イノベーション普及学』p.356より)

ロジャースは、

心理学の研究から次のようなこと明らかになっている。すなわち、人は学習過程を通して、新しい技術や知識、事実を学ぶのだが、この過程を時間の経過に従って図示すると、結果は正規分布曲線となるのだ。(中略)試行(トライ)するごとに学習される量は、次の事柄に比例する。(1) すでに学習された量。(2) 学習限界に達する前に、未学習のまま残されたものの量。

と述べる(pp.351-352)が、なぜそこで正規分布が出てくるの……?

「(1) すでに学習された量。(2) 学習限界に達する前に、未学習のまま残されたものの量。」
に比例する、というモデルは記号を使って書けば、

\displaystyle \delta x \propto x(A-x) \delta t

となるはずだ。

ここで表記は、

  • 時刻 t
  • (1) すでに学習された量を x(t)
  • (2) 学習限界を A とし、従い A に達する前に未学習のまま残されたものの量を A-x(t)
  • 微小時間  \delta t
  • 微小時間  \delta t あたりの x の変化  x(\delta t)\delta x

とした。

比例定数を k とすれば、
\displaystyle \delta x = k x(A-x) \delta t
\displaystyle \frac{\delta x}{\delta t} = k x(A-x)
となり、微分方程式
\displaystyle \frac{dx}{dt} = k x(N-x)
が得られる。

これは「ロジスティック方程式」と呼ばれるものと同型である。

さて上の微分方程式を解くと、
\displaystyle \frac{dx}{dt} = k x(A-x)
\displaystyle \frac{dx}{x(A-x)} = k \, dt
\displaystyle \frac{1}{A} \left(\frac{1}{x}-\frac{1}{A-x}\right) dx= k \, dt
\displaystyle \frac{1}{A} \{\log x-\log(A-x)\} = kt + C(C は積分定数
\displaystyle \log \left(\frac{x}{A-x}\right)^{\frac{1}{A}} = kt + C
\displaystyle \exp(kt+C)= \left(\frac{x}{A-x}\right)^{\frac{1}{A}}
\displaystyle \exp(A\{kt+C\})= \left(\frac{x}{A-x}\right)
\displaystyle \exp(A\{kt+C\})= \left(\frac{1}{\frac{A}{x}-1}\right)
\displaystyle \exp(A\{kt+C\})= \left(\frac{1}{\frac{A}{x}-1}\right)
\displaystyle \frac{A}{x}-1= \frac{1}{\exp(A\{kt+C\})}
\displaystyle \frac{A}{x}= \frac{1+\exp(A\{kt+C\})}{\exp(A\{kt+C\})}
\displaystyle x= A\frac{\exp(A\{kt+C\})}{1+\exp(A\{kt+C\})}
\displaystyle x= \frac{A}{1+\exp(-A\{kt+C\})}
となる。

ここで記号を Ak = B,  \exp(-AC)=C と改めて置くと、

\displaystyle x= \frac{A}{1+C\exp(-Bt)}

となり、統計学をかじった人ならおなじみのロジスティック曲線になる。

ちなみに Wikipedia の英語版には、"the S curve is known as the logistic function" とちゃんと(?)書かれている。Diffusion of innovations - Wikipedia

なぜだろう、原典にはロジスティックという文言は登場しないのに。

ケーススタディ

さて、せっかくなので実際のデータで正規分布の累積分布関数とロジスティック曲線で当てはまりを比較してみる。

ここでは、インターネットの普及率のデータを用いることにした。
総務省|平成25年版 情報通信白書|インターネットの利用状況

結果は以下の通り。

f:id:abrahamcow:20140814023230p:plain

f:id:abrahamcow:20140814023217p:plain

やはりロジスティック曲線のほうが当てはまりがいい。

ロジスティック曲線のほうがパラメータの数が多いので、これはフェアな比較とは言えないかもしれない。
しかし、ロジスティック曲線は「試行(トライ)するごとに学習される量は、次の事柄に比例する。(1) すでに学習された量。(2) 学習限界に達する前に、未学習のまま残されたものの量。」という仮定に基づいて導かれたものであり、かつ当てはまりもよい。あえて正規分布を選択する理由はないように思える。

納得できない点 2

その他にもロジャースの記述にはちぐはぐな部分がある。

p.350、下図を示し「つり鐘型曲線は各年ごとの採用者数を表し、一方 S 字型曲線は、これを累積して表している。」と書く

f:id:abrahamcow:20140814024404j:plain

が、そんなはずはない!

めのこでざっと測っても、「各年ごとの採用者数」であるはずのつり鐘型の高さの和が、累積の100%を超えてしまう。

f:id:abrahamcow:20140814024636j:plain

これ、どう考えてもつり鐘型曲線は確率密度関数で、S 字型のカーブは確率分布関数だろう。ロジャースは両者が次元(単位)の違うものであることを理解せず、無理やり一つの軸にプロットしてしまっていると思える。


先ほど僕はロジャースが「試行(トライ)するごとに学習される量は、次の事柄に比例する。(1) すでに学習された量。(2) 学習限界に達する前に、未学習のまま残されたものの量。」という仮定を置いたにも関わらず、唐突に正規分布を持ち出していることを指摘した。

ロジャースは自分で書いてる式やグラフの意味を理解してないのではないか?

あと、技術革新の普及に関して言えば「(1) すでに学習された量。(2) 学習限界に達する前に、未学習のまま残されたものの量。」に比例する、と考えるよりも、

  1. すでに技術革新を取り入れた層 x
  2. 普及の天井を A とし、まだ技術革新を取り入れていない層 A-x(t)

の各々に比例する、と考えたほうが自然だろう、結果としては同様のロジスティック方程式になるが。

むすび

ぼくは、『イノベーション普及学』を全部ちゃんと読んだわけではないし、もしかしたら、ここで言及した部分以外では、素晴らしい議論を行っているのかもしれない。

でも今現在、アーリーマジョリティ34.0%、レイトマジョリティ34.0%とかの分類をわざわざ採用する理由は僕には見当たらない。

なぜこれがそんな有名になったのだろう? よろしければだれか教えてください。

付録

正規分布、ロジスティック曲線を当てはめた R のコードです。

#インターネット普及率の推移
x <- c(57.8,64.3,66.0,70.8,72.6,73.0,75.3,78.0,78.2,79.1,79.5)/100
#本当は割り算値をつかって回帰分析するのはよくないのですが、
#元データが割り算値なのです。

#正規分布
res_norm <-nls(x~pnorm(1:11,a,b),start=list(a=1,b=1))
summary(res_norm)

#ロジスティック曲線
res_logis <- nls(x~a/(b+exp(-c*1:11)),start=list(a=1,b=1,c=1))
summary(res_logis)

logis <- function(x,a,b,c){
  a/(b+exp(-c*x))
}

#nihongo()

plot(x,main="正規分布")
curve(pnorm(x,coef(res_norm)[1],coef(res_norm)[2]), add=TRUE)

plot(x,main="ロジスティック")
curve(logis(x,coef(res_logis)[1],coef(res_logis)[2],coef(res_logis)[3]), add=TRUE)

参考文献(ロジャース以外)

田中孝文『Rによる時系列分析入門』では、電子レンジの普及率にロジスティック曲線を当てはめている。
また、微分方程式によるロジスティック曲線の導出についても記述がある。

Rによる時系列分析入門

Rによる時系列分析入門


バージェス&ボリー『微分方程式で数学モデルを作ろう』では、技術革新の普及(アイオワ州で除草スプレーを採用した農家の数の推移)をロジスティック方程式を用いて記述する例が出てくる。これの参考文献は1961年の Mansfield, E., "Techinical Change and the rate of imitation"(Technical Change and the Rate of Imitation on JSTOR)とのこと。

微分方程式で数学モデルを作ろう

微分方程式で数学モデルを作ろう