読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

Google トレンドの縦軸の数字(検索インタレスト)ってなんなの?

翻訳 時系列 私家版術語集 SEO

「検索インタレスト」ってどういう意味?

f:id:abrahamcow:20130803161119p:plain
Google トレンド


検索インタレスト=(各時点の検索ボリューム÷検索ボリュームの最大値)×100

らしい。

もうちょっとシンプルに書くと、年月日 i に、ある語句を検索した人の数を xi
としたときの、

 y_i=(x_i/\max\{x_i\}) \times 100

を検索インタレストと呼んでいるらしい。

↓以下公式ヘルプの拙訳(謙遜抜きでつたないのでできればだれか直して欲しい)

グラフ上の数字は何を意味するのですか?

グラフ上の数字は特定の語句を検索した人の量を反映し、その語句を Google 検索した人の総数に関係します。
データは 0 から 100 のスケールに正規化されているため、絶対的な検索ボリュームを表すものではありません。
グラフ上のそれぞれの点は最大値、または100で割られたものです。十分なデータがないときは 0 と表示されます。

スケール正規化を参照してください。

カテゴリフィルタを適用すると別のグラフになります。←訳注:カテゴリフィルタってどれのことかわからない
このグラフはグラフの最初の日(またはデータが存在する最初の日)に対しての成長の度合いをパーセント表示して、期間を通じての変化を見せるものです。
これがカテゴリ比較のグラフで y 軸に 0 〜 100 のラベルの代わりに、始まりを 0 として -100% または +100%の範囲のラベルが表示される理由です。

Trends graphs and forecasts - Trends Help

データは正規化されているのですか?

はい。
Google トレンドの結果はすべて正規化されています。
つまりデータセットを同じ数で割ることで、数の印象を除去しています。
そうすることで、データの根底にある特性を比較できるようになります。
正規化をせずに絶対値でランキングすると、もっとも検索ボリュームの多い地域のデータは、常に高い位置になるでしょう。

以下の例で正規化の要点を考えてみてください。

「ホテル」という語句に対してカナダとフィジーで同じ度合いが表示されます。

これは「ホテル」に対する検索ボリュームが同じだということですか?

2つの地域で、特定の用語に対して同じ割合が表示されることは、彼らの絶対的な検索ボリュームが同じであることを意味しません。

検索ボリュームが明らかに違う、2つの異なる地域のデータを同じように比較できます。
これはそれぞれの地域の総トラフィックで、データが正規化されているからです。
これにより、「ホテル」という語句がカナダとフィジーで同じように検索されていると仮定することができます。

ニューヨークは語句「ヘアカット」のリストにでてきません。

これはニューヨークの人は「ヘアカット」で検索しないということでしょうか?

思い出してください。Google トレンドは Google である語句を検索した特定の地域のユーザーの尤度を関係性を基に表示します。←訳注:この部分意味不明なので誤訳っぽい

そのため、ニューヨークが「ヘアカット」の地域のリストのトップに出てこないことは、人々がこの語を常に検索しないことの十分条件ではありません。

以下のシナリオを考えてみてください。ニューヨークでは:

  • 床屋や美容院を探すのに Google を使わない
  • ヘアカット関連の別の言葉を使う
  • ヘアカットと関係ない別の話題で検索する人がとても多いため、ニューヨークの検索ボリュームのヘアカットで検索する人の配分が、他の地域と比べて小さくなる

といったことがありえます。

How Trends data is adjusted - Trends Help

↑ここでは地域別人気度の話をしているらしい。
f:id:abrahamcow:20130803160738p:plain
Google トレンド


データのスケールはどうなっているのですか?

Googleトレンドのデータは 0 〜 100 のスケールで表示されます。

この値は、まずデータを正規化しています。

正規化して、グラフ上のそれぞれの点を最大値で割って、100 を掛けています。
スケーリング前の元の最大値が共通でない限り、異なるプロットどうしは比較できません。

例えば、スウェーデンでは11月に語「スキー」への関心が高まるとすると、Googleトレンドではこのピークを 100 とします。

次に12月に「スキー」への関心が著しく減少して、2番目のピークが約半分だったとたとします。これは 50 という具合です。

How Trends data is adjusted - Trends Help