この記事はブログ主の覚え書きとして、ココログとGoogle Analytics(グーグル・アナリティクス※)の訪問者属性の判断の方法や違いを書くものです。
※Google AnalyticsとはGoogleが提供するアクセス解析ツールで、ブログなどのサイトにコードを埋め込んでおくことで統計が取られ、管理者ページにて様々な解析データを見ることができるというもの。
まず、例として先月(2016年10月)のユーザ属性のキャプチャです。
男性:68.9%、女性:31.1%という割合で、この月はちょっと極端ですが、このブログは普段から男性の方が50%超と分析されます。
このブログは数から言うと女性向けの記事(ミニチュア工作)が大半で、実際それらの各記事へのアクセスも多いのですが、ページビューが多い記事は、と言うと、PC関連の記事(PCの設定方法、Excelやスキャナの使い方、etc.)が圧倒的に多く、こちらは男女どちらもターゲットになり得ます。したがって、男性からのアクセスが多いという結果自体はそれほど不思議ではありません。
ここで、ココログではどのように性別などのユーザ属性を判断しているかFAQを見てみると、
Q: 『性別、年齢、ネットリテラシーなどのユーザー属性情報は何を元に算出しているのですか。』
A: アクセス元のドメイン情報や、携帯の種類(女性向けか、子供向けか簡単ケータイか)などの情報を元に大まかに推測したものです。あくまで推測値ですので、参考程度にしてください。
とあります。
「アクセス元のドメイン情報」とはGoogleやYahooなどのサーチエンジンがアクセス元では性別などは判断できないと思うので、例えば女性向けサイトに貼られたリンクからのアクセスを指すのでしょうか?
「携帯の種類」は、アクセスログを見ると機種名も表示されているので、これで判断しているのは想像できます。
しかし、PCからのアクセスの場合、判断は難しいのではないかと思います。実際、このブログは前述のようにPC関連の記事へのアクセスが多いせいか、PCからのアクセスがいまだに50%超(10月は56.12%/下図)です。これは想像ですが、“「女性」や「男性」と判断できないものは「男性」にしている”のではないか?と思います。
後述しますが、Google Analyticsでは判断の要件はココログは異なり、また、ユーザ属性の分析ではデータの3割は判断不能として除外されています。ココログがもし全てのデータで分析しているとすると、よく分からないけど「えいや!」で決めつけてるものが誤差を生じさせている可能性があります。
スマホなどのモバイル端末でのアクセスが多いブログの場合はもう少し精度が高いのではないかと思いますが。
なお、「サイトへの訪問者の属性」 とあるので、UU(ユニークユーザー=同じ日に同一のユーザが何回か訪問しても「1人」としかカウントされない)を単位としています。(→FAQ『アクセス解析用語集』/UUの項参照)
Googleにユーザ登録して性別や生年月日を登録(ただし、登録は必須ではない)している場合は当然それを利用しているでしょうが、Google Analyticsでは、個々の端末毎にそのユーザが日頃どんなサイトを訪れているか、どんな検索ワードで検索しているかという情報を蓄積してその端末のユーザの属性を分析しています。(正確には、データを蓄積・分析しているサードパーティー=Googleとは別の会社から提供を受けています。)
例えば、日頃から、育児、ファッション、レシピに関する検索やネットショップへのアクセスが多いとか、成人病、育毛に関する検索が多いといった情報を元に、年齢や性別、関心事など、インターネットを使っている内にプロファイリングの材料が蓄積されているわけです。
家族で1台のPCを共有している場合は別ですが、モバイル端末がこういった行動を分析されたら、かなり精度の高い分析はされているのではないかと思います。
下のヘルプ記事はGoogle AdWordsというターゲット広告に関するものですが、上記のようなことを説明しています。そのサイトの閲覧者に適した広告を表示するための仕組みです。
ユーザー属性ターゲティングについて
Google が属性情報を識別する方法
ユーザーが Google
アカウントにログインしている場合は、アカウントの設定から取得した位置情報やユーザー属性が使われる可能性があります。ユーザー属性情報は
[広告設定] ページでユーザー自身が編集できます。このほか、一部のソーシャル ネットワーク サイトなどでユーザーが入力した属性情報が
Google に提供される場合もあります。
Google アカウントにログインしていないユーザーについては、Google
サービスやディスプレイ ネットワークでの行動に基づいて、その属性を推測することがあります。たとえば、ユーザーが YouTube やディスプレイ
ネットワーク上のサイトを閲覧している場合は、「Cookie」を使ってウェブブラウザに識別子が保存されます。これにより、訪問したサイトの履歴に基づいて、ブラウザが特定のユーザー属性のカテゴリに関連付けられます。
例
ガーデニングが趣味のユーザーがいるとします。このユーザーがディスプレイ
ネットワークで利用しているガーデニングのサイトやブログのほとんどは、ユーザーの大多数が女性です。こうした情報から、Google
アカウントにログインしていないとき、このユーザーのブラウザは「女性」のユーザー属性に分類される場合があり、結果的にこのユーザーには女性をターゲットとする広告主様の広告が表示される可能性があります。
また、このユーザーが Google アカウントにログインしている場合は、ユーザー自身が [広告設定] ページで指定した設定に基づいて広告が表示される可能性もあります。
下は、Google Analyticsで見た先月のユーザ属性のキャプチャです。
こちらでは女性が57.9%と男性よりも多いと分析されています。
「セッション全体の69.54%」とあるのは、3割くらいは判別不能(しきい値により除外された)でこの分析には含まれていないことを示します。
「しきい」とはこの場合「閾」ですが、敷居、つまり引き戸の下の戸が滑る部分、日本建築は玄関も引き戸なので、内と外を分ける境界線で、要するに、この場合は分類する要件を満たすと見なされる境界や基準です。(本来「閾」の読みは「いき」で閾値は「いきち」と読むが、慣用的に「しきいち」と呼ばれることが多い。)
ヘルプ記事『ユーザー属性とインタレスト カテゴリについて』にも説明されていますが、ドリルダウン(その範囲で更に深く掘り下げて分析)すると、年齢、興味ある分野(インタレスト・カテゴリ)毎の割合が表示されます。
Google Analyticsで性別などの分類ができるようにするには、設定が必要です。→『ユーザー属性とインタレスト カテゴリに関するレポートを有効にする』
なお、Google Analyticsでのユーザ属性はセッション単位で行われます。これは30分以上サイト(ブログ)から離れていたら、次に同一ユーザが訪問しても別のセッションと見なすものです。
『アナリティクスの AdWords クリック数、セッション数、ユーザー数、閲覧開始数、ページビュー数、ページ別訪問数の違い 』
サイトを訪問したすべてのユーザーにより開始された個々のセッションの数を表します。ユーザーがサイトで 30 分以上操作を行わなかった場合、
それ以降の操作は新しいセッションと見なされます。サイトを離れたユーザーが 30 分以内に同じサイトに戻ってきた場合は、同じセッションとして扱われます。
最近のコメント