ブラウザの使用率シェアのバイアス

以前に「ブラウザの使用シェア統計はどれが正確か?」という書き込みをしました。ブラウザの使用率統計としてしばしば引用されるNetMarketShareStatCounterのどっちが信用できるかについての内容でした。

NetMarketShareもStatCounterもアクセスログ分析ツールです。Google Analyticsと同じようなものです。そしてNetMarketShareやStatCounterのツールが導入されているウェブサイトのすべてからデータを集めて、ブラウザの使用シェア統計を算出しています。

しかしここが大きな問題です。ウェブに関わっている人は一人残らずGoogle Analyticsのことを知っていますが、NetMarketShareにしてもStatCounterにしても、全く聞いたことがない人が多いのではないでしょうか。

それもそのはずです。Wappalyzerというブラウザ拡張機能を使って調査されたデータを見る限り、68%のウェブサイトはGoogle Analyticsを導入しているものの、StatCounterはわずか2%のサイトしか導入していないのです。NetMarketShareはこれよりもさらに導入数が少なくなっています。つまりStatCounterおよびNetMarketShareはウェブ全体から見ると極小さい標本サイズしかなく、なおかつ標本の中にバイアスがある可能性が高いからです。

したがったこのような統計を使う場合は、そういうことを心にとめる必要があります。私は以下のように注意しています。

  1. シェア(何%)の絶対値は信用しません。例えば2013年12月時点でInternet Explorerのシェアが57.91%というのは基本的に信用できません。またChromeの16.22%も絶対値として信用しません。原則として傾向だけを見ます。
  2. 複数の国を合算した数値は信用しません。国によって標本サイズが違うからです。StatCounterはこのあたりを公開していて、例えばトルコの標本サイズが異常に高いことがわかります。したがって合算した数値よりは、個々の国の数値の方が意味を持ちます。それでも個々の国を見るのではなく、複数の国を見て傾向を判断することが必要です。
  3. 時系列の変化はある程度信用できますが、実際にグラフを見てみると不思議な挙動が起こることが頻繁にあります。したがって時系列の変化も鵜呑みにできません。

一方でこのようなバイアスを全く考えないで記事を書いているブロガーが非常に多いので、そういう記事は眉唾ものだと思って良いでしょう。

ブラウザの使用シェア統計はどれが正確か?

このブログではブラウザの使用統計を頻繁に使って議論をしています。特にStatCounterをよく使います。しかしその統計は信用できるものでしょうか?

答えからいうと、そのままでは信用できません。

もう一つよく使われているブラウザ使用統計はNetMarketShareがありますが、どちらかというとこちらの方が信頼性が高いと考えられることが多いです。ただNetMarketsShareの場合は細かいデータは有料になってしまいます。StatCounterは地域ごとの細かいデータまで無償で公開されています。

このあたりの細かい議論は、Roger Capriotti氏が書き下ろしています

StatCounterはChromeの使用シェアが高く出ているのに対して、NetMarketShareはInternet Explorerの使用シェアが高く出ています。したがってGoogle派か、Microsoft派によってもどっちを信用するかは変わってくるようです。

ただウェブログ解析をしている人の考え方に近いのはNetMarketShareの方です。NetMarketShareは訪問者数を分析しているのに対して、StatCounterはページビューを分析しています。いまどきページビューを使ってウェブサイトのログ解析をする人はいません。

また私自身、仕事の関係上一日中ウェブを使っていますが、そうなると「普通」の人よりも100倍ぐらいページビューを出していることだってあります。そのままカウントされたデータは意味が無いと自分自身が思います。

またNetMarketShareは地域ごとのサンプル数のバイアスを考慮していますが、StatCounterはそれをしていません。地域ごとのサンプルバイアスというのは、例えばStatCounterの場合は日本人によるページビューが少ないのに対して、トルコ人によるページビューが非常に多いです。NetMarketShareであればインターネット人口を元に補正をかけますが、StatCounterはそのままにしています。したがってトルコ人のネット使用傾向が最終データに強く表れます。

私は絶対値はNetMarketShareの方を信頼しています(ということは、まだまだInternet Explorerがダントツで一番使用されているブラウザだと考えています)。しかし細かいデータが公開されていませんので、「傾向」で十分に議論ができるような場合はStatCounterを使っています。