読者です 読者をやめる 読者になる 読者になる

F Lab.

LIFE IS A PARTY

はてなブログのアクセス解析値はなぜか四捨五入と切り捨てを併用している

ブログ

みなさんははてなブログのアクセス解析をどのくらい見るでしょうか。ぼくは、最新の傾向がGoogle Analyticsよりさくっと見られるので、結構見ます。

今回は、「これらの数値は全て整数で出てきているけれど、四捨五入されているのか、それとも切り捨てか切り上げか…?」と悩んで夜も眠れないみなさんに、その答をお教えします。

実用性は皆無で、ただのトリビアなのでその辺はご了承ください。

 

 

前提知識

そもそも、はてなブログのアクセス解析の「最近のアクセス傾向」というのは、いつからいつまでの集計値なのでしょうか。

それは、公式が明言しています。

アクセス解析 - はてなブログ ヘルプ

最近の1,000件のアクセス元を保持し、訪問数が多いサイト順に表示します。

はてなブログのアクセス解析は、最近の1,000件のアクセス元をもとに割合計算されているようです。

超人気ブロガーだと、1時間ごとにアクセス元がめまぐるしく入れ替わってしまって「リアルタイム解析」みたいな感じになるのでしょうね。

 

 

本題

ステップ1:「アクセス元」は切り上げではない

これは当ブログの最近のアクセス傾向。PC表示だとクリックすれば拡大します。ちょっと見にくいですが、

「アクセス元サイト」を見るとドコモの検索から1%流入していて、「アクセス先ページ」を見ると上から順番に27%, 18%, 9%, 9%, 9%, 9%, 9%, 9%と並んでいます。この数値の並びを見れば、数学がちょっと得意な人であればすぐにピンとくると思います。

「ああ、実際の訪問者数は3,2,1,1,1,1,1,1またはその倍数だな」と。アクセス数が少ないドコモの検索流入の数値を取り上げているのは、この絞り込みが簡単だからです。

よって、ドコモの検索からの流入は、最低でこの合計の11。次にその2倍の22がありえます。しかし、ドコモの検索からの流入は、1000件のうちの1%なので、%計算に切り捨てを仮定したとしてもその最大値は19なはずです。なので、この画像から分かるドコモの検索からの流入は11で確定です。

よって、「アクセス元サイト」は1,000件中11件(計算値1.1%)を1%と表記しているので、切り捨てまたは四捨五入であることが分かります。

 

ステップ2:「アクセス元」は四捨五入

次に「はてなブログ」(購読中のブログ)からの流入を見ます。

こちらも「アクセス元サイト」の方(流入)は1%。「アクセス先ページ」の方は、上から77%, 22%と並んでいます。この数値を見れば、「実際の訪問者数は7,2またはその倍数だな」と分かります。

よって、「はてなブログ」からの流入の合計数は9またはその倍数になります。

ここで、先ほど見た、この一つ上のドコモの検索からの訪問者数が11であったことを思い出せば、その下にある「はてなブログ」からの流入の合計数は11以下なので、9に決まります。

ここでは、最近のアクセス1,000件中9件(計算値0.9%)が1%と表記されているので、このことと上で分かった「切り上げではない」ということを合わせて考えると、「アクセス元サイト」の小数点以下の処理は四捨五入であることが分かります。

 

ステップ3:「アクセス先ページ」は切り捨て

ここで、先ほどの、「はてなブログ」からのアクセス先ページ(77%と22%)を見てみましょう。これは、それぞれ9件中7件と2件であることが分かったので、計算値はそれぞれ77.7...%と22.2...%であるはずです。ここで、77.7...%が77%と表示されていることから、「アクセス先ページ」は少数点以下を切り捨て処理していることが分かります。

 

 

なぜ四捨五入と切り捨てを併用しているのか?

この答ははてな公式にしか分からないのですが、おそらく左右で表示件数のバランスをとるためかと思います。 

たとえばGoogleからの「アクセス先ページ」を見ると、記事数が少なめの自分でも19件表示されていて、左の「アクセス元サイト」よりもずいぶん長くなってしまいます。

記事数が多めのブログではもっと長くなってしまうのではないでしょうか。

一方、「アクセス元サイト」なんて多くても10件くらいに限られるので、そんなに多くなることはありません。

この、左右の表示件数の不均衡を緩和するために、左は四捨五入、右は切り捨てにして右の表示件数を少なめにしているのではないでしょうか。

切り上げを使わないのは、表示件数が増えすぎないようにするためかと思います。

 追記:↑と思ったけど、0%の表示も普通にあるので表示件数の問題じゃないかも。いったいなんなんだ。

 

まとめ

「アクセス元サイト」は四捨五入

「アクセス先ページ」は切り捨て

で小数点以下を処理しています。

明日使えないムダ知識に付き合っていただいてありがとうございました。それでは!