ミライ: ゼロから学ぶロングテール(その3)です! フツクロウさん、今回は、なんですか?

フツクロウ: ホウじゃな。前回ロングテールグラフを紹介したから、そのグラフの読み方や特徴をやろうかの。ロングテールのためのグラフというだけに、ロングテールを調べるためにとても便利にできおるんじゃ。
 なんといっても、調べたい対象が公表しているわずかなデータからでも、大抵の場合は作れてしまうことじゃな。

ミライ: 今回ニコニコデータセットによる生データを利用していますけど、そんなのがなかった、5年前というふる〜いデータも登場するようです。

フツクロウ: ホッホッホッ。お宝データじゃの。

ミライ: いや、そこまでではないですけど、5年前の比較とか面白そうです。それでは始めます!


 ロングテールグラフのここを見よう!

 前回で、ロングテールのグラフの書き方までは分かりました。では、そのグラフをどう見ればいいのでしょうか。

 こんなグラフは見なくていい

 前回、殴られるの覚悟で出した一つのグラフを覚えていますか? これです。
0d9e14e34b7ae9f509285c79e3e6877caf9a7229
 まあ、本当にどうしようもないグラフですが、では、wikipediaにも載ってるロングテールの時に出てくる典型的なグラフはどうでしょう。
 220px-Long_tail.svg.png

 二つは、同じものを軸に取っているのですが、こちらはちゃんと色が塗れるくらい隙間があります。しかし、上の実例で見る通り、現実の世界でロングテールになるときは、ほとんど隙間はできません。説明のため仕方ないとはいえ、あまりにも現実からかけ離れたこのグラフ、これこそがロングテールを難しくしている遠因です。

 このグラフを見る

 そのようなローーングなテールが印象的なグラフも必要かもしれませんが、それは最初だけです。ロングテールを考えるのなら、普通の目盛り(10, 20, 30, ...)でなく、規模の目盛り(つまり1, 10, 100,... )でのグラフは必須です。再びこれです。
946817d42e060446e2b2b440d28f6c18c699e927