ミライ: フツクロウさん、今日から新シリーズだそうです。

フツクロウ: ホウ。

ミライ: 最近、いくつか日本地図を書くネタをするうちロングテールの話も出てきましたが、いわゆる正規分布とは違って、まだまだ知られていないことが多いロングテールですから、改めて最初から説明しようという試みです。

フツクロウ: ホウホウ。もはや時代は正規分布ではなく、ロングテールじゃからの。

ミライ: ですよね! ロングテールと言えばアマゾンのビジネスモデルが有名ですけど、実は昔からあるあんなものやこんなものもロングテールだったてのが、次々出てきますものね。

フツクロウ: ホじゃな。正規分布は、工業時代に均一なものを作り出すのに強力な武器となったが、この多様性の時代には、それを説明する新しい理論が必要とされておる。ロングテールはまさにそのために発見されたと言っていいじゃろう。ここ21世紀のメディア、ニコニコ動画もロングテールの宝庫じゃ。

ミライ: ロングテールを制するもの多様性を制すですね!

フツクロウ: うむ。

ミライ: ということで、「ゼロから学ぶロングテール」始めようと思います。最初のうちは頻繁に更新して、落ち着いたら週1、2回のペースでお送りする予定です。

フツクロウ: ここはニコニコ動画だけに、例にはニコニコ動画が頻繁に出る予定じゃ。

ミライ: それは楽しみ。さっそくですが、今日(その1)はなんでしょう。

フツクロウ: ふむ。ロングテールという言葉は良く聞くが、いったいロングテールとは何かということについては、ほとんど知られていないといっていい。当面はその説明に向かっていくことが目標じゃ。その最初のステップとして、今日は、昔ながらの正規分布のグラフを出して、しかし、残念ながら同じグラフではロングテールにはまったく役に立たないことを示そう。

ミライ: ロングテールとは何かということは知られていないのですか? wikipedia などにも説明はあるようですが?

フツクロウ: 足らんの。
普通に考えれば年に1個、またはそれ以下しか売れないような商品まで顧客へ提供することで、店舗を構えていたのでは実現不可能な大きな販売機会の取り込みを可能にした。
 この辺りをグラフを用いながら説明せんと、ロングテールっぽいけど違うものとの区別がつきにくいし、ロングテールがなぜ多様性とつながっていくのかも導入しにくい。

ミライ: なるほど。その辺りに行くのが待ち遠しいですね。それでは、まず(その1)始めましょう!

 ロングテールって何?

 「ロングテール」って耳にはするけど、そもそも何でしょう。

 「ロングテール」の話が出ると、必ずといっていいほど出てくるのが、wikipedia にも載ってるこのグラフ。
220px-Long_tail.svg.png
 「この黄色い部分がロングテールです」とか言われたりします。では、このグラフは何?? ということになります。これは何のグラフか、それを知ることからロングテールの理解が始まります。wikipediaには 
販売数(population)を縦軸に、商品(product)を横軸にして、販売成績の良いものを左側から順に並べると

 って書いてありますが、そんなグラフ今まであまり見たことない人が多いのではないでしょうか。

 ロングテールは様々な統計データを扱っているときに出てきます。後々取り上げますが、例えば、ここニコニコ動画にアップされている動画の再生数というデータを見ると出てきます。

 いわゆる統計量ですから、普通であれば平均とか標準偏差とかそういった話が出て来そうなものですし、グラフだって学校で習ったようなものが出ていいはずですが、ロングテールでは出てきません。それはロングテールは今までの分布と決定的に違うからなのです。

 いったいこれは何のグラフなんでしょうか。それを考えるために、まず普通のグラフをおさらいしておこうと思います。

 ロングテールは今までの分布と決定的に違う

 ロングテールをゼロから学ぶ第一歩は、ロングテールは今まで数学や統計で慣れ親しんできたような分布とは根本的に違うことを知ることです。

 その違いを知るために、まずは身長という良く学校で習うような対象を見てみます。

 産業技術総合研究所|AIST人体寸法データベース1997-98

というところから、19歳から27歳の男性110人の身長のデータを入手しました。