正規分布以外の標準偏差について(ちょっとした考察メモ)
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

正規分布以外の標準偏差について(ちょっとした考察メモ)

2017-04-25 21:20
    1.問題提起
    正規分布には、以下の図のような性質があることが知られている。


    (画像はWikipediaより拝借)

    つまり、ある集団の何らかのデータが、平均μ、標準偏差σの正規分布に従うとき、
     新たなデータが μ±σ に入る確率は 約68.2%
     新たなデータが μ±2σ に入る確率は 約95.4%
     新たなデータが μ±3σ に入る確率は 約99.6%
    となることが知られている。

    これと同じような性質は、他の確率分布にも存在するだろうか?

    2.指数分布の場合
    とりあえず、指数分布だけ計算してみた。

    指数分布とは、
    「平均μの間隔で起こる出来事が、次に起こるまでの時間がxである確率」
    を表す確率分布であり、次のような式で表される。
    (μの単位は秒でも分でも年でも良い。x>0)

     

    また、指数分布の標準偏差σは、
     σ=μ
    になることが知られている。

    さて、今回知りたいのは、
     μ+σ以下に入る確率は○○%
     μ+2σ以下に入る確率は○○%
    などという表現が、指数分布でも可能かどうかである。

    そのためには、以下のような積分を計算すればよい。
     
    早速やってみる。

     
    (途中で、σ=μであることを使った)

    というわけで、非常にすっきりした式が現れた。

     平均μの指数分布において、
     次の出来事がμ+nσ以内に起こる確率は 

    となる。

    WalframAlphaで計算してみたら、次のようになった。
     n=0のとき 約63.2%
     n=1のとき 約86.5%
     n=2のとき 約95.0%
     n=3のとき 約98.2%

    3.具体例
    例えば、しゃっくりに見舞われたとする。
    しゃっくりの間隔を測定した結果、平均7秒の指数分布に従っていたとする。
    すると、次のしゃっくりが
      7秒以内に起こる確率 約63.2%
     14秒以内に起こる確率 約86.5%
     21秒以内に起こる確率 約95.0%
     28秒以内に起こる確率 約98.2%
    となる。
    逆に言えば、28秒間次のしゃっくりが起こらなければ、98.2%の確率で治ったと言える。


    4.今後の課題
    指数分布が計算できたので、ポアソン分布やガンマ分布についても計算したい。
    ポアソン分布とは、単位時間に平均λ回発生する出来事が、
    単位時間にk回発生する確率を表す分布である。
    kが整数のみを取るので、積分ではなく総和を計算するべきだろう。
    というわけで、次の和を計算すればよい。
     

    またガンマ分布とは、平均μの間隔で起こる出来事が、
    m回起こるまでの時間がxである確率を表す分布である。
    これは、次の積分を計算すればよい。
     

    式はわかっているのだが、私の数学力ではまだこれが計算できていない。
    今後、色々考えていきたい。

    5.感想
    私が勉強不足なだけかもしれないが、今まで指数分布の標準偏差について、
    今回求めたような関係を聞いたことがなかった。
    (n=0のときだけは、聞いたことがあった)
    少なくとも、正規分布について聞く頻度よりは少ないだろう。

    正規分布より指数分布の方が、身近で使える例が多いように思う。
    しゃっくりの発生間隔、LINEが届く間隔、遅延中の電車が駅に来る間隔、etc...
    ランダムに何度も発生する出来事に遭遇したら、ぜひ間隔の平均を取って、
    次に発生するのがいつなのか、計算してみよう。
    広告
    コメントを書く
    コメントをするには、
    ログインして下さい。