メインコンテンツまでスキップ

ポアソン分布がわからない 1

スティーブン・ピンカーの「The Better Angels of Our Nature」の中でポアソン分布の話が出てきて、昔勉強したはずなのに内容を一切思い出せなかったので調べてみたが、内容が思い出せなかったのは忘れていたからではなくはなから理解できていなかったからっぽい。

ポアソン分布は二項分布の極限である、というところまではポアソン分布の導出の過程を追うことで理解はできる。なので、二項分布で表すことが直感的である事象についてポアソン分布を使うことは理解できる。例えば部品の生産ラインで p=0.01p = 0.01 の確率で不良品が発生する場合、部品を n=100n=100 個抜き取り不良品が 2 個見つかる確率は λ=1\lambda = 1 のポアソン分布における P(2)P(2) だということは納得がいく。(グラフ 1

ただ、ポアソン分布がなぜ「ある事象が一定の時間内に発生する回数を表す」ことができるのかがよくわからない。例えばポアソン分布の英語版ウィキペディア記事には

For instance, a call center receives an average of 180 calls per hour, 24 hours a day. The calls are independent; receiving one does not change the probability of when the next one will arrive. The number of calls received during any minute has a Poisson probability distribution with mean 3: the most likely numbers are 2 and 3 but 1 and 4 are also likely and there is a small probability of it being as low as zero and a very small probability it could be 10.

とあるが、ポアソン分布における λ=3\lambda=3 となる nnpp の値はそれぞれ何にあたるのだろうか。 nn はサービスを利用している客の総数、 pp はある客がある時間にそのコールセンターに電話をかける確率、ということなのだろうか。その場合 n=100n=100 とすると p=0.03p=0.03 となりそれっぽくはある...(グラフ 2

ちょっとわかった

リンク集