間違えたことのメモ集積
誕生日問題の計算
- http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/omosiro-banasi/tanjoubi.html
- nCr/nHr で計算すればいいのかな、と思って、 365C50/365H50 をやってみたけれど、あきらかに計算結果が違かった。
- ※ちなみに、Rで、nCrの計算は choose(n,r) というコマンドでできる。nHrはできないので、 nHr = n+r-1Hr である性質を利用して行う。
- 発想としては、分母に「とりうる組み合わせのバリエーションのすべて(ただし、順序は入れ替わっても良し)」。分子に「そのなかで、すべての数字が異なる組み合わせの数(ただし、順序は入れ替わっても良し)」という形。
何故これではいけなかったのか?
- 答えは、 nPr/nrで計算する。
- おそらく、その点が重要。
- まず、分母から。
- nHrだと、重複した組み合わせのバリエーションは出てくるけれども、一つ一つの組み合わせの出る確率が(本当は違うのだが)均等な重み付けになってしまっている。
- たとえば、サイコロ6つを転がした場合の3つの数字の組み合わせ(順序を気にしない場合は)、6H3=56 だが、
- この場合、三つゾロ目が 111の出る確率は、1/216。三つゾロ目の組み合わせ合計は111以外にも、6通りあり、3つゾロ目全体がでる確率は6/216となる。
- 二つゾロ目の112は仮に順序があった場合、121、211という形で出るバリエーションが3つあるので、確率はゾロ目の3倍になり、3/216。二つゾロ目の組み合わせは、6*5=30通りあり、二つゾロ目の確率は、(30*3)/216 = 90/216となる。
- それぞれ異なる三つの数字 123は、 132,231,213,312,321 とバリエーションが6つあるので出る確率はゾロ目の6倍となり、 6/216。三つゾロ目の組み合わせは、6C3 = 20通り。すべての組み合わせが異なる確率は、(20*6)/216 = 120/216 となる。
- (異なるn個の数の組み合わせの順列に、いくつのバリエーションが発生するかは、自由度の階乗でも計算できる。3ケタだったら、3!=3*2*1=6)
- 6+90+120 = 216 となり、6*6*6 と等しくなる。なので分母は、nrでおk。
- 分子に関しても、同様で、
- nCrを使ってもよいが、組み合わせがすべて異なる一個ずつの組み合わせは、出る確率をかけてやる必要がある。すなわち、nCr * r!
- ただし、nCr * r! = nPr なので、
- nPr を分母にすればそれで解決する。