間違えたことのメモ集積

誕生日問題の計算

  • http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/omosiro-banasi/tanjoubi.html
  • nCr/nHr で計算すればいいのかな、と思って、 365C50/365H50 をやってみたけれど、あきらかに計算結果が違かった。
  • ※ちなみに、Rで、nCrの計算は choose(n,r) というコマンドでできる。nHrはできないので、 nHr = n+r-1Hr である性質を利用して行う。
  • 発想としては、分母に「とりうる組み合わせのバリエーションのすべて(ただし、順序は入れ替わっても良し)」。分子に「そのなかで、すべての数字が異なる組み合わせの数(ただし、順序は入れ替わっても良し)」という形。

何故これではいけなかったのか?

  • 答えは、 nPr/nrで計算する。
  • おそらく、その点が重要。
  • まず、分母から。
    • nHrだと、重複した組み合わせのバリエーションは出てくるけれども、一つ一つの組み合わせの出る確率が(本当は違うのだが)均等な重み付けになってしまっている。
    • たとえば、サイコロ6つを転がした場合の3つの数字の組み合わせ(順序を気にしない場合は)、6H3=56 だが、
      • この場合、三つゾロ目が 111の出る確率は、1/216。三つゾロ目の組み合わせ合計は111以外にも、6通りあり、3つゾロ目全体がでる確率は6/216となる。
      • 二つゾロ目の112は仮に順序があった場合、121、211という形で出るバリエーションが3つあるので、確率はゾロ目の3倍になり、3/216。二つゾロ目の組み合わせは、6*5=30通りあり、二つゾロ目の確率は、(30*3)/216 = 90/216となる。
      • それぞれ異なる三つの数字 123は、 132,231,213,312,321 とバリエーションが6つあるので出る確率はゾロ目の6倍となり、 6/216。三つゾロ目の組み合わせは、6C3 = 20通り。すべての組み合わせが異なる確率は、(20*6)/216 = 120/216 となる。
      • (異なるn個の数の組み合わせの順列に、いくつのバリエーションが発生するかは、自由度の階乗でも計算できる。3ケタだったら、3!=3*2*1=6)
      • 6+90+120 = 216 となり、6*6*6 と等しくなる。なので分母は、nrでおk。
  • 分子に関しても、同様で、
    • nCrを使ってもよいが、組み合わせがすべて異なる一個ずつの組み合わせは、出る確率をかけてやる必要がある。すなわち、nCr * r!
    • ただし、nCr * r! = nPr なので、 
    • nPr を分母にすればそれで解決する。