検証方法について尋ねた>> 4012です。
反応ありがとうございます。
何回目で吐き出したか?だけを集めて、各回におけるはきだす確率は均等だとして、
回数の散らばりを見るのが良いんかな?
は言葉足らずだったので補足すると、
各回のはきだす確率が異なると仮定すると、
複数回たくわえた時のデータが全然集まらなくて検証が難航しそうなので、
各回でのはきだす確率を全て等しいと仮定するのが良いのではと思っています。
従って、ひとまずは、
はきだす確率をp たくわえる確率を1-pとし、
各回でのはきだす確率を全て等しいと仮定し、
10Ci / ∑_{j=1}^{10} 10Cj, i = {1, …, 10} を計算して、
(: すみません、ここはあんまり自信がありませんが、
それっぽいことができるのではと思っています)
何回目で吐き出したか?というデータを元に、
最もそれっぽいpの値を求める
が現実的ではないかと思いました。
また、上記の検証の後、
統計は詳しくないのであまり自信がないのですが、
1回目、2回目、3回目、4回目のデータのはきだす確率に差があるかどうかを見て、
差があると言えそうなのであれば、さらに追加で検証する
を実施するのもいいのかもしれない…と思っています
通報 ...
違和感があったので樹形図を書いて再考したところ、
検証1の立式にミスがあったので修正します
14:26に i={1, …, 11} に修正しました
1回目はきだす確率はp
2回目はきだす確率はp(1-p)
3回目はきだす確率はp(1-p)^2
…
11回目はきだす確率はp(1-p)^10 なので、
全事象Sは、
初項p、公比1-p 、項数11 の等比数列の和として書けて、
[1]: S = p + p(1-p) + … + p(1-p)^10
[2]: (1-p)S = p(1-p) + p(1-p)^2 + … + p(1-p)^11 より、
[1] - [2] を整理して、
pS = p - p(1-p)^11
S = 1 - (1-p)^11 と表すことができました。
従って、
(全てのデータ数) × (i 回目にはきだす確率) / S を i = 1 から11までを計算した値による分布と
実際に収集した「何回目にはきだすが発動したか?」データの値による分布が
等しくなるようなpの値を求めるのが良いのではと思いました。
検証2は各ノードにおけるはきだす確率が全て等しいか?を確かめるだけで良さそうですね
1回目にはきだすとなったデータの数 / (1回目にはきだすとなったデータの数 + 1回目にたくわえるとなったデータの数)
= 2回目にはきだすとなったデータの数 / (2回目にはきだすとなったデータの数 + 2回目にたくわえるとなったデータの数)
= 3回目にはきだすとなったデータの数 / (3回目にはきだすとなったデータの数 + 3回目にたくわえるとなったデータの数)
…
= 10回目にはきだすとなったデータの数 / (10回目にはきだすとなったデータの数 + 10回目にたくわえるとなったデータの数)
ただし、
が成り立っているかを見るのが良さそうです