2014年度マイコースプログラム

4回生K.K. @統計遺伝学分野

9月10日(水)午後

累積症例対照研究のシミュレーション まとめ

まず、「ロスマンの疫学」に累積症例対照研究は、発症する人が多くなるとオッズ比を過大評価としてしまうと書いてあったので、中央値を見てその確認をしてみる。

p/q=2のとき(グラフのx軸はpとなっているが、qの間違いである。)

f:id:kouri_don:20140910152855p:plain

確かに発症者が多い方が中央値が大きくなっている。
これはp>qのため、発症する人が多いほど、対照群の曝露率が過小評価されてしまうためである。

ちなみにp/q=1のとき

f:id:kouri_don:20140910154328p:plain

ぴったり一定になった。

密度症例対照研究のときは、p/qが一定であれば分散の値は変わらなかったが、今回は(これもグラフのx軸はpとなっているが、qの間違いである。)

このように、qが大きくなると分散は大きくなった。

f:id:kouri_don:20140910155241p:plain

気になったのでp/q=1のときも調べてみると、

f:id:kouri_don:20140910155013p:plain

こちらはバラバラである。

とここで、昨日の分と合わせて、これらの現象について詳しい説明をするには、二項分布についてちゃんと理解する必要があるな…と思い勉強を始めて、ついでに今までなんとなくスルーしてきた正規分布ポアソン分布、指数分布等についても勉強した。
なぜ今までこんな重要な概念をスルーしてたんだろうと愕然とした。

このまま一気に疑問に思っていたことを理解してしまおう…と思っていろいろ読んでいるうちに今日は用事がある時間になってしまったので、また明日まとめることにする。

以上