2014年度マイコースプログラム

4回生K.K. @統計遺伝学分野

9月11日(木)

累積症例対照研究のシミュレーション まとめ 2

結論から言うと、どうして分散がこのように変化するのかの説明は出来なかった。

ある多項分布にしたがう4つの確率変数のかけ算・割り算をしたときに、計算結果はどういった分布を示すか、という問題に帰着できて、理論上はちゃんとそれぞれのパラメータの変化による分散の説明もできるような気がするのだが、ちょっと僕の手には負えなかった。

それに、おとといの記事で

「いま、オッズ比の計算は、
(症例群の曝露者数)/(症例群の非曝露者数)を(対照群の曝露者数)/(対照群の非曝露者数)で割って出しているが、
真の値が(症例群の曝露者数)=(症例群の非曝露者数)かつ(対照群の曝露者数)=(対照群の非曝露者数)に近い値のほうが、より収束するのが早いと考えられる。」

と書いたが、それは確かにそうでも、(確率変数)/(確率変数)の真の平均値が小さければ小さいほど(すなわち、分子の平均値が小さくて分母の平均値が大きいほど)、分散の値も小さくなりやすいはずである。
そのため、いまのままではe1=0.1のときのほうが分散の値が大きいことの説明が十分ではない。

ちょっと解決の目途がいまのところたたない上、かなり時間を消費してしまっているので、この問題は一旦保留にしようと思う。
保留にしている問題が増えてきたので、マイコース終盤のまとめの段階で保留にしている問題について再考する日をつくることにする。

解決には到らなかったが、それに関連する話題で、いろいろ寄り道したりしつつ統計に関する理解を深めることが出来たとは思うので、一応考えて意味はあったかなと思う。
あと、一般教養で取り扱った数学が思ったよりも多くのところで応用されていることを知り、1回生のときにもっと真面目に勉強しておけばよかったと後悔した。



勉強に割いた時間が長かったので、今日はほとんど記事にすべき作業はなかった。

明日は第6章の「感染症疫学」に進み、遊び半分でリード・フロストモデルおよび自分のオリジナルのシミュレーションをRでやってみることにする。
その次の章からバイアスや交絡といった範囲に入っていくので、そのへんの勉強がひととおり済んだら論文を読んでみようと思う。

以上