2014年度マイコースプログラム

4回生K.K. @統計遺伝学分野

9月1日(月)午後

mychisq.test()の検証 2

母分散が同じがどうかの検定をしてみる。

s <- function(){
sample(1:3,20,replace=TRUE)
}
s.t <- function(){
table(s())}#テーブル作成

x<-c()
for(i in 1:100)x<-c(x,mychisq.test(s.t()))
y<-c()
for(i in 1:100)y<-c(y,chisq.test(s.t())$p.value)
#データをベクトルにする

var.test(x,y,alt="two.sided")

> var.test(x,y,alt="two.sided")

        F test to compare two variances

data:  x and y
F = 0.8845, num df = 99, denom df = 99, p-value = 0.5425
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.5951112 1.3145356
sample estimates:
ratio of variances 
         0.8844743 

また時間がかかるのかと思っていたが、テーブルの作成までに時間がかかっていただけだったので、検定はすぐ終わった。

こちらも帰無仮説が成立するといってよさそうである。

というわけで、適応度検定の関数として機能するものをつくることができた。

本当は適応度検定だけでなく、任意の確率に対してそれに従うかどうかまで検定できるようにできればさらに一般性は高いのだろうが、そろそろ本題の疫学の勉強に入っておきたいということで、今回はここまでとする。

備え付けの関数の自作は達成度が大きいので、また機会があればぜひやりたい。

生存分析

これからは当初予定していた通り、「ロスマンの疫学(KENNETH J. ROTHMAN 著、篠原出版新社)」を読み進めて疫学の勉強をしつつ、面白そうなテーマがあれば追究してRによる実装やシミュレーションをしていく、というスタイルで進めていくことにする。

p.76に「生存分析」の話題が出てきたので、p.336の「生存曲線」の内容とともに、まとめておきたいと思う。

というわけで、ただいま勉強中である。

明日中には何かしらの形でアウトプットしたい。

以上