library(DT) #편의를 위해 숫자로 코딩된 입력값을 문자로 바꾼다음 테이블로 보여준다
datatable(kyj)
gene936<-table(kyj$gene936,kyj$recur) #gene936의 유전자형 분포와 재발여부간의 독립성을 검정한다
fisher.test(gene936)
##
## Fisher's Exact Test for Count Data
##
## data: gene936
## p-value = 0.1716
## alternative hypothesis: two.sided
gene634<-table(kyj$gene634,kyj$recur) #gene634의 유전자형 분포와 재발여부간의 독립성을 검정한다
fisher.test(gene634)
##
## Fisher's Exact Test for Count Data
##
## data: gene634
## p-value = 0.2724
## alternative hypothesis: two.sided
gene2578<-table(kyj$gene2578,kyj$recur) #gene2578의 유전자형 분포와 재발여부간의 독립성을 검정한다
fisher.test(gene2578)
##
## Fisher's Exact Test for Count Data
##
## data: gene2578
## p-value = 1
## alternative hypothesis: two.sided
gene1612<-table(kyj$gene1612,kyj$recur) #gene1612의 유전자형 분포와 재발여부간의 독립성을 검정한다
fisher.test(gene1612)
##
## Fisher's Exact Test for Count Data
##
## data: gene1612
## p-value = 0.7661
## alternative hypothesis: two.sided
4가지 유전자 모두 재발여부와는 독립이다. 쉽게 말해 아무 상관이 없다..
result936<-glm(recur~gene936,family = binomial,data=kyj) #gene936의 유전자형에 따라 재발되는 오즈를 확인한다
summary(result936)
##
## Call:
## glm(formula = recur ~ gene936, family = binomial, data = kyj)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.9269 -0.9269 -0.6231 1.4506 1.8626
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.6225 0.2643 -2.356 0.0185 *
## gene936CT -0.9179 0.5218 -1.759 0.0785 .
## gene936TT -15.9435 1696.7344 -0.009 0.9925
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 117.93 on 98 degrees of freedom
## Residual deviance: 113.20 on 96 degrees of freedom
## AIC: 119.2
##
## Number of Fisher Scoring iterations: 15
여기서 default값은 유전자형 CC이다. 유전자형 CC에 비해서 유전자형 CT는 재발할 오즈가 exp(-0.917)=0.39배이다. 바꿔서 얘기하면 유전자형 CT에 비해 유전자형 CC가 재발할 오즈는 1/0.39=2.54배이다. 하지만 이마저도 통계적으로 유의하지는 않다(p 0.07 )