R studioをインストールする資料 https://www.slideshare.net/secret/m5QIB1XNLsWdeI
動画 lesson1 https://web.microsoftstream.com/video/04e5dcdf-3ee9-447d-af60-2db0a44a3db4
白石先生の資料 http://rpubs.com/wstonemd
個別症例→症例シリーズ→大規模データ
#Directoriを確認する
getwd()
## [1] "C:/Users/ryohe/Desktop/R lecture 2018 by Atsushi Shiraishi"
#使用するcsvをdirectryに入れる
RAdata.import<-file("RA-data-example.csv",encoding="CP932")
RAdata.0<-data.frame(read.csv(RAdata.import,header=T,sep=","))
#全変数が記述される
summary(RAdata.0)
#$で参照することAgeのみが記述される
summary(RAdata.0$age)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 13.00 57.00 66.00 63.97 73.00 102.00
#$で参照することAgeのみが記述される
summary(RAdata.0$sex)
## F M
## 10654 2631
#RQ RA患者において性別で罹病期間が違うか
nrow(RAdata.0) #全体の症例数
## [1] 13285
table(RAdata.0$sex) #性別ごとの症例数
##
## F M
## 10654 2631
#性別ごとの年齢と発症年齢の記述統計
#subset()はAかつBのデータ
summary(subset(RAdata.0$age,RAdata.0$sex=="M"))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 13.0 59.0 67.0 65.7 74.0 93.0
summary(subset(RAdata.0$age,RAdata.0$sex=="F"))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 13.00 56.00 65.00 63.54 73.00 102.00
summary(subset(RAdata.0$age.of.onset,RAdata.0$sex=="M"))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.00 48.00 58.00 56.34 66.00 91.00
summary(subset(RAdata.0$age.of.onset,RAdata.0$sex=="F"))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 40.00 51.00 50.37 61.00 92.00
#文法は違うがsubset()と同じ結果がでる
summary(RAdata.0$age[RAdata.0$sex=="M"])
summary(RAdata.0$age[RAdata.0$sex=="F"])
summary(RAdata.0$age.of.onset[RAdata.0$sex=="M"])
summary(RAdata.0$age.of.onset[RAdata.0$sex=="M"])
#式が長いので短くしたい
#data frameを組み込んでから中の変数を参照する場合にattach()
#組み込みを外す場合はdetach()
attach(RAdata.0)
summary(subset(age,sex=="M"))
detach(RAdata.0)
#with()の中だけdata frameを組み込む場合
with(RAdata.0,summary(subset(age,sex=="M")))
#data frameの読み込み
attach(RAdata.0)
#性別ごとの年齢のヒストグラム
hist(age[sex=="M"])
hist(age[sex=="F"])
#性別ごとの発症年齢のヒストグラム
hist(age.of.onset[sex=="M"])
hist(age.of.onset[sex=="F"])
detach(RAdata.0)
#subset()を使ってもかける
hist(subset(RAdata.0$age,RAdata.0$sex=="M"))
#helpを参照したいとき
#新しい関数を使うときはしょっちゅうです
help(hist)
#罹病期間の変数を新たに作ってdata frameに付け足す
attach(RAdata.0)
RA.duration<-age-age.of.onset
#箱ひげ図を作図
#~は相関を表す記号
boxplot(RA.duration~sex)
#non-parametric test (U-test)
wilcox.test(RA.duration~sex)
##
## Wilcoxon rank sum test with continuity correction
##
## data: RA.duration by sex
## W = 16978000, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
#別のPICOでDMARDの使用頻度に性差はあるか?
#2X2表を作成
xtabs(~dmards+sex)
## sex
## dmards F M
## 43 13
## no 730 204
## yes 9881 2414
#chi二乗検定
chisq.test(xtabs(~dmards+sex))
##
## Pearson's Chi-squared test
##
## data: xtabs(~dmards + sex)
## X-squared = 3.0753, df = 2, p-value = 0.2149