事前準備

R studioをインストールする資料 https://www.slideshare.net/secret/m5QIB1XNLsWdeI
動画 lesson1 https://web.microsoftstream.com/video/04e5dcdf-3ee9-447d-af60-2db0a44a3db4
白石先生の資料 http://rpubs.com/wstonemd

情報は二段階で焼失する

個別症例→症例シリーズ→大規模データ

スプレッドシートの準備

データを用いて練習

#Directoriを確認する
getwd()
## [1] "C:/Users/ryohe/Desktop/R lecture 2018 by Atsushi Shiraishi"
#使用するcsvをdirectryに入れる
RAdata.import<-file("RA-data-example.csv",encoding="CP932")
RAdata.0<-data.frame(read.csv(RAdata.import,header=T,sep=","))
#全変数が記述される
summary(RAdata.0)
#$で参照することAgeのみが記述される
summary(RAdata.0$age) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   13.00   57.00   66.00   63.97   73.00  102.00
#$で参照することAgeのみが記述される
summary(RAdata.0$sex)
##     F     M 
## 10654  2631
#RQ RA患者において性別で罹病期間が違うか
nrow(RAdata.0) #全体の症例数
## [1] 13285
table(RAdata.0$sex) #性別ごとの症例数
## 
##     F     M 
## 10654  2631
#性別ごとの年齢と発症年齢の記述統計
#subset()はAかつBのデータ
summary(subset(RAdata.0$age,RAdata.0$sex=="M"))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    13.0    59.0    67.0    65.7    74.0    93.0
summary(subset(RAdata.0$age,RAdata.0$sex=="F"))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   13.00   56.00   65.00   63.54   73.00  102.00
summary(subset(RAdata.0$age.of.onset,RAdata.0$sex=="M"))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3.00   48.00   58.00   56.34   66.00   91.00
summary(subset(RAdata.0$age.of.onset,RAdata.0$sex=="F"))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00   40.00   51.00   50.37   61.00   92.00
#文法は違うがsubset()と同じ結果がでる
summary(RAdata.0$age[RAdata.0$sex=="M"])
summary(RAdata.0$age[RAdata.0$sex=="F"])
summary(RAdata.0$age.of.onset[RAdata.0$sex=="M"])
summary(RAdata.0$age.of.onset[RAdata.0$sex=="M"])
#式が長いので短くしたい
#data frameを組み込んでから中の変数を参照する場合にattach()
#組み込みを外す場合はdetach()
attach(RAdata.0)
summary(subset(age,sex=="M"))
detach(RAdata.0)
#with()の中だけdata frameを組み込む場合
with(RAdata.0,summary(subset(age,sex=="M")))
#data frameの読み込み
attach(RAdata.0)
#性別ごとの年齢のヒストグラム
hist(age[sex=="M"])

hist(age[sex=="F"])

#性別ごとの発症年齢のヒストグラム
hist(age.of.onset[sex=="M"])

hist(age.of.onset[sex=="F"])

detach(RAdata.0)
#subset()を使ってもかける
hist(subset(RAdata.0$age,RAdata.0$sex=="M"))
#helpを参照したいとき
#新しい関数を使うときはしょっちゅうです
help(hist)
#罹病期間の変数を新たに作ってdata frameに付け足す
attach(RAdata.0)
RA.duration<-age-age.of.onset
#箱ひげ図を作図 
#~は相関を表す記号
boxplot(RA.duration~sex)

#non-parametric test (U-test)
wilcox.test(RA.duration~sex)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  RA.duration by sex
## W = 16978000, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
#別のPICOでDMARDの使用頻度に性差はあるか?
#2X2表を作成
xtabs(~dmards+sex)
##       sex
## dmards    F    M
##          43   13
##    no   730  204
##    yes 9881 2414
#chi二乗検定
chisq.test(xtabs(~dmards+sex))     
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(~dmards + sex)
## X-squared = 3.0753, df = 2, p-value = 0.2149