### データクリーニング前のスクリプトは別にしておく。
pacman::p_load(tidyverse , RSQLite , lubridate, tableone, skimr,rms,ggplot2,
gtsummary,summarytools,naniar,mice,readr,gridExtra,dplyr,
corrplot,missRanger, pROC,devtools,infotheo,kernlab,e1071,
randomForest,rpart,nnet)
df_post_imputation<-read.csv("df_post_imputation.csv", na = c("", " ", "NA"),fileEncoding = "Shift-JIS")
df_post_imputation$整理番号[is.na(df_post_imputation$整理番号)] <- 0
df_missinginclude<-read.csv("df_missinginclude.csv", na = c("", " ", "NA"),fileEncoding = "Shift-JIS")
df_missinginclude$整理番号[is.na(df_missinginclude$整理番号)] <- 0
# 7 開発データ、検証データへの分割
df_imp_test <- df_post_imputation[df_post_imputation$年 %in% c(2016, 2017, 2018, 2019,2020), ]
df_imp_verify <- df_post_imputation[df_post_imputation$年 == 2021, ]
df_miss_test <- df_missinginclude[df_missinginclude$年 %in% c(2016, 2017, 2018, 2019,2020), ]
df_miss_verify <- df_missinginclude[df_missinginclude$年 == 2021, ]
variable_factor<-
c("不妊治療","妊娠前喫煙","妊娠中喫煙","飲酒","パートナー喫煙","パートナー飲酒",
"X.産科合併症.切迫流産.22週未満性器出血.","X.産科合併症.尿路感染症","X.産科合併症.歯周病",
"X.産科合併症.重症悪阻","X.産科合併症.妊娠貧血","X.産科合併症.切迫早産",
"X.産科合併症.頸管無力症","X.産科合併症.頸管長短縮","X.産科合併症.腟内胎胞形成",
"X.産科合併症.縫縮術施行","X.産科合併症.常位胎盤早期剥離","X.産科合併症.妊娠高血圧症候群",
"X.産科合併症.FGR","X.産科合併症.GDM","X.産科合併症.前置胎盤","X.産科合併症.羊水過多","X.産科合併症.羊水過少",
"X.産科合併症.DVT","X.母体産科既往歴.妊娠中の性器出血","X.母体産科既往歴.切迫流産",
"X.母体産科既往歴.常位胎盤早期剥離","X.母体産科既往歴.pPROM",
"X.母体産科既往歴.生殖器感染症","X.母体産科既往歴.死産","X.母体産科既往歴.FGR",
"X.母体産科既往歴.糖尿病.GDM","X.母体基礎疾患.中枢神経系.含む脳血管疾患.",
"X.母体基礎疾患.呼吸器","X.母体基礎疾患.消化器","X.母体基礎疾患.消化器.虫垂炎.",
"X.母体基礎疾患.消化器.胃腸炎.","X.母体基礎疾患.肝.肝炎.","X.母体基礎疾患.腎.泌尿器",
"X.母体基礎疾患.腎.泌尿器.腎炎.","X.母体基礎疾患.腎.泌尿器.腎盂腎炎.","X.母体基礎疾患.血液",
"X.母体基礎疾患.心","X.母体基礎疾患.甲状腺.機能亢進症.","X.母体基礎疾患.甲状腺.機能低下症.",
"X.母体基礎疾患.骨","X.母体基礎疾患.筋肉","X.母体基礎疾患.子宮奇形","X.母体基礎疾患.子宮筋腫",
"X.母体基礎疾患.精神疾患","X.母体基礎疾患.自己免疫疾患","X.母体基礎疾患.本態性高血圧",
"X.母体感染症.クラミジアPCR","X.母体感染症.梅毒","X.母体感染症.トキソプラスマIgM",
"X.母体感染症.サイトメガロ.妊娠中感染.","X.母体感染症.HTLV.1.WB.","X.母体感染症.パルボB19",
"X.母体感染症.細菌性膣症.Nugent.7点.","X.母体使用薬剤.肺成熟目的ステロイド",
"X.母体使用薬剤.甲状腺機能改善薬","X.母体使用薬剤.塩酸リトドリン","X.母体使用薬剤.インスリン",
"X.母体使用薬剤.硫酸マグネシウム","X.母体使用薬剤.アスピリン","X.母体使用薬剤.ヘパリン",
"X.母体使用薬剤.抗Dグロブリン","X.母体使用薬剤.向精神薬","X.母体使用薬剤.Caブロッカー",
"X.母体産科既往歴.妊娠高血圧症","早産歴あり","多胎妊娠","痩せ","肥満","経産婦","X.母体産科既往歴.頸部切除術")
variable_numeric<-
c("経妊回数","経産回数","自然流産回数","早産回数","帝王切開回数",
"人工妊娠中絶回数","X.分娩.分娩時年齢","母身長.cm.","非妊時体重.kg.")
df_imp_test[variable_factor] <-
lapply(df_imp_test[variable_factor], as.factor)
df_miss_test[variable_factor] <-
lapply(df_miss_test[variable_factor], as.factor)
df_imp_verify[variable_factor] <-
lapply(df_imp_verify[variable_factor], as.factor)
df_miss_verify[variable_factor] <-
lapply(df_miss_verify[variable_factor], as.factor)
df_imp_test[variable_numeric] <- lapply(df_imp_test[variable_numeric], as.numeric)
df_miss_test[variable_numeric] <- lapply(df_miss_test[variable_numeric], as.numeric)
df_imp_verify[variable_numeric] <- lapply(df_imp_verify[variable_numeric], as.numeric)
df_miss_verify[variable_numeric] <- lapply(df_miss_verify[variable_numeric], as.numeric)
sapply(df_imp_test,class)
## 不妊治療
## "factor"
## 年度
## "integer"
## 経妊回数
## "numeric"
## 経産回数
## "numeric"
## 早産回数
## "numeric"
## 帝王切開回数
## "numeric"
## 自然流産回数
## "numeric"
## 人工妊娠中絶回数
## "numeric"
## 母身長.cm.
## "numeric"
## 非妊時体重.kg.
## "numeric"
## X.分娩.分娩時年齢
## "numeric"
## 妊娠前喫煙
## "factor"
## 妊娠中喫煙
## "factor"
## 飲酒
## "factor"
## パートナー喫煙
## "factor"
## パートナー飲酒
## "factor"
## X.産科合併症.切迫流産.22週未満性器出血.
## "factor"
## X.産科合併症.尿路感染症
## "factor"
## X.産科合併症.歯周病
## "factor"
## X.産科合併症.重症悪阻
## "factor"
## X.産科合併症.妊娠貧血
## "factor"
## X.産科合併症.切迫早産
## "factor"
## X.産科合併症.頸管無力症
## "factor"
## X.産科合併症.頸管長短縮
## "factor"
## X.産科合併症.腟内胎胞形成
## "factor"
## X.産科合併症.縫縮術施行
## "factor"
## X.産科合併症.常位胎盤早期剥離
## "factor"
## X.産科合併症.妊娠高血圧症候群
## "factor"
## X.産科合併症.FGR
## "factor"
## X.産科合併症.GDM
## "factor"
## X.産科合併症.前置胎盤
## "factor"
## X.産科合併症.羊水過多
## "factor"
## X.産科合併症.羊水過少
## "factor"
## X.産科合併症.DVT
## "factor"
## X.母体産科既往歴.妊娠中の性器出血
## "factor"
## X.母体産科既往歴.切迫流産
## "factor"
## X.母体産科既往歴.常位胎盤早期剥離
## "factor"
## X.母体産科既往歴.pPROM
## "factor"
## X.母体産科既往歴.生殖器感染症
## "factor"
## X.母体産科既往歴.死産
## "factor"
## X.母体産科既往歴.FGR
## "factor"
## X.母体産科既往歴.糖尿病.GDM
## "factor"
## X.母体基礎疾患.中枢神経系.含む脳血管疾患.
## "factor"
## X.母体基礎疾患.呼吸器
## "factor"
## X.母体基礎疾患.消化器
## "factor"
## X.母体基礎疾患.消化器.虫垂炎.
## "factor"
## X.母体基礎疾患.消化器.胃腸炎.
## "factor"
## X.母体基礎疾患.肝.肝炎.
## "factor"
## X.母体基礎疾患.腎.泌尿器
## "factor"
## X.母体基礎疾患.腎.泌尿器.腎炎.
## "factor"
## X.母体基礎疾患.腎.泌尿器.腎盂腎炎.
## "factor"
## X.母体基礎疾患.血液
## "factor"
## X.母体基礎疾患.心
## "factor"
## X.母体基礎疾患.甲状腺.機能亢進症.
## "factor"
## X.母体基礎疾患.甲状腺.機能低下症.
## "factor"
## X.母体基礎疾患.骨
## "factor"
## X.母体基礎疾患.筋肉
## "factor"
## X.母体基礎疾患.子宮奇形
## "factor"
## X.母体基礎疾患.子宮筋腫
## "factor"
## X.母体基礎疾患.精神疾患
## "factor"
## X.母体基礎疾患.自己免疫疾患
## "factor"
## X.母体基礎疾患.本態性高血圧
## "factor"
## X.母体感染症.クラミジアPCR
## "factor"
## X.母体感染症.梅毒
## "factor"
## X.母体感染症.トキソプラスマIgM
## "factor"
## X.母体感染症.サイトメガロ.妊娠中感染.
## "factor"
## X.母体感染症.HTLV.1.WB.
## "factor"
## X.母体感染症.パルボB19
## "factor"
## X.母体感染症.細菌性膣症.Nugent.7点.
## "factor"
## X.母体使用薬剤.肺成熟目的ステロイド
## "factor"
## X.母体使用薬剤.甲状腺機能改善薬
## "factor"
## X.母体使用薬剤.塩酸リトドリン
## "factor"
## X.母体使用薬剤.インスリン
## "factor"
## X.母体使用薬剤.硫酸マグネシウム
## "factor"
## X.母体使用薬剤.アスピリン
## "factor"
## X.母体使用薬剤.ヘパリン
## "factor"
## X.母体使用薬剤.抗Dグロブリン
## "factor"
## X.母体使用薬剤.向精神薬
## "factor"
## X.母体使用薬剤.Caブロッカー
## "factor"
## X.母体産科既往歴.妊娠高血圧症
## "factor"
## 早産歴あり
## "factor"
## 多胎妊娠
## "factor"
## 痩せ
## "factor"
## 肥満
## "factor"
## 経産婦
## "factor"
## X.母体産科既往歴.頸部切除術
## "factor"
## 年
## "integer"
## 施設の所在地
## "character"
## 施設別通し番号
## "integer"
## 整理番号
## "numeric"
sapply(df_miss_test,class)
## 不妊治療
## "factor"
## 年度
## "integer"
## 経妊回数
## "numeric"
## 経産回数
## "numeric"
## 早産回数
## "numeric"
## 帝王切開回数
## "numeric"
## 自然流産回数
## "numeric"
## 人工妊娠中絶回数
## "numeric"
## 母身長.cm.
## "numeric"
## 非妊時体重.kg.
## "numeric"
## X.分娩.分娩時年齢
## "numeric"
## 妊娠前喫煙
## "factor"
## 妊娠中喫煙
## "factor"
## 飲酒
## "factor"
## パートナー喫煙
## "factor"
## パートナー飲酒
## "factor"
## X.産科合併症.切迫流産.22週未満性器出血.
## "factor"
## X.産科合併症.尿路感染症
## "factor"
## X.産科合併症.歯周病
## "factor"
## X.産科合併症.重症悪阻
## "factor"
## X.産科合併症.妊娠貧血
## "factor"
## X.産科合併症.切迫早産
## "factor"
## X.産科合併症.頸管無力症
## "factor"
## X.産科合併症.頸管長短縮
## "factor"
## X.産科合併症.腟内胎胞形成
## "factor"
## X.産科合併症.縫縮術施行
## "factor"
## X.産科合併症.常位胎盤早期剥離
## "factor"
## X.産科合併症.妊娠高血圧症候群
## "factor"
## X.産科合併症.FGR
## "factor"
## X.産科合併症.GDM
## "factor"
## X.産科合併症.前置胎盤
## "factor"
## X.産科合併症.羊水過多
## "factor"
## X.産科合併症.羊水過少
## "factor"
## X.産科合併症.DVT
## "factor"
## X.母体産科既往歴.妊娠中の性器出血
## "factor"
## X.母体産科既往歴.切迫流産
## "factor"
## X.母体産科既往歴.常位胎盤早期剥離
## "factor"
## X.母体産科既往歴.pPROM
## "factor"
## X.母体産科既往歴.生殖器感染症
## "factor"
## X.母体産科既往歴.死産
## "factor"
## X.母体産科既往歴.FGR
## "factor"
## X.母体産科既往歴.糖尿病.GDM
## "factor"
## X.母体基礎疾患.中枢神経系.含む脳血管疾患.
## "factor"
## X.母体基礎疾患.呼吸器
## "factor"
## X.母体基礎疾患.消化器
## "factor"
## X.母体基礎疾患.消化器.虫垂炎.
## "factor"
## X.母体基礎疾患.消化器.胃腸炎.
## "factor"
## X.母体基礎疾患.肝.肝炎.
## "factor"
## X.母体基礎疾患.腎.泌尿器
## "factor"
## X.母体基礎疾患.腎.泌尿器.腎炎.
## "factor"
## X.母体基礎疾患.腎.泌尿器.腎盂腎炎.
## "factor"
## X.母体基礎疾患.血液
## "factor"
## X.母体基礎疾患.心
## "factor"
## X.母体基礎疾患.甲状腺.機能亢進症.
## "factor"
## X.母体基礎疾患.甲状腺.機能低下症.
## "factor"
## X.母体基礎疾患.骨
## "factor"
## X.母体基礎疾患.筋肉
## "factor"
## X.母体基礎疾患.子宮奇形
## "factor"
## X.母体基礎疾患.子宮筋腫
## "factor"
## X.母体基礎疾患.精神疾患
## "factor"
## X.母体基礎疾患.自己免疫疾患
## "factor"
## X.母体基礎疾患.本態性高血圧
## "factor"
## X.母体感染症.クラミジアPCR
## "factor"
## X.母体感染症.梅毒
## "factor"
## X.母体感染症.トキソプラスマIgM
## "factor"
## X.母体感染症.サイトメガロ.妊娠中感染.
## "factor"
## X.母体感染症.HTLV.1.WB.
## "factor"
## X.母体感染症.パルボB19
## "factor"
## X.母体感染症.細菌性膣症.Nugent.7点.
## "factor"
## X.母体使用薬剤.肺成熟目的ステロイド
## "factor"
## X.母体使用薬剤.甲状腺機能改善薬
## "factor"
## X.母体使用薬剤.塩酸リトドリン
## "factor"
## X.母体使用薬剤.インスリン
## "factor"
## X.母体使用薬剤.硫酸マグネシウム
## "factor"
## X.母体使用薬剤.アスピリン
## "factor"
## X.母体使用薬剤.ヘパリン
## "factor"
## X.母体使用薬剤.抗Dグロブリン
## "factor"
## X.母体使用薬剤.向精神薬
## "factor"
## X.母体使用薬剤.Caブロッカー
## "factor"
## X.母体産科既往歴.妊娠高血圧症
## "factor"
## 早産歴あり
## "factor"
## 多胎妊娠
## "factor"
## 痩せ
## "factor"
## 肥満
## "factor"
## 経産婦
## "factor"
## X.母体産科既往歴.頸部切除術
## "factor"
## 年
## "integer"
## 施設の所在地
## "character"
## 施設別通し番号
## "integer"
## 整理番号
## "numeric"
# 8.ロジスティック
# 8-1. ロジスティック回帰分析,欠測補完あり,ステップワイズ
glm_variables<-c("不妊治療","妊娠前喫煙","妊娠中喫煙","飲酒","パートナー喫煙","パートナー飲酒",
"X.産科合併症.歯周病","X.産科合併症.重症悪阻","X.産科合併症.切迫早産","X.産科合併症.妊娠高血圧症候群",
"X.産科合併症.FGR","X.産科合併症.前置胎盤",
"X.産科合併症.羊水過多","X.産科合併症.羊水過少","X.母体産科既往歴.妊娠中の性器出血",
"X.母体産科既往歴.常位胎盤早期剥離","X.母体産科既往歴.死産",
"X.母体産科既往歴.FGR","X.母体基礎疾患.甲状腺.機能低下症.","X.母体基礎疾患.子宮奇形",
"X.母体基礎疾患.本態性高血圧","X.母体使用薬剤.肺成熟目的ステロイド","X.母体使用薬剤.アスピリン",
"X.母体基礎疾患.自己免疫疾患","X.母体基礎疾患.精神疾患","多胎妊娠","早産歴あり",
"X.母体使用薬剤.ヘパリン","X.母体使用薬剤.Caブロッカー","X.母体産科既往歴.妊娠高血圧症",
"痩せ","肥満","経産婦")
sapply(glm_variables,class)
## 不妊治療 妊娠前喫煙
## "character" "character"
## 妊娠中喫煙 飲酒
## "character" "character"
## パートナー喫煙 パートナー飲酒
## "character" "character"
## X.産科合併症.歯周病 X.産科合併症.重症悪阻
## "character" "character"
## X.産科合併症.切迫早産 X.産科合併症.妊娠高血圧症候群
## "character" "character"
## X.産科合併症.FGR X.産科合併症.前置胎盤
## "character" "character"
## X.産科合併症.羊水過多 X.産科合併症.羊水過少
## "character" "character"
## X.母体産科既往歴.妊娠中の性器出血 X.母体産科既往歴.常位胎盤早期剥離
## "character" "character"
## X.母体産科既往歴.死産 X.母体産科既往歴.FGR
## "character" "character"
## X.母体基礎疾患.甲状腺.機能低下症. X.母体基礎疾患.子宮奇形
## "character" "character"
## X.母体基礎疾患.本態性高血圧 X.母体使用薬剤.肺成熟目的ステロイド
## "character" "character"
## X.母体使用薬剤.アスピリン X.母体基礎疾患.自己免疫疾患
## "character" "character"
## X.母体基礎疾患.精神疾患 多胎妊娠
## "character" "character"
## 早産歴あり X.母体使用薬剤.ヘパリン
## "character" "character"
## X.母体使用薬剤.Caブロッカー X.母体産科既往歴.妊娠高血圧症
## "character" "character"
## 痩せ 肥満
## "character" "character"
## 経産婦
## "character"
colnames(df_imp_test)
## [1] "不妊治療"
## [2] "年度"
## [3] "経妊回数"
## [4] "経産回数"
## [5] "早産回数"
## [6] "帝王切開回数"
## [7] "自然流産回数"
## [8] "人工妊娠中絶回数"
## [9] "母身長.cm."
## [10] "非妊時体重.kg."
## [11] "X.分娩.分娩時年齢"
## [12] "妊娠前喫煙"
## [13] "妊娠中喫煙"
## [14] "飲酒"
## [15] "パートナー喫煙"
## [16] "パートナー飲酒"
## [17] "X.産科合併症.切迫流産.22週未満性器出血."
## [18] "X.産科合併症.尿路感染症"
## [19] "X.産科合併症.歯周病"
## [20] "X.産科合併症.重症悪阻"
## [21] "X.産科合併症.妊娠貧血"
## [22] "X.産科合併症.切迫早産"
## [23] "X.産科合併症.頸管無力症"
## [24] "X.産科合併症.頸管長短縮"
## [25] "X.産科合併症.腟内胎胞形成"
## [26] "X.産科合併症.縫縮術施行"
## [27] "X.産科合併症.常位胎盤早期剥離"
## [28] "X.産科合併症.妊娠高血圧症候群"
## [29] "X.産科合併症.FGR"
## [30] "X.産科合併症.GDM"
## [31] "X.産科合併症.前置胎盤"
## [32] "X.産科合併症.羊水過多"
## [33] "X.産科合併症.羊水過少"
## [34] "X.産科合併症.DVT"
## [35] "X.母体産科既往歴.妊娠中の性器出血"
## [36] "X.母体産科既往歴.切迫流産"
## [37] "X.母体産科既往歴.常位胎盤早期剥離"
## [38] "X.母体産科既往歴.pPROM"
## [39] "X.母体産科既往歴.生殖器感染症"
## [40] "X.母体産科既往歴.死産"
## [41] "X.母体産科既往歴.FGR"
## [42] "X.母体産科既往歴.糖尿病.GDM"
## [43] "X.母体基礎疾患.中枢神経系.含む脳血管疾患."
## [44] "X.母体基礎疾患.呼吸器"
## [45] "X.母体基礎疾患.消化器"
## [46] "X.母体基礎疾患.消化器.虫垂炎."
## [47] "X.母体基礎疾患.消化器.胃腸炎."
## [48] "X.母体基礎疾患.肝.肝炎."
## [49] "X.母体基礎疾患.腎.泌尿器"
## [50] "X.母体基礎疾患.腎.泌尿器.腎炎."
## [51] "X.母体基礎疾患.腎.泌尿器.腎盂腎炎."
## [52] "X.母体基礎疾患.血液"
## [53] "X.母体基礎疾患.心"
## [54] "X.母体基礎疾患.甲状腺.機能亢進症."
## [55] "X.母体基礎疾患.甲状腺.機能低下症."
## [56] "X.母体基礎疾患.骨"
## [57] "X.母体基礎疾患.筋肉"
## [58] "X.母体基礎疾患.子宮奇形"
## [59] "X.母体基礎疾患.子宮筋腫"
## [60] "X.母体基礎疾患.精神疾患"
## [61] "X.母体基礎疾患.自己免疫疾患"
## [62] "X.母体基礎疾患.本態性高血圧"
## [63] "X.母体感染症.クラミジアPCR"
## [64] "X.母体感染症.梅毒"
## [65] "X.母体感染症.トキソプラスマIgM"
## [66] "X.母体感染症.サイトメガロ.妊娠中感染."
## [67] "X.母体感染症.HTLV.1.WB."
## [68] "X.母体感染症.パルボB19"
## [69] "X.母体感染症.細菌性膣症.Nugent.7点."
## [70] "X.母体使用薬剤.肺成熟目的ステロイド"
## [71] "X.母体使用薬剤.甲状腺機能改善薬"
## [72] "X.母体使用薬剤.塩酸リトドリン"
## [73] "X.母体使用薬剤.インスリン"
## [74] "X.母体使用薬剤.硫酸マグネシウム"
## [75] "X.母体使用薬剤.アスピリン"
## [76] "X.母体使用薬剤.ヘパリン"
## [77] "X.母体使用薬剤.抗Dグロブリン"
## [78] "X.母体使用薬剤.向精神薬"
## [79] "X.母体使用薬剤.Caブロッカー"
## [80] "X.母体産科既往歴.妊娠高血圧症"
## [81] "早産歴あり"
## [82] "多胎妊娠"
## [83] "痩せ"
## [84] "肥満"
## [85] "経産婦"
## [86] "X.母体産科既往歴.頸部切除術"
## [87] "年"
## [88] "施設の所在地"
## [89] "施設別通し番号"
## [90] "整理番号"
model_8.1_pre <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠前喫煙+妊娠中喫煙+飲酒+パートナー喫煙+
パートナー飲酒+X.産科合併症.歯周病+X.産科合併症.重症悪阻+X.産科合併症.切迫早産+
X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.前置胎盤+
X.産科合併症.羊水過多+X.産科合併症.羊水過少+X.母体産科既往歴.妊娠中の性器出血+
X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
X.母体基礎疾患.甲状腺.機能低下症.+X.母体基礎疾患.子宮奇形+
X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.肺成熟目的ステロイド+
X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+X.母体基礎疾患.精神疾患+
多胎妊娠+早産歴あり+X.母体使用薬剤.ヘパリン+X.母体使用薬剤.Caブロッカー+
X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
family=binomial, data=df_imp_test)
model_8.1_pre
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー喫煙 +
## パートナー飲酒 + X.産科合併症.歯周病 + X.産科合併症.重症悪阻 +
## X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 +
## X.産科合併症.FGR + X.産科合併症.前置胎盤 +
## X.産科合併症.羊水過多 + X.産科合併症.羊水過少 +
## X.母体産科既往歴.妊娠中の性器出血 + X.母体産科既往歴.常位胎盤早期剥離 +
## X.母体産科既往歴.死産 + X.母体産科既往歴.FGR +
## X.母体基礎疾患.甲状腺.機能低下症. + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.自己免疫疾患 +
## X.母体基礎疾患.精神疾患 + 多胎妊娠 + 早産歴あり +
## X.母体使用薬剤.ヘパリン + X.母体使用薬剤.Caブロッカー +
## X.母体産科既往歴.妊娠高血圧症 + 痩せ + 肥満 +
## 経産婦, family = binomial, data = df_imp_test)
##
## Coefficients:
## (Intercept) 不妊治療2
## -4.88201 0.05940
## 不妊治療3 妊娠前喫煙1
## -0.11581 -0.08167
## 妊娠中喫煙1 飲酒1
## 0.32001 0.11187
## パートナー喫煙1 パートナー飲酒1
## -0.04255 -0.13062
## X.産科合併症.歯周病1 X.産科合併症.重症悪阻1
## -0.20212 -0.50095
## X.産科合併症.切迫早産1 X.産科合併症.妊娠高血圧症候群1
## 0.40491 0.58603
## X.産科合併症.FGR1 X.産科合併症.前置胎盤1
## 0.53336 -0.72752
## X.産科合併症.羊水過多1 X.産科合併症.羊水過少1
## 0.36663 0.24013
## X.母体産科既往歴.妊娠中の性器出血1 X.母体産科既往歴.常位胎盤早期剥離1
## -0.38831 1.65311
## X.母体産科既往歴.死産1 X.母体産科既往歴.FGR1
## 0.07573 -0.04828
## X.母体基礎疾患.甲状腺.機能低下症.1 X.母体基礎疾患.子宮奇形1
## -0.04389 0.52271
## X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1
## 0.21617 0.87014
## X.母体使用薬剤.アスピリン1 X.母体基礎疾患.自己免疫疾患1
## -0.21286 0.08146
## X.母体基礎疾患.精神疾患1 多胎妊娠1
## -0.09901 -0.70965
## 早産歴あり1 X.母体使用薬剤.ヘパリン1
## 0.18007 0.46559
## X.母体使用薬剤.Caブロッカー1 X.母体産科既往歴.妊娠高血圧症1
## 0.16863 0.21576
## 痩せ1 肥満1
## 0.01805 -0.03733
## 経産婦1
## 0.06705
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053907 Residual
## Null Deviance: 112100
## Residual Deviance: 109400 AIC: 109500
results <- data.frame()
## χ二乗統計量やp値や自由度計算する
# for (var in glm_variables) {
# fit <- glm(formula(paste("X.産科合併症.常位胎盤早期剥離 ~", var)), data = df_imp_test, family = binomial(link = "logit"))
# anova_res <- anova(fit, test = "Chisq")
# chi2 <- round(anova_res$Deviance[2], 4)
# df <- anova_res$Df[2]
# coef_table <- summary(fit)$coefficients
# OR <- round(exp(coef_table[2, 1]), 4)
# lower_ci <- round(exp(coef_table[2, 1] - 1.96 * coef_table[2, 2]), 4)
# upper_ci <- round(exp(coef_table[2, 1] + 1.96 * coef_table[2, 2]), 4)
# wald_p_value <- round(coef_table[2, 4], 4)
# temp_df <- data.frame(Variable = var, Chi2 = chi2, Df = df, P_value = wald_p_value, Odds_Ratio = OR, Lower_CI = lower_ci, Upper_CI = upper_ci)
# results <- rbind(results, temp_df)
# }
print(results)
## 0 列 0 行のデータフレーム
# write.csv(results, file = "logistic_imp_prestep.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)
## stepwiseで変数を選択する
# logistic_imp_step <- step(model_glm_imp, direction = "both", trace = 1)
# saveRDS(logistic_imp_step, file = "final_model.rds")
model_8.1<-readRDS("final_model.rds")
model_8.1
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 +
## X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 +
## X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR +
## X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 +
## X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 +
## 多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン +
## X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 +
## 経産婦, family = binomial, data = df_imp_test)
##
## Coefficients:
## (Intercept) 不妊治療2
## -4.88451 0.05859
## 不妊治療3 妊娠前喫煙1
## -0.11660 -0.09630
## 妊娠中喫煙1 飲酒1
## 0.30793 0.11399
## パートナー飲酒1 X.産科合併症.重症悪阻1
## -0.14050 -0.50166
## X.産科合併症.切迫早産1 X.産科合併症.妊娠高血圧症候群1
## 0.40557 0.58221
## X.産科合併症.FGR1 X.産科合併症.前置胎盤1
## 0.53271 -0.72799
## X.産科合併症.羊水過多1 X.産科合併症.羊水過少1
## 0.36530 0.23873
## X.母体産科既往歴.妊娠中の性器出血1 X.母体産科既往歴.常位胎盤早期剥離1
## -0.39744 1.66210
## X.母体基礎疾患.子宮奇形1 X.母体基礎疾患.本態性高血圧1
## 0.52349 0.20798
## X.母体使用薬剤.肺成熟目的ステロイド1 X.母体使用薬剤.アスピリン1
## 0.86995 -0.20207
## X.母体基礎疾患.精神疾患1 多胎妊娠1
## -0.09930 -0.70981
## 早産歴あり1 X.母体使用薬剤.ヘパリン1
## 0.18055 0.47000
## X.母体使用薬剤.Caブロッカー1 X.母体産科既往歴.妊娠高血圧症1
## 0.16787 0.20949
## 経産婦1
## 0.06595
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053915 Residual
## Null Deviance: 112100
## Residual Deviance: 109400 AIC: 109500
# 最終的な選択されたモデルを表示
summary(model_8.1)
##
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 +
## X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 +
## X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR +
## X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 +
## X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 +
## 多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン +
## X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 +
## 経産婦, family = binomial, data = df_imp_test)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.88451 0.01848 -264.265 < 2e-16 ***
## 不妊治療2 0.05859 0.03764 1.557 0.119496
## 不妊治療3 -0.11660 0.03820 -3.053 0.002268 **
## 妊娠前喫煙1 -0.09630 0.03326 -2.895 0.003791 **
## 妊娠中喫煙1 0.30793 0.05464 5.636 1.74e-08 ***
## 飲酒1 0.11399 0.04928 2.313 0.020724 *
## パートナー飲酒1 -0.14050 0.02740 -5.127 2.94e-07 ***
## X.産科合併症.重症悪阻1 -0.50166 0.12691 -3.953 7.72e-05 ***
## X.産科合併症.切迫早産1 0.40557 0.02520 16.095 < 2e-16 ***
## X.産科合併症.妊娠高血圧症候群1 0.58221 0.03658 15.917 < 2e-16 ***
## X.産科合併症.FGR1 0.53271 0.03906 13.637 < 2e-16 ***
## X.産科合併症.前置胎盤1 -0.72799 0.11303 -6.441 1.19e-10 ***
## X.産科合併症.羊水過多1 0.36530 0.09868 3.702 0.000214 ***
## X.産科合併症.羊水過少1 0.23873 0.06374 3.745 0.000180 ***
## X.母体産科既往歴.妊娠中の性器出血1 -0.39744 0.19769 -2.010 0.044385 *
## X.母体産科既往歴.常位胎盤早期剥離1 1.66210 0.07042 23.603 < 2e-16 ***
## X.母体基礎疾患.子宮奇形1 0.52349 0.11352 4.611 4.00e-06 ***
## X.母体基礎疾患.本態性高血圧1 0.20798 0.08111 2.564 0.010346 *
## X.母体使用薬剤.肺成熟目的ステロイド1 0.86995 0.03823 22.757 < 2e-16 ***
## X.母体使用薬剤.アスピリン1 -0.20207 0.09588 -2.107 0.035082 *
## X.母体基礎疾患.精神疾患1 -0.09930 0.05882 -1.688 0.091351 .
## 多胎妊娠1 -0.70981 0.05087 -13.953 < 2e-16 ***
## 早産歴あり1 0.18055 0.05077 3.556 0.000376 ***
## X.母体使用薬剤.ヘパリン1 0.47000 0.06638 7.080 1.44e-12 ***
## X.母体使用薬剤.Caブロッカー1 0.16787 0.05214 3.219 0.001285 **
## X.母体産科既往歴.妊娠高血圧症1 0.20949 0.05578 3.755 0.000173 ***
## 経産婦1 0.06595 0.02144 3.076 0.002095 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 112082 on 1053941 degrees of freedom
## Residual deviance: 109421 on 1053915 degrees of freedom
## AIC: 109475
##
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_8.1 <- predict(model_8.1, type = "response")
roc_8.1 <- roc(df_imp_test$X.産科合併症.常位胎盤早期剥離, prediction_8.1)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.1)
## Area under the curve: 0.6264
## 検証用データにあてはめる。
prediction_8.1_verify<- predict(model_8.1, newdata = df_imp_verify, type = "response")
roc_8.1_verify <- roc(df_imp_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.1_verify)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.1_verify)
## Area under the curve: 0.6126
## vifを計算
vif_8.1 <- vif(model_8.1)
vif_8.1
## 不妊治療2 不妊治療3
## 1.042526 1.040311
## 妊娠前喫煙1 妊娠中喫煙1
## 1.227823 1.224690
## 飲酒1 パートナー飲酒1
## 1.027260 1.032449
## X.産科合併症.重症悪阻1 X.産科合併症.切迫早産1
## 1.001040 1.141672
## X.産科合併症.妊娠高血圧症候群1 X.産科合併症.FGR1
## 1.389210 1.130779
## X.産科合併症.前置胎盤1 X.産科合併症.羊水過多1
## 1.006873 1.006441
## X.産科合併症.羊水過少1 X.母体産科既往歴.妊娠中の性器出血1
## 1.042684 1.046917
## X.母体産科既往歴.常位胎盤早期剥離1 X.母体基礎疾患.子宮奇形1
## 1.117554 1.003245
## X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1
## 1.090491 1.202293
## X.母体使用薬剤.アスピリン1 X.母体基礎疾患.精神疾患1
## 1.068691 1.003401
## 多胎妊娠1 早産歴あり1
## 1.081255 1.128692
## X.母体使用薬剤.ヘパリン1 X.母体使用薬剤.Caブロッカー1
## 1.066053 1.326646
## X.母体産科既往歴.妊娠高血圧症1 経産婦1
## 1.138819 1.120676
# write.csv(vif_8.1, file = "vif_8.1.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)
# calibration plotを描く
prediction_8.1_calib <- predict(model_8.1, newdata = df_imp_verify, type = 'response')
## 注意!!calibration plotは、outcomeがnumericでないとできない!!
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
class(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.1_calib, y=df_imp_verify$X.産科合併症.常位胎盤早期剥離,g=10)
## Dxy C (ROC) R2 D D:Chi-sq
## 2.248575e-01 6.124288e-01 2.072791e-02 2.208640e-03 4.718202e+02
## D:p U U:Chi-sq U:p Q
## NA 9.485753e+00 2.022099e+06 0.000000e+00 -9.483544e+00
## Brier Intercept Slope Emax E90
## 1.010733e+00 -5.296658e-01 8.734430e-01 1.003696e+00 1.001833e+00
## Eavg S:z S:p
## 1.000832e+00 4.775380e+03 0.000000e+00
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
# png("calibration_plot_8.1.png", width = 800, height = 600)
# val.prob(p = prediction_8.1_calib, y = df_imp_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()
# 8.2 ロジスティック回帰,欠測補完なし,ステップワイズ
model_8.2_pre <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠前喫煙+妊娠中喫煙+飲酒+パートナー喫煙+
パートナー飲酒+X.産科合併症.歯周病+X.産科合併症.重症悪阻+X.産科合併症.切迫早産+
X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.前置胎盤+
X.産科合併症.羊水過多+X.産科合併症.羊水過少+X.母体産科既往歴.妊娠中の性器出血+
X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
X.母体基礎疾患.甲状腺.機能低下症.+X.母体基礎疾患.子宮奇形+
X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.肺成熟目的ステロイド+
X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+X.母体基礎疾患.精神疾患+
多胎妊娠+早産歴あり+X.母体使用薬剤.ヘパリン+X.母体使用薬剤.Caブロッカー+
X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
family=binomial, data=df_miss_test)
model_8.2_pre
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー喫煙 +
## パートナー飲酒 + X.産科合併症.歯周病 + X.産科合併症.重症悪阻 +
## X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 +
## X.産科合併症.FGR + X.産科合併症.前置胎盤 +
## X.産科合併症.羊水過多 + X.産科合併症.羊水過少 +
## X.母体産科既往歴.妊娠中の性器出血 + X.母体産科既往歴.常位胎盤早期剥離 +
## X.母体産科既往歴.死産 + X.母体産科既往歴.FGR +
## X.母体基礎疾患.甲状腺.機能低下症. + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.自己免疫疾患 +
## X.母体基礎疾患.精神疾患 + 多胎妊娠 + 早産歴あり +
## X.母体使用薬剤.ヘパリン + X.母体使用薬剤.Caブロッカー +
## X.母体産科既往歴.妊娠高血圧症 + 痩せ + 肥満 +
## 経産婦, family = binomial, data = df_miss_test)
##
## Coefficients:
## (Intercept) 不妊治療2
## -4.88201 0.05940
## 不妊治療3 妊娠前喫煙1
## -0.11581 -0.08167
## 妊娠中喫煙1 飲酒1
## 0.32001 0.11187
## パートナー喫煙1 パートナー飲酒1
## -0.04255 -0.13062
## X.産科合併症.歯周病1 X.産科合併症.重症悪阻1
## -0.20212 -0.50095
## X.産科合併症.切迫早産1 X.産科合併症.妊娠高血圧症候群1
## 0.40491 0.58603
## X.産科合併症.FGR1 X.産科合併症.前置胎盤1
## 0.53336 -0.72752
## X.産科合併症.羊水過多1 X.産科合併症.羊水過少1
## 0.36663 0.24013
## X.母体産科既往歴.妊娠中の性器出血1 X.母体産科既往歴.常位胎盤早期剥離1
## -0.38831 1.65311
## X.母体産科既往歴.死産1 X.母体産科既往歴.FGR1
## 0.07573 -0.04828
## X.母体基礎疾患.甲状腺.機能低下症.1 X.母体基礎疾患.子宮奇形1
## -0.04389 0.52271
## X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1
## 0.21617 0.87014
## X.母体使用薬剤.アスピリン1 X.母体基礎疾患.自己免疫疾患1
## -0.21286 0.08146
## X.母体基礎疾患.精神疾患1 多胎妊娠1
## -0.09901 -0.70965
## 早産歴あり1 X.母体使用薬剤.ヘパリン1
## 0.18007 0.46559
## X.母体使用薬剤.Caブロッカー1 X.母体産科既往歴.妊娠高血圧症1
## 0.16863 0.21576
## 痩せ1 肥満1
## 0.01805 -0.03733
## 経産婦1
## 0.06705
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053907 Residual
## Null Deviance: 112100
## Residual Deviance: 109400 AIC: 109500
results_miss <- data.frame()
## χ二乗統計量やp値や自由度計算する
# for (var in glm_variables) {
# fit <- glm(formula(paste("X.産科合併症.常位胎盤早期剥離 ~", var)), data = df_miss_test, family = binomial(link = "logit"))
# anova_res <- anova(fit, test = "Chisq")
# chi2 <- round(anova_res$Deviance[2], 4)
# df <- anova_res$Df[2]
# coef_table <- summary(fit)$coefficients
# OR <- round(exp(coef_table[2, 1]), 4)
# lower_ci <- round(exp(coef_table[2, 1] - 1.96 * coef_table[2, 2]), 4)
# upper_ci <- round(exp(coef_table[2, 1] + 1.96 * coef_table[2, 2]), 4)
# wald_p_value <- round(coef_table[2, 4], 4)
# temp_df_miss <- data.frame(Variable = var, Chi2 = chi2, Df = df, P_value = wald_p_value, Odds_Ratio = OR, Lower_CI = lower_ci, Upper_CI = upper_ci)
# results_miss <- rbind(results_miss, temp_df)
# }
# print(results_miss)
# write.csv(results_miss, file = "logistic_miss_prestep.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)
## stepwiseで変数を選択する
# logistic_miss_step <- step(model_glm_miss, direction = "both", trace = 1)
# saveRDS(logistic_miss_step, file = "logistic_miss_step.rds")
model_8.2<-readRDS("logistic_miss_step.rds")
model_8.2
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 +
## X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 +
## X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR +
## X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 +
## X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 +
## 多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン +
## X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 +
## 経産婦, family = binomial, data = df_miss_test)
##
## Coefficients:
## (Intercept) 不妊治療2
## -4.88451 0.05859
## 不妊治療3 妊娠前喫煙1
## -0.11660 -0.09630
## 妊娠中喫煙1 飲酒1
## 0.30793 0.11399
## パートナー飲酒1 X.産科合併症.重症悪阻1
## -0.14050 -0.50166
## X.産科合併症.切迫早産1 X.産科合併症.妊娠高血圧症候群1
## 0.40557 0.58221
## X.産科合併症.FGR1 X.産科合併症.前置胎盤1
## 0.53271 -0.72799
## X.産科合併症.羊水過多1 X.産科合併症.羊水過少1
## 0.36530 0.23873
## X.母体産科既往歴.妊娠中の性器出血1 X.母体産科既往歴.常位胎盤早期剥離1
## -0.39744 1.66210
## X.母体基礎疾患.子宮奇形1 X.母体基礎疾患.本態性高血圧1
## 0.52349 0.20798
## X.母体使用薬剤.肺成熟目的ステロイド1 X.母体使用薬剤.アスピリン1
## 0.86995 -0.20207
## X.母体基礎疾患.精神疾患1 多胎妊娠1
## -0.09930 -0.70981
## 早産歴あり1 X.母体使用薬剤.ヘパリン1
## 0.18055 0.47000
## X.母体使用薬剤.Caブロッカー1 X.母体産科既往歴.妊娠高血圧症1
## 0.16787 0.20949
## 経産婦1
## 0.06595
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053915 Residual
## Null Deviance: 112100
## Residual Deviance: 109400 AIC: 109500
# 最終的な選択されたモデルを表示
summary(model_8.2)
##
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 +
## X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 +
## X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR +
## X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 +
## X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 +
## X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド +
## X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 +
## 多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン +
## X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 +
## 経産婦, family = binomial, data = df_miss_test)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.88451 0.01848 -264.265 < 2e-16 ***
## 不妊治療2 0.05859 0.03764 1.557 0.119496
## 不妊治療3 -0.11660 0.03820 -3.053 0.002268 **
## 妊娠前喫煙1 -0.09630 0.03326 -2.895 0.003791 **
## 妊娠中喫煙1 0.30793 0.05464 5.636 1.74e-08 ***
## 飲酒1 0.11399 0.04928 2.313 0.020724 *
## パートナー飲酒1 -0.14050 0.02740 -5.127 2.94e-07 ***
## X.産科合併症.重症悪阻1 -0.50166 0.12691 -3.953 7.72e-05 ***
## X.産科合併症.切迫早産1 0.40557 0.02520 16.095 < 2e-16 ***
## X.産科合併症.妊娠高血圧症候群1 0.58221 0.03658 15.917 < 2e-16 ***
## X.産科合併症.FGR1 0.53271 0.03906 13.637 < 2e-16 ***
## X.産科合併症.前置胎盤1 -0.72799 0.11303 -6.441 1.19e-10 ***
## X.産科合併症.羊水過多1 0.36530 0.09868 3.702 0.000214 ***
## X.産科合併症.羊水過少1 0.23873 0.06374 3.745 0.000180 ***
## X.母体産科既往歴.妊娠中の性器出血1 -0.39744 0.19769 -2.010 0.044385 *
## X.母体産科既往歴.常位胎盤早期剥離1 1.66210 0.07042 23.603 < 2e-16 ***
## X.母体基礎疾患.子宮奇形1 0.52349 0.11352 4.611 4.00e-06 ***
## X.母体基礎疾患.本態性高血圧1 0.20798 0.08111 2.564 0.010346 *
## X.母体使用薬剤.肺成熟目的ステロイド1 0.86995 0.03823 22.757 < 2e-16 ***
## X.母体使用薬剤.アスピリン1 -0.20207 0.09588 -2.107 0.035082 *
## X.母体基礎疾患.精神疾患1 -0.09930 0.05882 -1.688 0.091351 .
## 多胎妊娠1 -0.70981 0.05087 -13.953 < 2e-16 ***
## 早産歴あり1 0.18055 0.05077 3.556 0.000376 ***
## X.母体使用薬剤.ヘパリン1 0.47000 0.06638 7.080 1.44e-12 ***
## X.母体使用薬剤.Caブロッカー1 0.16787 0.05214 3.219 0.001285 **
## X.母体産科既往歴.妊娠高血圧症1 0.20949 0.05578 3.755 0.000173 ***
## 経産婦1 0.06595 0.02144 3.076 0.002095 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 112082 on 1053941 degrees of freedom
## Residual deviance: 109421 on 1053915 degrees of freedom
## AIC: 109475
##
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_8.2 <- predict(model_8.2, type = "response")
roc_8.2 <- roc(df_miss_test$X.産科合併症.常位胎盤早期剥離, prediction_8.2)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.2)
## Area under the curve: 0.6264
## 検証用データにあてはめる。
prediction_8.2_verify<- predict(model_8.2, newdata = df_miss_verify, type = "response")
roc_8.2_verify <- roc(df_miss_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.2_verify)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.2_verify)
## Area under the curve: 0.6126
## vifを計算
vif_8.2 <- vif(model_8.2)
vif_8.2
## 不妊治療2 不妊治療3
## 1.042526 1.040311
## 妊娠前喫煙1 妊娠中喫煙1
## 1.227823 1.224690
## 飲酒1 パートナー飲酒1
## 1.027260 1.032449
## X.産科合併症.重症悪阻1 X.産科合併症.切迫早産1
## 1.001040 1.141672
## X.産科合併症.妊娠高血圧症候群1 X.産科合併症.FGR1
## 1.389210 1.130779
## X.産科合併症.前置胎盤1 X.産科合併症.羊水過多1
## 1.006873 1.006441
## X.産科合併症.羊水過少1 X.母体産科既往歴.妊娠中の性器出血1
## 1.042684 1.046917
## X.母体産科既往歴.常位胎盤早期剥離1 X.母体基礎疾患.子宮奇形1
## 1.117554 1.003245
## X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1
## 1.090491 1.202293
## X.母体使用薬剤.アスピリン1 X.母体基礎疾患.精神疾患1
## 1.068691 1.003401
## 多胎妊娠1 早産歴あり1
## 1.081255 1.128692
## X.母体使用薬剤.ヘパリン1 X.母体使用薬剤.Caブロッカー1
## 1.066053 1.326646
## X.母体産科既往歴.妊娠高血圧症1 経産婦1
## 1.138819 1.120676
# write.csv(vif_8.2, file = "vif_8.2.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)
# calibration plotを描く
prediction_8.2_calib <- predict(model_8.2, newdata = df_miss_verify, type = 'response')
df_miss_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_miss_verify$X.産科合併症.常位胎盤早期剥離)
class(df_miss_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.2_calib, y=df_miss_verify$X.産科合併症.常位胎盤早期剥離,g=10)

## Dxy C (ROC) R2 D D:Chi-sq
## 2.248575e-01 6.124288e-01 2.072791e-02 2.208640e-03 4.718202e+02
## D:p U U:Chi-sq U:p Q
## NA 9.485753e+00 2.022099e+06 0.000000e+00 -9.483544e+00
## Brier Intercept Slope Emax E90
## 1.010733e+00 -5.296658e-01 8.734430e-01 1.003696e+00 1.001833e+00
## Eavg S:z S:p
## 1.000832e+00 4.775380e+03 0.000000e+00
# png("calibration_plot_8.2.png", width = 800, height = 600)
# val.prob(p = prediction_8.2_calib, y = df_miss_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()
df_miss_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_miss_verify$X.産科合併症.常位胎盤早期剥離)
# 8.3 ロジスティック回帰、欠測補完、変数は手動で選択
model_8.3 <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠中喫煙+X.産科合併症.切迫流産.22週未満性器出血.+
X.産科合併症.切迫早産+
X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.羊水過多+
X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.塩酸リトドリン+
X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+
早産歴あり+X.母体使用薬剤.ヘパリン+
X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
family=binomial, data=df_imp_test)
model_8.3
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. +
## X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 +
## X.産科合併症.FGR + X.産科合併症.羊水過多 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 +
## X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 +
## X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン +
## X.母体基礎疾患.自己免疫疾患 + 早産歴あり +
## X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 +
## 痩せ + 肥満 + 経産婦, family = binomial, data = df_imp_test)
##
## Coefficients:
## (Intercept)
## -4.93613
## 不妊治療2
## -0.02952
## 不妊治療3
## -0.16499
## 妊娠中喫煙1
## 0.22718
## X.産科合併症.切迫流産.22週未満性器出血.1
## 0.19375
## X.産科合併症.切迫早産1
## 0.26038
## X.産科合併症.妊娠高血圧症候群1
## 0.66946
## X.産科合併症.FGR1
## 0.63468
## X.産科合併症.羊水過多1
## 0.40470
## X.母体産科既往歴.常位胎盤早期剥離1
## 1.62624
## X.母体産科既往歴.死産1
## 0.10006
## X.母体産科既往歴.FGR1
## -0.03399
## X.母体基礎疾患.本態性高血圧1
## 0.34179
## X.母体使用薬剤.塩酸リトドリン1
## 0.24851
## X.母体使用薬剤.アスピリン1
## -0.19170
## X.母体基礎疾患.自己免疫疾患1
## 0.11064
## 早産歴あり1
## 0.24681
## X.母体使用薬剤.ヘパリン1
## 0.50647
## X.母体産科既往歴.妊娠高血圧症1
## 0.23890
## 痩せ1
## 0.01135
## 肥満1
## -0.03183
## 経産婦1
## 0.05400
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053920 Residual
## Null Deviance: 112100
## Residual Deviance: 110100 AIC: 110200
## 続いてAUCを計算
prediction_8.3 <- predict(model_8.3, type = "response")
roc_8.3 <- roc(df_imp_test$X.産科合併症.常位胎盤早期剥離, prediction_8.3)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.3)
## Area under the curve: 0.6107
## 検証用データにあてはめる。
prediction_8.3_verify<- predict(model_8.3, newdata = df_imp_verify, type = "response")
roc_8.3_verify <- roc(df_imp_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.3_verify)
## Setting levels: control = 1, case = 2
## Setting direction: controls < cases
auc(roc_8.3_verify)
## Area under the curve: 0.5873
## vifを計算
vif_8.3 <- vif(model_8.3)
vif_8.3
## 不妊治療2
## 1.025609
## 不妊治療3
## 1.036762
## 妊娠中喫煙1
## 1.003710
## X.産科合併症.切迫流産.22週未満性器出血.1
## 1.014004
## X.産科合併症.切迫早産1
## 1.998500
## X.産科合併症.妊娠高血圧症候群1
## 1.161015
## X.産科合併症.FGR1
## 1.069814
## X.産科合併症.羊水過多1
## 1.004835
## X.母体産科既往歴.常位胎盤早期剥離1
## 1.098473
## X.母体産科既往歴.死産1
## 1.057454
## X.母体産科既往歴.FGR1
## 1.064994
## X.母体基礎疾患.本態性高血圧1
## 1.072702
## X.母体使用薬剤.塩酸リトドリン1
## 2.004094
## X.母体使用薬剤.アスピリン1
## 1.088589
## X.母体基礎疾患.自己免疫疾患1
## 1.020704
## 早産歴あり1
## 1.140655
## X.母体使用薬剤.ヘパリン1
## 1.067418
## X.母体産科既往歴.妊娠高血圧症1
## 1.154659
## 痩せ1
## 1.020080
## 肥満1
## 1.037726
## 経産婦1
## 1.124905
# write.csv(vif_8.3, file = "vif_8.3.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)
# calibration plotを描く
prediction_8.3_calib <- predict(model_8.3, newdata = df_imp_verify, type = 'response')
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
class(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.3_calib, y=df_imp_verify$X.産科合併症.常位胎盤早期剥離,g=10)

## Dxy C (ROC) R2 D D:Chi-sq
## 1.748256e-01 5.874128e-01 1.341423e-02 1.427124e-03 3.052228e+02
## D:p U U:Chi-sq U:p Q
## NA 9.470875e+00 2.018927e+06 0.000000e+00 -9.469448e+00
## Brier Intercept Slope Emax E90
## 1.011273e+00 -5.723053e-01 8.598175e-01 1.004241e+00 1.001785e+00
## Eavg S:z S:p
## 1.000628e+00 4.821181e+03 0.000000e+00
# png("calibration_plot_8.3.png", width = 800, height = 600)
# val.prob(p = prediction_8.3_calib, y = df_imp_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
# 8.4 ロジスティック回帰、欠測未補完、変数は手動で選択
model_glm_miss_self <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠中喫煙+X.産科合併症.切迫流産.22週未満性器出血.+
X.産科合併症.切迫早産+
X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.羊水過多+
X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.塩酸リトドリン+
X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+
早産歴あり+X.母体使用薬剤.ヘパリン+
X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
family=binomial, data=df_miss_test)
model_glm_miss_self
##
## Call: glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. +
## X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 +
## X.産科合併症.FGR + X.産科合併症.羊水過多 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 +
## X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 +
## X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン +
## X.母体基礎疾患.自己免疫疾患 + 早産歴あり +
## X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 +
## 痩せ + 肥満 + 経産婦, family = binomial, data = df_miss_test)
##
## Coefficients:
## (Intercept)
## -4.93613
## 不妊治療2
## -0.02952
## 不妊治療3
## -0.16499
## 妊娠中喫煙1
## 0.22718
## X.産科合併症.切迫流産.22週未満性器出血.1
## 0.19375
## X.産科合併症.切迫早産1
## 0.26038
## X.産科合併症.妊娠高血圧症候群1
## 0.66946
## X.産科合併症.FGR1
## 0.63468
## X.産科合併症.羊水過多1
## 0.40470
## X.母体産科既往歴.常位胎盤早期剥離1
## 1.62624
## X.母体産科既往歴.死産1
## 0.10006
## X.母体産科既往歴.FGR1
## -0.03399
## X.母体基礎疾患.本態性高血圧1
## 0.34179
## X.母体使用薬剤.塩酸リトドリン1
## 0.24851
## X.母体使用薬剤.アスピリン1
## -0.19170
## X.母体基礎疾患.自己免疫疾患1
## 0.11064
## 早産歴あり1
## 0.24681
## X.母体使用薬剤.ヘパリン1
## 0.50647
## X.母体産科既往歴.妊娠高血圧症1
## 0.23890
## 痩せ1
## 0.01135
## 肥満1
## -0.03183
## 経産婦1
## 0.05400
##
## Degrees of Freedom: 1053941 Total (i.e. Null); 1053920 Residual
## Null Deviance: 112100
## Residual Deviance: 110100 AIC: 110200
summary(model_glm_miss_self)
##
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 +
## 妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. +
## X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 +
## X.産科合併症.FGR + X.産科合併症.羊水過多 +
## X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 +
## X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 +
## X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン +
## X.母体基礎疾患.自己免疫疾患 + 早産歴あり +
## X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 +
## 痩せ + 肥満 + 経産婦, family = binomial, data = df_miss_test)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.93613 0.01827 -270.152 < 2e-16
## 不妊治療2 -0.02952 0.03730 -0.791 0.4287
## 不妊治療3 -0.16499 0.03810 -4.330 1.49e-05
## 妊娠中喫煙1 0.22718 0.04942 4.597 4.29e-06
## X.産科合併症.切迫流産.22週未満性器出血.1 0.19375 0.07623 2.542 0.0110
## X.産科合併症.切迫早産1 0.26038 0.03329 7.821 5.26e-15
## X.産科合併症.妊娠高血圧症候群1 0.66946 0.03335 20.071 < 2e-16
## X.産科合併症.FGR1 0.63468 0.03786 16.765 < 2e-16
## X.産科合併症.羊水過多1 0.40470 0.09848 4.109 3.97e-05
## X.母体産科既往歴.常位胎盤早期剥離1 1.62624 0.06951 23.397 < 2e-16
## X.母体産科既往歴.死産1 0.10006 0.08666 1.155 0.2482
## X.母体産科既往歴.FGR1 -0.03399 0.09268 -0.367 0.7138
## X.母体基礎疾患.本態性高血圧1 0.34179 0.08010 4.267 1.98e-05
## X.母体使用薬剤.塩酸リトドリン1 0.24851 0.03237 7.677 1.63e-14
## X.母体使用薬剤.アスピリン1 -0.19170 0.09648 -1.987 0.0469
## X.母体基礎疾患.自己免疫疾患1 0.11064 0.09908 1.117 0.2641
## 早産歴あり1 0.24681 0.05088 4.851 1.23e-06
## X.母体使用薬剤.ヘパリン1 0.50647 0.06620 7.651 2.00e-14
## X.母体産科既往歴.妊娠高血圧症1 0.23890 0.05601 4.265 2.00e-05
## 痩せ1 0.01135 0.03281 0.346 0.7294
## 肥満1 -0.03183 0.03463 -0.919 0.3580
## 経産婦1 0.05400 0.02146 2.516 0.0119
##
## (Intercept) ***
## 不妊治療2
## 不妊治療3 ***
## 妊娠中喫煙1 ***
## X.産科合併症.切迫流産.22週未満性器出血.1 *
## X.産科合併症.切迫早産1 ***
## X.産科合併症.妊娠高血圧症候群1 ***
## X.産科合併症.FGR1 ***
## X.産科合併症.羊水過多1 ***
## X.母体産科既往歴.常位胎盤早期剥離1 ***
## X.母体産科既往歴.死産1
## X.母体産科既往歴.FGR1
## X.母体基礎疾患.本態性高血圧1 ***
## X.母体使用薬剤.塩酸リトドリン1 ***
## X.母体使用薬剤.アスピリン1 *
## X.母体基礎疾患.自己免疫疾患1
## 早産歴あり1 ***
## X.母体使用薬剤.ヘパリン1 ***
## X.母体産科既往歴.妊娠高血圧症1 ***
## 痩せ1
## 肥満1
## 経産婦1 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 112082 on 1053941 degrees of freedom
## Residual deviance: 110148 on 1053920 degrees of freedom
## AIC: 110192
##
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_model_glm_miss_self <- predict(model_glm_miss_self, type = "response")
roc_model_glm_miss_self <- roc(df_miss_test$X.産科合併症.常位胎盤早期剥離, prediction_model_glm_miss_self)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_model_glm_miss_self)
## Area under the curve: 0.6107
## 検証用データにあてはめる。
prediction_miss_self_verify<- predict(model_glm_miss_self, newdata = df_miss_verify, type = "response")
roc_logistic_miss_self_verify <- roc(df_miss_verify$X.産科合併症.常位胎盤早期剥離, prediction_miss_self_verify)
## Setting levels: control = 1, case = 2
## Setting direction: controls < cases
auc(roc_logistic_miss_self_verify)
## Area under the curve: 0.5873
# 8.5 SVM 欠測補完あり
# model_8.5<-ksvm(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# saveRDS(model_8.5, file = "model_8.5.rds")
model_8.5<-readRDS("model_8.5.rds")
model_8.5
## Support Vector Machine object of class "ksvm"
##
## SV type: C-svc (classification)
## parameter : cost C = 1
##
## Gaussian Radial Basis kernel function.
## Hyperparameter : sigma = 2.17772275990075e-05
##
## Number of Support Vectors : 36886
##
## Objective Function Value : -19789.06
## Training error : 0.009388
# > model_8.5
# Support Vector Machine object of class "ksvm"
#
# SV type: C-svc (classification) これは分類を表す
# parameter : cost C = 1 cパラメータの誤分類コスト 目標0.01-10.00
#
# Gaussian Radial Basis kernel function.
# Hyperparameter : sigma = 2.17772275990075e-05
#
# Number of Support Vectors : 36886
#
# Objective Function Value : -19789.06
# Training error : 0.009388 訓練誤差0.9388%
# 答え合わせ
# まずは学習データで
# result_svm<-predict(model_8.5, df_imp_test)
# saveRDS(result_svm, file="result_svm.rds")
# result_svm <- readRDS("result_svm.rds")
# summary(result_svm)
# table(result_svm)
# table(df_imp_test$X.産科合併症.常位胎盤早期剥離)
# table(result_svm, df_imp_test$X.産科合併症.常位胎盤早期剥離)
# 続いて検証データで
# result_svm_verify <- predict(model_8.5, data = df_imp_verify)
## 検証用データでエラーが出てしまう
# ROCの確認
# svm_probabilities <- predict(model_8.5, newdata = df_imp_test, type = "response")
# summary(svm_probabilities)
# svm_probabilities<-as.numeric(svm_probabilities)
# df_imp_test$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_test$X.産科合併症.常位胎盤早期剥離)
#
# roc_8.5 <- roc(response = df_imp_test$X.産科合併症.常位胎盤早期剥離, predictor = svm_probabilities)
# roc_8.5 <- roc(response = df_imp_test$X.産科合併症.常位胎盤早期剥離, predictor = svm_probabilities, levels = c(0, 1))
# auc_8.5 <- auc(roc_8.5)
# SVMの検証用データでエラーが出る
# 8.8 ランダムフォレスト
# model_8.8<-randomForest(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# saveRDS(model_8.8, file="model_8.8.rds")
model_8.8<-readRDS("model_8.8.rds")
model_8.8
##
## Call:
## randomForest(formula = X.産科合併症.常位胎盤早期剥離 ~ ., data = df_no_missing)
## Type of random forest: classification
## Number of trees: 500
## No. of variables tried at each split: 9
##
## OOB estimate of error rate: 0.92%
## Confusion matrix:
## 1 2 class.error
## 1 1044032 5 4.789102e-06
## 2 9666 229 9.768570e-01
# result_8.8<-predict(model_8.8,df_imp_verify_selected)
# 8.9 決定木
# rpart(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# 8.10 ニューラルネットワーク
# nnet(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)