### データクリーニング前のスクリプトは別にしておく。

pacman::p_load(tidyverse , RSQLite , lubridate, tableone, skimr,rms,ggplot2,
               gtsummary,summarytools,naniar,mice,readr,gridExtra,dplyr,
               corrplot,missRanger, pROC,devtools,infotheo,kernlab,e1071,
               randomForest,rpart,nnet)
df_post_imputation<-read.csv("df_post_imputation.csv", na = c("", " ", "NA"),fileEncoding = "Shift-JIS")
df_post_imputation$整理番号[is.na(df_post_imputation$整理番号)] <- 0
df_missinginclude<-read.csv("df_missinginclude.csv", na = c("", " ", "NA"),fileEncoding = "Shift-JIS")
df_missinginclude$整理番号[is.na(df_missinginclude$整理番号)] <- 0


# 7 開発データ、検証データへの分割
df_imp_test <- df_post_imputation[df_post_imputation$年 %in% c(2016, 2017, 2018, 2019,2020), ]
df_imp_verify <- df_post_imputation[df_post_imputation$年 == 2021, ]
df_miss_test <- df_missinginclude[df_missinginclude$年 %in% c(2016, 2017, 2018, 2019,2020), ]
df_miss_verify <- df_missinginclude[df_missinginclude$年 == 2021, ]

variable_factor<-
  c("不妊治療","妊娠前喫煙","妊娠中喫煙","飲酒","パートナー喫煙","パートナー飲酒",
    "X.産科合併症.切迫流産.22週未満性器出血.","X.産科合併症.尿路感染症","X.産科合併症.歯周病",
    "X.産科合併症.重症悪阻","X.産科合併症.妊娠貧血","X.産科合併症.切迫早産",
    "X.産科合併症.頸管無力症","X.産科合併症.頸管長短縮","X.産科合併症.腟内胎胞形成",
    "X.産科合併症.縫縮術施行","X.産科合併症.常位胎盤早期剥離","X.産科合併症.妊娠高血圧症候群",
    "X.産科合併症.FGR","X.産科合併症.GDM","X.産科合併症.前置胎盤","X.産科合併症.羊水過多","X.産科合併症.羊水過少",
    "X.産科合併症.DVT","X.母体産科既往歴.妊娠中の性器出血","X.母体産科既往歴.切迫流産",
    "X.母体産科既往歴.常位胎盤早期剥離","X.母体産科既往歴.pPROM",
    "X.母体産科既往歴.生殖器感染症","X.母体産科既往歴.死産","X.母体産科既往歴.FGR",
    "X.母体産科既往歴.糖尿病.GDM","X.母体基礎疾患.中枢神経系.含む脳血管疾患.",
    "X.母体基礎疾患.呼吸器","X.母体基礎疾患.消化器","X.母体基礎疾患.消化器.虫垂炎.",
    "X.母体基礎疾患.消化器.胃腸炎.","X.母体基礎疾患.肝.肝炎.","X.母体基礎疾患.腎.泌尿器",
    "X.母体基礎疾患.腎.泌尿器.腎炎.","X.母体基礎疾患.腎.泌尿器.腎盂腎炎.","X.母体基礎疾患.血液",
    "X.母体基礎疾患.心","X.母体基礎疾患.甲状腺.機能亢進症.","X.母体基礎疾患.甲状腺.機能低下症.",
    "X.母体基礎疾患.骨","X.母体基礎疾患.筋肉","X.母体基礎疾患.子宮奇形","X.母体基礎疾患.子宮筋腫",
    "X.母体基礎疾患.精神疾患","X.母体基礎疾患.自己免疫疾患","X.母体基礎疾患.本態性高血圧",
    "X.母体感染症.クラミジアPCR","X.母体感染症.梅毒","X.母体感染症.トキソプラスマIgM",
    "X.母体感染症.サイトメガロ.妊娠中感染.","X.母体感染症.HTLV.1.WB.","X.母体感染症.パルボB19",
    "X.母体感染症.細菌性膣症.Nugent.7点.","X.母体使用薬剤.肺成熟目的ステロイド",
    "X.母体使用薬剤.甲状腺機能改善薬","X.母体使用薬剤.塩酸リトドリン","X.母体使用薬剤.インスリン",
    "X.母体使用薬剤.硫酸マグネシウム","X.母体使用薬剤.アスピリン","X.母体使用薬剤.ヘパリン",
    "X.母体使用薬剤.抗Dグロブリン","X.母体使用薬剤.向精神薬","X.母体使用薬剤.Caブロッカー",
    "X.母体産科既往歴.妊娠高血圧症","早産歴あり","多胎妊娠","痩せ","肥満","経産婦","X.母体産科既往歴.頸部切除術")
variable_numeric<-
  c("経妊回数","経産回数","自然流産回数","早産回数","帝王切開回数",
    "人工妊娠中絶回数","X.分娩.分娩時年齢","母身長.cm.","非妊時体重.kg.")
df_imp_test[variable_factor] <- 
     lapply(df_imp_test[variable_factor], as.factor)
df_miss_test[variable_factor] <- 
  lapply(df_miss_test[variable_factor], as.factor)
df_imp_verify[variable_factor] <- 
  lapply(df_imp_verify[variable_factor], as.factor)
df_miss_verify[variable_factor] <- 
  lapply(df_miss_verify[variable_factor], as.factor)
df_imp_test[variable_numeric] <- lapply(df_imp_test[variable_numeric], as.numeric)
df_miss_test[variable_numeric] <- lapply(df_miss_test[variable_numeric], as.numeric)
df_imp_verify[variable_numeric] <- lapply(df_imp_verify[variable_numeric], as.numeric)
df_miss_verify[variable_numeric] <- lapply(df_miss_verify[variable_numeric], as.numeric)
sapply(df_imp_test,class)
##                                  不妊治療 
##                                  "factor" 
##                                      年度 
##                                 "integer" 
##                                  経妊回数 
##                                 "numeric" 
##                                  経産回数 
##                                 "numeric" 
##                                  早産回数 
##                                 "numeric" 
##                              帝王切開回数 
##                                 "numeric" 
##                              自然流産回数 
##                                 "numeric" 
##                          人工妊娠中絶回数 
##                                 "numeric" 
##                                母身長.cm. 
##                                 "numeric" 
##                            非妊時体重.kg. 
##                                 "numeric" 
##                         X.分娩.分娩時年齢 
##                                 "numeric" 
##                                妊娠前喫煙 
##                                  "factor" 
##                                妊娠中喫煙 
##                                  "factor" 
##                                      飲酒 
##                                  "factor" 
##                            パートナー喫煙 
##                                  "factor" 
##                            パートナー飲酒 
##                                  "factor" 
##   X.産科合併症.切迫流産.22週未満性器出血. 
##                                  "factor" 
##                   X.産科合併症.尿路感染症 
##                                  "factor" 
##                       X.産科合併症.歯周病 
##                                  "factor" 
##                     X.産科合併症.重症悪阻 
##                                  "factor" 
##                     X.産科合併症.妊娠貧血 
##                                  "factor" 
##                     X.産科合併症.切迫早産 
##                                  "factor" 
##                   X.産科合併症.頸管無力症 
##                                  "factor" 
##                   X.産科合併症.頸管長短縮 
##                                  "factor" 
##                 X.産科合併症.腟内胎胞形成 
##                                  "factor" 
##                   X.産科合併症.縫縮術施行 
##                                  "factor" 
##             X.産科合併症.常位胎盤早期剥離 
##                                  "factor" 
##             X.産科合併症.妊娠高血圧症候群 
##                                  "factor" 
##                          X.産科合併症.FGR 
##                                  "factor" 
##                          X.産科合併症.GDM 
##                                  "factor" 
##                     X.産科合併症.前置胎盤 
##                                  "factor" 
##                     X.産科合併症.羊水過多 
##                                  "factor" 
##                     X.産科合併症.羊水過少 
##                                  "factor" 
##                          X.産科合併症.DVT 
##                                  "factor" 
##         X.母体産科既往歴.妊娠中の性器出血 
##                                  "factor" 
##                 X.母体産科既往歴.切迫流産 
##                                  "factor" 
##         X.母体産科既往歴.常位胎盤早期剥離 
##                                  "factor" 
##                    X.母体産科既往歴.pPROM 
##                                  "factor" 
##             X.母体産科既往歴.生殖器感染症 
##                                  "factor" 
##                     X.母体産科既往歴.死産 
##                                  "factor" 
##                      X.母体産科既往歴.FGR 
##                                  "factor" 
##               X.母体産科既往歴.糖尿病.GDM 
##                                  "factor" 
## X.母体基礎疾患.中枢神経系.含む脳血管疾患. 
##                                  "factor" 
##                     X.母体基礎疾患.呼吸器 
##                                  "factor" 
##                     X.母体基礎疾患.消化器 
##                                  "factor" 
##             X.母体基礎疾患.消化器.虫垂炎. 
##                                  "factor" 
##             X.母体基礎疾患.消化器.胃腸炎. 
##                                  "factor" 
##                   X.母体基礎疾患.肝.肝炎. 
##                                  "factor" 
##                  X.母体基礎疾患.腎.泌尿器 
##                                  "factor" 
##            X.母体基礎疾患.腎.泌尿器.腎炎. 
##                                  "factor" 
##        X.母体基礎疾患.腎.泌尿器.腎盂腎炎. 
##                                  "factor" 
##                       X.母体基礎疾患.血液 
##                                  "factor" 
##                         X.母体基礎疾患.心 
##                                  "factor" 
##         X.母体基礎疾患.甲状腺.機能亢進症. 
##                                  "factor" 
##         X.母体基礎疾患.甲状腺.機能低下症. 
##                                  "factor" 
##                         X.母体基礎疾患.骨 
##                                  "factor" 
##                       X.母体基礎疾患.筋肉 
##                                  "factor" 
##                   X.母体基礎疾患.子宮奇形 
##                                  "factor" 
##                   X.母体基礎疾患.子宮筋腫 
##                                  "factor" 
##                   X.母体基礎疾患.精神疾患 
##                                  "factor" 
##               X.母体基礎疾患.自己免疫疾患 
##                                  "factor" 
##               X.母体基礎疾患.本態性高血圧 
##                                  "factor" 
##                X.母体感染症.クラミジアPCR 
##                                  "factor" 
##                         X.母体感染症.梅毒 
##                                  "factor" 
##            X.母体感染症.トキソプラスマIgM 
##                                  "factor" 
##     X.母体感染症.サイトメガロ.妊娠中感染. 
##                                  "factor" 
##                   X.母体感染症.HTLV.1.WB. 
##                                  "factor" 
##                    X.母体感染症.パルボB19 
##                                  "factor" 
##       X.母体感染症.細菌性膣症.Nugent.7点. 
##                                  "factor" 
##       X.母体使用薬剤.肺成熟目的ステロイド 
##                                  "factor" 
##           X.母体使用薬剤.甲状腺機能改善薬 
##                                  "factor" 
##             X.母体使用薬剤.塩酸リトドリン 
##                                  "factor" 
##                 X.母体使用薬剤.インスリン 
##                                  "factor" 
##           X.母体使用薬剤.硫酸マグネシウム 
##                                  "factor" 
##                 X.母体使用薬剤.アスピリン 
##                                  "factor" 
##                   X.母体使用薬剤.ヘパリン 
##                                  "factor" 
##              X.母体使用薬剤.抗Dグロブリン 
##                                  "factor" 
##                   X.母体使用薬剤.向精神薬 
##                                  "factor" 
##               X.母体使用薬剤.Caブロッカー 
##                                  "factor" 
##             X.母体産科既往歴.妊娠高血圧症 
##                                  "factor" 
##                                早産歴あり 
##                                  "factor" 
##                                  多胎妊娠 
##                                  "factor" 
##                                      痩せ 
##                                  "factor" 
##                                      肥満 
##                                  "factor" 
##                                    経産婦 
##                                  "factor" 
##               X.母体産科既往歴.頸部切除術 
##                                  "factor" 
##                                        年 
##                                 "integer" 
##                              施設の所在地 
##                               "character" 
##                            施設別通し番号 
##                                 "integer" 
##                                  整理番号 
##                                 "numeric"
sapply(df_miss_test,class)
##                                  不妊治療 
##                                  "factor" 
##                                      年度 
##                                 "integer" 
##                                  経妊回数 
##                                 "numeric" 
##                                  経産回数 
##                                 "numeric" 
##                                  早産回数 
##                                 "numeric" 
##                              帝王切開回数 
##                                 "numeric" 
##                              自然流産回数 
##                                 "numeric" 
##                          人工妊娠中絶回数 
##                                 "numeric" 
##                                母身長.cm. 
##                                 "numeric" 
##                            非妊時体重.kg. 
##                                 "numeric" 
##                         X.分娩.分娩時年齢 
##                                 "numeric" 
##                                妊娠前喫煙 
##                                  "factor" 
##                                妊娠中喫煙 
##                                  "factor" 
##                                      飲酒 
##                                  "factor" 
##                            パートナー喫煙 
##                                  "factor" 
##                            パートナー飲酒 
##                                  "factor" 
##   X.産科合併症.切迫流産.22週未満性器出血. 
##                                  "factor" 
##                   X.産科合併症.尿路感染症 
##                                  "factor" 
##                       X.産科合併症.歯周病 
##                                  "factor" 
##                     X.産科合併症.重症悪阻 
##                                  "factor" 
##                     X.産科合併症.妊娠貧血 
##                                  "factor" 
##                     X.産科合併症.切迫早産 
##                                  "factor" 
##                   X.産科合併症.頸管無力症 
##                                  "factor" 
##                   X.産科合併症.頸管長短縮 
##                                  "factor" 
##                 X.産科合併症.腟内胎胞形成 
##                                  "factor" 
##                   X.産科合併症.縫縮術施行 
##                                  "factor" 
##             X.産科合併症.常位胎盤早期剥離 
##                                  "factor" 
##             X.産科合併症.妊娠高血圧症候群 
##                                  "factor" 
##                          X.産科合併症.FGR 
##                                  "factor" 
##                          X.産科合併症.GDM 
##                                  "factor" 
##                     X.産科合併症.前置胎盤 
##                                  "factor" 
##                     X.産科合併症.羊水過多 
##                                  "factor" 
##                     X.産科合併症.羊水過少 
##                                  "factor" 
##                          X.産科合併症.DVT 
##                                  "factor" 
##         X.母体産科既往歴.妊娠中の性器出血 
##                                  "factor" 
##                 X.母体産科既往歴.切迫流産 
##                                  "factor" 
##         X.母体産科既往歴.常位胎盤早期剥離 
##                                  "factor" 
##                    X.母体産科既往歴.pPROM 
##                                  "factor" 
##             X.母体産科既往歴.生殖器感染症 
##                                  "factor" 
##                     X.母体産科既往歴.死産 
##                                  "factor" 
##                      X.母体産科既往歴.FGR 
##                                  "factor" 
##               X.母体産科既往歴.糖尿病.GDM 
##                                  "factor" 
## X.母体基礎疾患.中枢神経系.含む脳血管疾患. 
##                                  "factor" 
##                     X.母体基礎疾患.呼吸器 
##                                  "factor" 
##                     X.母体基礎疾患.消化器 
##                                  "factor" 
##             X.母体基礎疾患.消化器.虫垂炎. 
##                                  "factor" 
##             X.母体基礎疾患.消化器.胃腸炎. 
##                                  "factor" 
##                   X.母体基礎疾患.肝.肝炎. 
##                                  "factor" 
##                  X.母体基礎疾患.腎.泌尿器 
##                                  "factor" 
##            X.母体基礎疾患.腎.泌尿器.腎炎. 
##                                  "factor" 
##        X.母体基礎疾患.腎.泌尿器.腎盂腎炎. 
##                                  "factor" 
##                       X.母体基礎疾患.血液 
##                                  "factor" 
##                         X.母体基礎疾患.心 
##                                  "factor" 
##         X.母体基礎疾患.甲状腺.機能亢進症. 
##                                  "factor" 
##         X.母体基礎疾患.甲状腺.機能低下症. 
##                                  "factor" 
##                         X.母体基礎疾患.骨 
##                                  "factor" 
##                       X.母体基礎疾患.筋肉 
##                                  "factor" 
##                   X.母体基礎疾患.子宮奇形 
##                                  "factor" 
##                   X.母体基礎疾患.子宮筋腫 
##                                  "factor" 
##                   X.母体基礎疾患.精神疾患 
##                                  "factor" 
##               X.母体基礎疾患.自己免疫疾患 
##                                  "factor" 
##               X.母体基礎疾患.本態性高血圧 
##                                  "factor" 
##                X.母体感染症.クラミジアPCR 
##                                  "factor" 
##                         X.母体感染症.梅毒 
##                                  "factor" 
##            X.母体感染症.トキソプラスマIgM 
##                                  "factor" 
##     X.母体感染症.サイトメガロ.妊娠中感染. 
##                                  "factor" 
##                   X.母体感染症.HTLV.1.WB. 
##                                  "factor" 
##                    X.母体感染症.パルボB19 
##                                  "factor" 
##       X.母体感染症.細菌性膣症.Nugent.7点. 
##                                  "factor" 
##       X.母体使用薬剤.肺成熟目的ステロイド 
##                                  "factor" 
##           X.母体使用薬剤.甲状腺機能改善薬 
##                                  "factor" 
##             X.母体使用薬剤.塩酸リトドリン 
##                                  "factor" 
##                 X.母体使用薬剤.インスリン 
##                                  "factor" 
##           X.母体使用薬剤.硫酸マグネシウム 
##                                  "factor" 
##                 X.母体使用薬剤.アスピリン 
##                                  "factor" 
##                   X.母体使用薬剤.ヘパリン 
##                                  "factor" 
##              X.母体使用薬剤.抗Dグロブリン 
##                                  "factor" 
##                   X.母体使用薬剤.向精神薬 
##                                  "factor" 
##               X.母体使用薬剤.Caブロッカー 
##                                  "factor" 
##             X.母体産科既往歴.妊娠高血圧症 
##                                  "factor" 
##                                早産歴あり 
##                                  "factor" 
##                                  多胎妊娠 
##                                  "factor" 
##                                      痩せ 
##                                  "factor" 
##                                      肥満 
##                                  "factor" 
##                                    経産婦 
##                                  "factor" 
##               X.母体産科既往歴.頸部切除術 
##                                  "factor" 
##                                        年 
##                                 "integer" 
##                              施設の所在地 
##                               "character" 
##                            施設別通し番号 
##                                 "integer" 
##                                  整理番号 
##                                 "numeric"
# 8.ロジスティック
# 8-1. ロジスティック回帰分析,欠測補完あり,ステップワイズ
glm_variables<-c("不妊治療","妊娠前喫煙","妊娠中喫煙","飲酒","パートナー喫煙","パートナー飲酒",
                 "X.産科合併症.歯周病","X.産科合併症.重症悪阻","X.産科合併症.切迫早産","X.産科合併症.妊娠高血圧症候群",
                 "X.産科合併症.FGR","X.産科合併症.前置胎盤",
                 "X.産科合併症.羊水過多","X.産科合併症.羊水過少","X.母体産科既往歴.妊娠中の性器出血",
                 "X.母体産科既往歴.常位胎盤早期剥離","X.母体産科既往歴.死産",
                 "X.母体産科既往歴.FGR","X.母体基礎疾患.甲状腺.機能低下症.","X.母体基礎疾患.子宮奇形",
                 "X.母体基礎疾患.本態性高血圧","X.母体使用薬剤.肺成熟目的ステロイド","X.母体使用薬剤.アスピリン",
                 "X.母体基礎疾患.自己免疫疾患","X.母体基礎疾患.精神疾患","多胎妊娠","早産歴あり",
                 "X.母体使用薬剤.ヘパリン","X.母体使用薬剤.Caブロッカー","X.母体産科既往歴.妊娠高血圧症",
               "痩せ","肥満","経産婦")

sapply(glm_variables,class)
##                            不妊治療                          妊娠前喫煙 
##                         "character"                         "character" 
##                          妊娠中喫煙                                飲酒 
##                         "character"                         "character" 
##                      パートナー喫煙                      パートナー飲酒 
##                         "character"                         "character" 
##                 X.産科合併症.歯周病               X.産科合併症.重症悪阻 
##                         "character"                         "character" 
##               X.産科合併症.切迫早産       X.産科合併症.妊娠高血圧症候群 
##                         "character"                         "character" 
##                    X.産科合併症.FGR               X.産科合併症.前置胎盤 
##                         "character"                         "character" 
##               X.産科合併症.羊水過多               X.産科合併症.羊水過少 
##                         "character"                         "character" 
##   X.母体産科既往歴.妊娠中の性器出血   X.母体産科既往歴.常位胎盤早期剥離 
##                         "character"                         "character" 
##               X.母体産科既往歴.死産                X.母体産科既往歴.FGR 
##                         "character"                         "character" 
##   X.母体基礎疾患.甲状腺.機能低下症.             X.母体基礎疾患.子宮奇形 
##                         "character"                         "character" 
##         X.母体基礎疾患.本態性高血圧 X.母体使用薬剤.肺成熟目的ステロイド 
##                         "character"                         "character" 
##           X.母体使用薬剤.アスピリン         X.母体基礎疾患.自己免疫疾患 
##                         "character"                         "character" 
##             X.母体基礎疾患.精神疾患                            多胎妊娠 
##                         "character"                         "character" 
##                          早産歴あり             X.母体使用薬剤.ヘパリン 
##                         "character"                         "character" 
##         X.母体使用薬剤.Caブロッカー       X.母体産科既往歴.妊娠高血圧症 
##                         "character"                         "character" 
##                                痩せ                                肥満 
##                         "character"                         "character" 
##                              経産婦 
##                         "character"
colnames(df_imp_test)
##  [1] "不妊治療"                                 
##  [2] "年度"                                     
##  [3] "経妊回数"                                 
##  [4] "経産回数"                                 
##  [5] "早産回数"                                 
##  [6] "帝王切開回数"                             
##  [7] "自然流産回数"                             
##  [8] "人工妊娠中絶回数"                         
##  [9] "母身長.cm."                               
## [10] "非妊時体重.kg."                           
## [11] "X.分娩.分娩時年齢"                        
## [12] "妊娠前喫煙"                               
## [13] "妊娠中喫煙"                               
## [14] "飲酒"                                     
## [15] "パートナー喫煙"                           
## [16] "パートナー飲酒"                           
## [17] "X.産科合併症.切迫流産.22週未満性器出血."  
## [18] "X.産科合併症.尿路感染症"                  
## [19] "X.産科合併症.歯周病"                      
## [20] "X.産科合併症.重症悪阻"                    
## [21] "X.産科合併症.妊娠貧血"                    
## [22] "X.産科合併症.切迫早産"                    
## [23] "X.産科合併症.頸管無力症"                  
## [24] "X.産科合併症.頸管長短縮"                  
## [25] "X.産科合併症.腟内胎胞形成"                
## [26] "X.産科合併症.縫縮術施行"                  
## [27] "X.産科合併症.常位胎盤早期剥離"            
## [28] "X.産科合併症.妊娠高血圧症候群"            
## [29] "X.産科合併症.FGR"                         
## [30] "X.産科合併症.GDM"                         
## [31] "X.産科合併症.前置胎盤"                    
## [32] "X.産科合併症.羊水過多"                    
## [33] "X.産科合併症.羊水過少"                    
## [34] "X.産科合併症.DVT"                         
## [35] "X.母体産科既往歴.妊娠中の性器出血"        
## [36] "X.母体産科既往歴.切迫流産"                
## [37] "X.母体産科既往歴.常位胎盤早期剥離"        
## [38] "X.母体産科既往歴.pPROM"                   
## [39] "X.母体産科既往歴.生殖器感染症"            
## [40] "X.母体産科既往歴.死産"                    
## [41] "X.母体産科既往歴.FGR"                     
## [42] "X.母体産科既往歴.糖尿病.GDM"              
## [43] "X.母体基礎疾患.中枢神経系.含む脳血管疾患."
## [44] "X.母体基礎疾患.呼吸器"                    
## [45] "X.母体基礎疾患.消化器"                    
## [46] "X.母体基礎疾患.消化器.虫垂炎."            
## [47] "X.母体基礎疾患.消化器.胃腸炎."            
## [48] "X.母体基礎疾患.肝.肝炎."                  
## [49] "X.母体基礎疾患.腎.泌尿器"                 
## [50] "X.母体基礎疾患.腎.泌尿器.腎炎."           
## [51] "X.母体基礎疾患.腎.泌尿器.腎盂腎炎."       
## [52] "X.母体基礎疾患.血液"                      
## [53] "X.母体基礎疾患.心"                        
## [54] "X.母体基礎疾患.甲状腺.機能亢進症."        
## [55] "X.母体基礎疾患.甲状腺.機能低下症."        
## [56] "X.母体基礎疾患.骨"                        
## [57] "X.母体基礎疾患.筋肉"                      
## [58] "X.母体基礎疾患.子宮奇形"                  
## [59] "X.母体基礎疾患.子宮筋腫"                  
## [60] "X.母体基礎疾患.精神疾患"                  
## [61] "X.母体基礎疾患.自己免疫疾患"              
## [62] "X.母体基礎疾患.本態性高血圧"              
## [63] "X.母体感染症.クラミジアPCR"               
## [64] "X.母体感染症.梅毒"                        
## [65] "X.母体感染症.トキソプラスマIgM"           
## [66] "X.母体感染症.サイトメガロ.妊娠中感染."    
## [67] "X.母体感染症.HTLV.1.WB."                  
## [68] "X.母体感染症.パルボB19"                   
## [69] "X.母体感染症.細菌性膣症.Nugent.7点."      
## [70] "X.母体使用薬剤.肺成熟目的ステロイド"      
## [71] "X.母体使用薬剤.甲状腺機能改善薬"          
## [72] "X.母体使用薬剤.塩酸リトドリン"            
## [73] "X.母体使用薬剤.インスリン"                
## [74] "X.母体使用薬剤.硫酸マグネシウム"          
## [75] "X.母体使用薬剤.アスピリン"                
## [76] "X.母体使用薬剤.ヘパリン"                  
## [77] "X.母体使用薬剤.抗Dグロブリン"             
## [78] "X.母体使用薬剤.向精神薬"                  
## [79] "X.母体使用薬剤.Caブロッカー"              
## [80] "X.母体産科既往歴.妊娠高血圧症"            
## [81] "早産歴あり"                               
## [82] "多胎妊娠"                                 
## [83] "痩せ"                                     
## [84] "肥満"                                     
## [85] "経産婦"                                   
## [86] "X.母体産科既往歴.頸部切除術"              
## [87] "年"                                       
## [88] "施設の所在地"                             
## [89] "施設別通し番号"                           
## [90] "整理番号"
model_8.1_pre <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠前喫煙+妊娠中喫煙+飲酒+パートナー喫煙+
                   パートナー飲酒+X.産科合併症.歯周病+X.産科合併症.重症悪阻+X.産科合併症.切迫早産+
                   X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.前置胎盤+
                   X.産科合併症.羊水過多+X.産科合併症.羊水過少+X.母体産科既往歴.妊娠中の性器出血+
                   X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
                   X.母体基礎疾患.甲状腺.機能低下症.+X.母体基礎疾患.子宮奇形+
                   X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.肺成熟目的ステロイド+
                   X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+X.母体基礎疾患.精神疾患+
                   多胎妊娠+早産歴あり+X.母体使用薬剤.ヘパリン+X.母体使用薬剤.Caブロッカー+
                   X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
                   family=binomial, data=df_imp_test)
model_8.1_pre
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー喫煙 + 
##     パートナー飲酒 + X.産科合併症.歯周病 + X.産科合併症.重症悪阻 + 
##     X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 + 
##     X.産科合併症.FGR + X.産科合併症.前置胎盤 + 
##     X.産科合併症.羊水過多 + X.産科合併症.羊水過少 + 
##     X.母体産科既往歴.妊娠中の性器出血 + X.母体産科既往歴.常位胎盤早期剥離 + 
##     X.母体産科既往歴.死産 + X.母体産科既往歴.FGR + 
##     X.母体基礎疾患.甲状腺.機能低下症. + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.自己免疫疾患 + 
##     X.母体基礎疾患.精神疾患 + 多胎妊娠 + 早産歴あり + 
##     X.母体使用薬剤.ヘパリン + X.母体使用薬剤.Caブロッカー + 
##     X.母体産科既往歴.妊娠高血圧症 + 痩せ + 肥満 + 
##     経産婦, family = binomial, data = df_imp_test)
## 
## Coefficients:
##                          (Intercept)                             不妊治療2  
##                             -4.88201                               0.05940  
##                            不妊治療3                           妊娠前喫煙1  
##                             -0.11581                              -0.08167  
##                          妊娠中喫煙1                                 飲酒1  
##                              0.32001                               0.11187  
##                      パートナー喫煙1                       パートナー飲酒1  
##                             -0.04255                              -0.13062  
##                 X.産科合併症.歯周病1                X.産科合併症.重症悪阻1  
##                             -0.20212                              -0.50095  
##               X.産科合併症.切迫早産1        X.産科合併症.妊娠高血圧症候群1  
##                              0.40491                               0.58603  
##                    X.産科合併症.FGR1                X.産科合併症.前置胎盤1  
##                              0.53336                              -0.72752  
##               X.産科合併症.羊水過多1                X.産科合併症.羊水過少1  
##                              0.36663                               0.24013  
##   X.母体産科既往歴.妊娠中の性器出血1    X.母体産科既往歴.常位胎盤早期剥離1  
##                             -0.38831                               1.65311  
##               X.母体産科既往歴.死産1                 X.母体産科既往歴.FGR1  
##                              0.07573                              -0.04828  
##   X.母体基礎疾患.甲状腺.機能低下症.1              X.母体基礎疾患.子宮奇形1  
##                             -0.04389                               0.52271  
##         X.母体基礎疾患.本態性高血圧1  X.母体使用薬剤.肺成熟目的ステロイド1  
##                              0.21617                               0.87014  
##           X.母体使用薬剤.アスピリン1          X.母体基礎疾患.自己免疫疾患1  
##                             -0.21286                               0.08146  
##             X.母体基礎疾患.精神疾患1                             多胎妊娠1  
##                             -0.09901                              -0.70965  
##                          早産歴あり1              X.母体使用薬剤.ヘパリン1  
##                              0.18007                               0.46559  
##         X.母体使用薬剤.Caブロッカー1        X.母体産科既往歴.妊娠高血圧症1  
##                              0.16863                               0.21576  
##                                痩せ1                                 肥満1  
##                              0.01805                              -0.03733  
##                              経産婦1  
##                              0.06705  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053907 Residual
## Null Deviance:       112100 
## Residual Deviance: 109400    AIC: 109500
results <- data.frame()
## χ二乗統計量やp値や自由度計算する
# for (var in glm_variables) {
#   fit <- glm(formula(paste("X.産科合併症.常位胎盤早期剥離 ~", var)), data = df_imp_test, family = binomial(link = "logit"))
#   anova_res <- anova(fit, test = "Chisq")
#   chi2 <- round(anova_res$Deviance[2], 4)
#   df <- anova_res$Df[2]
#   coef_table <- summary(fit)$coefficients
#   OR <- round(exp(coef_table[2, 1]), 4)
#   lower_ci <- round(exp(coef_table[2, 1] - 1.96 * coef_table[2, 2]), 4)
#   upper_ci <- round(exp(coef_table[2, 1] + 1.96 * coef_table[2, 2]), 4)
#   wald_p_value <- round(coef_table[2, 4], 4)
#   temp_df <- data.frame(Variable = var, Chi2 = chi2, Df = df, P_value = wald_p_value, Odds_Ratio = OR, Lower_CI = lower_ci, Upper_CI = upper_ci)
#   results <- rbind(results, temp_df)
# }
print(results)
##  0 列 0 行のデータフレーム
# write.csv(results, file = "logistic_imp_prestep.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)

## stepwiseで変数を選択する
# logistic_imp_step <- step(model_glm_imp, direction = "both", trace = 1)
# saveRDS(logistic_imp_step, file = "final_model.rds")
model_8.1<-readRDS("final_model.rds")
model_8.1
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 + 
##     X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 + 
##     X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR + 
##     X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 + 
##     X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 + 
##     多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン + 
##     X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 + 
##     経産婦, family = binomial, data = df_imp_test)
## 
## Coefficients:
##                          (Intercept)                             不妊治療2  
##                             -4.88451                               0.05859  
##                            不妊治療3                           妊娠前喫煙1  
##                             -0.11660                              -0.09630  
##                          妊娠中喫煙1                                 飲酒1  
##                              0.30793                               0.11399  
##                      パートナー飲酒1                X.産科合併症.重症悪阻1  
##                             -0.14050                              -0.50166  
##               X.産科合併症.切迫早産1        X.産科合併症.妊娠高血圧症候群1  
##                              0.40557                               0.58221  
##                    X.産科合併症.FGR1                X.産科合併症.前置胎盤1  
##                              0.53271                              -0.72799  
##               X.産科合併症.羊水過多1                X.産科合併症.羊水過少1  
##                              0.36530                               0.23873  
##   X.母体産科既往歴.妊娠中の性器出血1    X.母体産科既往歴.常位胎盤早期剥離1  
##                             -0.39744                               1.66210  
##             X.母体基礎疾患.子宮奇形1          X.母体基礎疾患.本態性高血圧1  
##                              0.52349                               0.20798  
## X.母体使用薬剤.肺成熟目的ステロイド1            X.母体使用薬剤.アスピリン1  
##                              0.86995                              -0.20207  
##             X.母体基礎疾患.精神疾患1                             多胎妊娠1  
##                             -0.09930                              -0.70981  
##                          早産歴あり1              X.母体使用薬剤.ヘパリン1  
##                              0.18055                               0.47000  
##         X.母体使用薬剤.Caブロッカー1        X.母体産科既往歴.妊娠高血圧症1  
##                              0.16787                               0.20949  
##                              経産婦1  
##                              0.06595  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053915 Residual
## Null Deviance:       112100 
## Residual Deviance: 109400    AIC: 109500
# 最終的な選択されたモデルを表示
summary(model_8.1)
## 
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 + 
##     X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 + 
##     X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR + 
##     X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 + 
##     X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 + 
##     多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン + 
##     X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 + 
##     経産婦, family = binomial, data = df_imp_test)
## 
## Coefficients:
##                                      Estimate Std. Error  z value Pr(>|z|)    
## (Intercept)                          -4.88451    0.01848 -264.265  < 2e-16 ***
## 不妊治療2                             0.05859    0.03764    1.557 0.119496    
## 不妊治療3                            -0.11660    0.03820   -3.053 0.002268 ** 
## 妊娠前喫煙1                          -0.09630    0.03326   -2.895 0.003791 ** 
## 妊娠中喫煙1                           0.30793    0.05464    5.636 1.74e-08 ***
## 飲酒1                                 0.11399    0.04928    2.313 0.020724 *  
## パートナー飲酒1                      -0.14050    0.02740   -5.127 2.94e-07 ***
## X.産科合併症.重症悪阻1               -0.50166    0.12691   -3.953 7.72e-05 ***
## X.産科合併症.切迫早産1                0.40557    0.02520   16.095  < 2e-16 ***
## X.産科合併症.妊娠高血圧症候群1        0.58221    0.03658   15.917  < 2e-16 ***
## X.産科合併症.FGR1                     0.53271    0.03906   13.637  < 2e-16 ***
## X.産科合併症.前置胎盤1               -0.72799    0.11303   -6.441 1.19e-10 ***
## X.産科合併症.羊水過多1                0.36530    0.09868    3.702 0.000214 ***
## X.産科合併症.羊水過少1                0.23873    0.06374    3.745 0.000180 ***
## X.母体産科既往歴.妊娠中の性器出血1   -0.39744    0.19769   -2.010 0.044385 *  
## X.母体産科既往歴.常位胎盤早期剥離1    1.66210    0.07042   23.603  < 2e-16 ***
## X.母体基礎疾患.子宮奇形1              0.52349    0.11352    4.611 4.00e-06 ***
## X.母体基礎疾患.本態性高血圧1          0.20798    0.08111    2.564 0.010346 *  
## X.母体使用薬剤.肺成熟目的ステロイド1  0.86995    0.03823   22.757  < 2e-16 ***
## X.母体使用薬剤.アスピリン1           -0.20207    0.09588   -2.107 0.035082 *  
## X.母体基礎疾患.精神疾患1             -0.09930    0.05882   -1.688 0.091351 .  
## 多胎妊娠1                            -0.70981    0.05087  -13.953  < 2e-16 ***
## 早産歴あり1                           0.18055    0.05077    3.556 0.000376 ***
## X.母体使用薬剤.ヘパリン1              0.47000    0.06638    7.080 1.44e-12 ***
## X.母体使用薬剤.Caブロッカー1          0.16787    0.05214    3.219 0.001285 ** 
## X.母体産科既往歴.妊娠高血圧症1        0.20949    0.05578    3.755 0.000173 ***
## 経産婦1                               0.06595    0.02144    3.076 0.002095 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 112082  on 1053941  degrees of freedom
## Residual deviance: 109421  on 1053915  degrees of freedom
## AIC: 109475
## 
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_8.1 <- predict(model_8.1, type = "response")
roc_8.1 <- roc(df_imp_test$X.産科合併症.常位胎盤早期剥離, prediction_8.1)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.1)
## Area under the curve: 0.6264
## 検証用データにあてはめる。
prediction_8.1_verify<- predict(model_8.1, newdata = df_imp_verify, type = "response")
roc_8.1_verify <- roc(df_imp_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.1_verify)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.1_verify)
## Area under the curve: 0.6126
## vifを計算
vif_8.1 <- vif(model_8.1)
vif_8.1
##                            不妊治療2                            不妊治療3 
##                             1.042526                             1.040311 
##                          妊娠前喫煙1                          妊娠中喫煙1 
##                             1.227823                             1.224690 
##                                飲酒1                      パートナー飲酒1 
##                             1.027260                             1.032449 
##               X.産科合併症.重症悪阻1               X.産科合併症.切迫早産1 
##                             1.001040                             1.141672 
##       X.産科合併症.妊娠高血圧症候群1                    X.産科合併症.FGR1 
##                             1.389210                             1.130779 
##               X.産科合併症.前置胎盤1               X.産科合併症.羊水過多1 
##                             1.006873                             1.006441 
##               X.産科合併症.羊水過少1   X.母体産科既往歴.妊娠中の性器出血1 
##                             1.042684                             1.046917 
##   X.母体産科既往歴.常位胎盤早期剥離1             X.母体基礎疾患.子宮奇形1 
##                             1.117554                             1.003245 
##         X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1 
##                             1.090491                             1.202293 
##           X.母体使用薬剤.アスピリン1             X.母体基礎疾患.精神疾患1 
##                             1.068691                             1.003401 
##                            多胎妊娠1                          早産歴あり1 
##                             1.081255                             1.128692 
##             X.母体使用薬剤.ヘパリン1         X.母体使用薬剤.Caブロッカー1 
##                             1.066053                             1.326646 
##       X.母体産科既往歴.妊娠高血圧症1                              経産婦1 
##                             1.138819                             1.120676
# write.csv(vif_8.1, file = "vif_8.1.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)

# calibration plotを描く
prediction_8.1_calib <- predict(model_8.1, newdata = df_imp_verify, type = 'response')
## 注意!!calibration plotは、outcomeがnumericでないとできない!!

df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
class(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.1_calib, y=df_imp_verify$X.産科合併症.常位胎盤早期剥離,g=10)
##           Dxy       C (ROC)            R2             D      D:Chi-sq 
##  2.248575e-01  6.124288e-01  2.072791e-02  2.208640e-03  4.718202e+02 
##           D:p             U      U:Chi-sq           U:p             Q 
##            NA  9.485753e+00  2.022099e+06  0.000000e+00 -9.483544e+00 
##         Brier     Intercept         Slope          Emax           E90 
##  1.010733e+00 -5.296658e-01  8.734430e-01  1.003696e+00  1.001833e+00 
##          Eavg           S:z           S:p 
##  1.000832e+00  4.775380e+03  0.000000e+00
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_verify$X.産科合併症.常位胎盤早期剥離)

# png("calibration_plot_8.1.png", width = 800, height = 600)
# val.prob(p = prediction_8.1_calib, y = df_imp_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()

# 8.2 ロジスティック回帰,欠測補完なし,ステップワイズ
model_8.2_pre <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠前喫煙+妊娠中喫煙+飲酒+パートナー喫煙+
                   パートナー飲酒+X.産科合併症.歯周病+X.産科合併症.重症悪阻+X.産科合併症.切迫早産+
                   X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.前置胎盤+
                   X.産科合併症.羊水過多+X.産科合併症.羊水過少+X.母体産科既往歴.妊娠中の性器出血+
                   X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
                   X.母体基礎疾患.甲状腺.機能低下症.+X.母体基礎疾患.子宮奇形+
                   X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.肺成熟目的ステロイド+
                   X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+X.母体基礎疾患.精神疾患+
                   多胎妊娠+早産歴あり+X.母体使用薬剤.ヘパリン+X.母体使用薬剤.Caブロッカー+
                   X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
                 family=binomial, data=df_miss_test)
model_8.2_pre
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー喫煙 + 
##     パートナー飲酒 + X.産科合併症.歯周病 + X.産科合併症.重症悪阻 + 
##     X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 + 
##     X.産科合併症.FGR + X.産科合併症.前置胎盤 + 
##     X.産科合併症.羊水過多 + X.産科合併症.羊水過少 + 
##     X.母体産科既往歴.妊娠中の性器出血 + X.母体産科既往歴.常位胎盤早期剥離 + 
##     X.母体産科既往歴.死産 + X.母体産科既往歴.FGR + 
##     X.母体基礎疾患.甲状腺.機能低下症. + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.自己免疫疾患 + 
##     X.母体基礎疾患.精神疾患 + 多胎妊娠 + 早産歴あり + 
##     X.母体使用薬剤.ヘパリン + X.母体使用薬剤.Caブロッカー + 
##     X.母体産科既往歴.妊娠高血圧症 + 痩せ + 肥満 + 
##     経産婦, family = binomial, data = df_miss_test)
## 
## Coefficients:
##                          (Intercept)                             不妊治療2  
##                             -4.88201                               0.05940  
##                            不妊治療3                           妊娠前喫煙1  
##                             -0.11581                              -0.08167  
##                          妊娠中喫煙1                                 飲酒1  
##                              0.32001                               0.11187  
##                      パートナー喫煙1                       パートナー飲酒1  
##                             -0.04255                              -0.13062  
##                 X.産科合併症.歯周病1                X.産科合併症.重症悪阻1  
##                             -0.20212                              -0.50095  
##               X.産科合併症.切迫早産1        X.産科合併症.妊娠高血圧症候群1  
##                              0.40491                               0.58603  
##                    X.産科合併症.FGR1                X.産科合併症.前置胎盤1  
##                              0.53336                              -0.72752  
##               X.産科合併症.羊水過多1                X.産科合併症.羊水過少1  
##                              0.36663                               0.24013  
##   X.母体産科既往歴.妊娠中の性器出血1    X.母体産科既往歴.常位胎盤早期剥離1  
##                             -0.38831                               1.65311  
##               X.母体産科既往歴.死産1                 X.母体産科既往歴.FGR1  
##                              0.07573                              -0.04828  
##   X.母体基礎疾患.甲状腺.機能低下症.1              X.母体基礎疾患.子宮奇形1  
##                             -0.04389                               0.52271  
##         X.母体基礎疾患.本態性高血圧1  X.母体使用薬剤.肺成熟目的ステロイド1  
##                              0.21617                               0.87014  
##           X.母体使用薬剤.アスピリン1          X.母体基礎疾患.自己免疫疾患1  
##                             -0.21286                               0.08146  
##             X.母体基礎疾患.精神疾患1                             多胎妊娠1  
##                             -0.09901                              -0.70965  
##                          早産歴あり1              X.母体使用薬剤.ヘパリン1  
##                              0.18007                               0.46559  
##         X.母体使用薬剤.Caブロッカー1        X.母体産科既往歴.妊娠高血圧症1  
##                              0.16863                               0.21576  
##                                痩せ1                                 肥満1  
##                              0.01805                              -0.03733  
##                              経産婦1  
##                              0.06705  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053907 Residual
## Null Deviance:       112100 
## Residual Deviance: 109400    AIC: 109500
results_miss <- data.frame()
## χ二乗統計量やp値や自由度計算する
# for (var in glm_variables) {
#   fit <- glm(formula(paste("X.産科合併症.常位胎盤早期剥離 ~", var)), data = df_miss_test, family = binomial(link = "logit"))
#   anova_res <- anova(fit, test = "Chisq")
#   chi2 <- round(anova_res$Deviance[2], 4)
#   df <- anova_res$Df[2]
#   coef_table <- summary(fit)$coefficients
#   OR <- round(exp(coef_table[2, 1]), 4)
#   lower_ci <- round(exp(coef_table[2, 1] - 1.96 * coef_table[2, 2]), 4)
#   upper_ci <- round(exp(coef_table[2, 1] + 1.96 * coef_table[2, 2]), 4)
#   wald_p_value <- round(coef_table[2, 4], 4)
#   temp_df_miss <- data.frame(Variable = var, Chi2 = chi2, Df = df, P_value = wald_p_value, Odds_Ratio = OR, Lower_CI = lower_ci, Upper_CI = upper_ci)
#   results_miss <- rbind(results_miss, temp_df)
# }
# print(results_miss)
# write.csv(results_miss, file = "logistic_miss_prestep.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)

## stepwiseで変数を選択する
# logistic_miss_step <- step(model_glm_miss, direction = "both", trace = 1)
# saveRDS(logistic_miss_step, file = "logistic_miss_step.rds")
model_8.2<-readRDS("logistic_miss_step.rds")
model_8.2
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 + 
##     X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 + 
##     X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR + 
##     X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 + 
##     X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 + 
##     多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン + 
##     X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 + 
##     経産婦, family = binomial, data = df_miss_test)
## 
## Coefficients:
##                          (Intercept)                             不妊治療2  
##                             -4.88451                               0.05859  
##                            不妊治療3                           妊娠前喫煙1  
##                             -0.11660                              -0.09630  
##                          妊娠中喫煙1                                 飲酒1  
##                              0.30793                               0.11399  
##                      パートナー飲酒1                X.産科合併症.重症悪阻1  
##                             -0.14050                              -0.50166  
##               X.産科合併症.切迫早産1        X.産科合併症.妊娠高血圧症候群1  
##                              0.40557                               0.58221  
##                    X.産科合併症.FGR1                X.産科合併症.前置胎盤1  
##                              0.53271                              -0.72799  
##               X.産科合併症.羊水過多1                X.産科合併症.羊水過少1  
##                              0.36530                               0.23873  
##   X.母体産科既往歴.妊娠中の性器出血1    X.母体産科既往歴.常位胎盤早期剥離1  
##                             -0.39744                               1.66210  
##             X.母体基礎疾患.子宮奇形1          X.母体基礎疾患.本態性高血圧1  
##                              0.52349                               0.20798  
## X.母体使用薬剤.肺成熟目的ステロイド1            X.母体使用薬剤.アスピリン1  
##                              0.86995                              -0.20207  
##             X.母体基礎疾患.精神疾患1                             多胎妊娠1  
##                             -0.09930                              -0.70981  
##                          早産歴あり1              X.母体使用薬剤.ヘパリン1  
##                              0.18055                               0.47000  
##         X.母体使用薬剤.Caブロッカー1        X.母体産科既往歴.妊娠高血圧症1  
##                              0.16787                               0.20949  
##                              経産婦1  
##                              0.06595  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053915 Residual
## Null Deviance:       112100 
## Residual Deviance: 109400    AIC: 109500
# 最終的な選択されたモデルを表示
summary(model_8.2)
## 
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠前喫煙 + 妊娠中喫煙 + 飲酒 + パートナー飲酒 + 
##     X.産科合併症.重症悪阻 + X.産科合併症.切迫早産 + 
##     X.産科合併症.妊娠高血圧症候群 + X.産科合併症.FGR + 
##     X.産科合併症.前置胎盤 + X.産科合併症.羊水過多 + 
##     X.産科合併症.羊水過少 + X.母体産科既往歴.妊娠中の性器出血 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体基礎疾患.子宮奇形 + 
##     X.母体基礎疾患.本態性高血圧 + X.母体使用薬剤.肺成熟目的ステロイド + 
##     X.母体使用薬剤.アスピリン + X.母体基礎疾患.精神疾患 + 
##     多胎妊娠 + 早産歴あり + X.母体使用薬剤.ヘパリン + 
##     X.母体使用薬剤.Caブロッカー + X.母体産科既往歴.妊娠高血圧症 + 
##     経産婦, family = binomial, data = df_miss_test)
## 
## Coefficients:
##                                      Estimate Std. Error  z value Pr(>|z|)    
## (Intercept)                          -4.88451    0.01848 -264.265  < 2e-16 ***
## 不妊治療2                             0.05859    0.03764    1.557 0.119496    
## 不妊治療3                            -0.11660    0.03820   -3.053 0.002268 ** 
## 妊娠前喫煙1                          -0.09630    0.03326   -2.895 0.003791 ** 
## 妊娠中喫煙1                           0.30793    0.05464    5.636 1.74e-08 ***
## 飲酒1                                 0.11399    0.04928    2.313 0.020724 *  
## パートナー飲酒1                      -0.14050    0.02740   -5.127 2.94e-07 ***
## X.産科合併症.重症悪阻1               -0.50166    0.12691   -3.953 7.72e-05 ***
## X.産科合併症.切迫早産1                0.40557    0.02520   16.095  < 2e-16 ***
## X.産科合併症.妊娠高血圧症候群1        0.58221    0.03658   15.917  < 2e-16 ***
## X.産科合併症.FGR1                     0.53271    0.03906   13.637  < 2e-16 ***
## X.産科合併症.前置胎盤1               -0.72799    0.11303   -6.441 1.19e-10 ***
## X.産科合併症.羊水過多1                0.36530    0.09868    3.702 0.000214 ***
## X.産科合併症.羊水過少1                0.23873    0.06374    3.745 0.000180 ***
## X.母体産科既往歴.妊娠中の性器出血1   -0.39744    0.19769   -2.010 0.044385 *  
## X.母体産科既往歴.常位胎盤早期剥離1    1.66210    0.07042   23.603  < 2e-16 ***
## X.母体基礎疾患.子宮奇形1              0.52349    0.11352    4.611 4.00e-06 ***
## X.母体基礎疾患.本態性高血圧1          0.20798    0.08111    2.564 0.010346 *  
## X.母体使用薬剤.肺成熟目的ステロイド1  0.86995    0.03823   22.757  < 2e-16 ***
## X.母体使用薬剤.アスピリン1           -0.20207    0.09588   -2.107 0.035082 *  
## X.母体基礎疾患.精神疾患1             -0.09930    0.05882   -1.688 0.091351 .  
## 多胎妊娠1                            -0.70981    0.05087  -13.953  < 2e-16 ***
## 早産歴あり1                           0.18055    0.05077    3.556 0.000376 ***
## X.母体使用薬剤.ヘパリン1              0.47000    0.06638    7.080 1.44e-12 ***
## X.母体使用薬剤.Caブロッカー1          0.16787    0.05214    3.219 0.001285 ** 
## X.母体産科既往歴.妊娠高血圧症1        0.20949    0.05578    3.755 0.000173 ***
## 経産婦1                               0.06595    0.02144    3.076 0.002095 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 112082  on 1053941  degrees of freedom
## Residual deviance: 109421  on 1053915  degrees of freedom
## AIC: 109475
## 
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_8.2 <- predict(model_8.2, type = "response")
roc_8.2 <- roc(df_miss_test$X.産科合併症.常位胎盤早期剥離, prediction_8.2)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.2)
## Area under the curve: 0.6264
## 検証用データにあてはめる。
prediction_8.2_verify<- predict(model_8.2, newdata = df_miss_verify, type = "response")
roc_8.2_verify <- roc(df_miss_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.2_verify)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.2_verify)
## Area under the curve: 0.6126
## vifを計算
vif_8.2 <- vif(model_8.2)
vif_8.2
##                            不妊治療2                            不妊治療3 
##                             1.042526                             1.040311 
##                          妊娠前喫煙1                          妊娠中喫煙1 
##                             1.227823                             1.224690 
##                                飲酒1                      パートナー飲酒1 
##                             1.027260                             1.032449 
##               X.産科合併症.重症悪阻1               X.産科合併症.切迫早産1 
##                             1.001040                             1.141672 
##       X.産科合併症.妊娠高血圧症候群1                    X.産科合併症.FGR1 
##                             1.389210                             1.130779 
##               X.産科合併症.前置胎盤1               X.産科合併症.羊水過多1 
##                             1.006873                             1.006441 
##               X.産科合併症.羊水過少1   X.母体産科既往歴.妊娠中の性器出血1 
##                             1.042684                             1.046917 
##   X.母体産科既往歴.常位胎盤早期剥離1             X.母体基礎疾患.子宮奇形1 
##                             1.117554                             1.003245 
##         X.母体基礎疾患.本態性高血圧1 X.母体使用薬剤.肺成熟目的ステロイド1 
##                             1.090491                             1.202293 
##           X.母体使用薬剤.アスピリン1             X.母体基礎疾患.精神疾患1 
##                             1.068691                             1.003401 
##                            多胎妊娠1                          早産歴あり1 
##                             1.081255                             1.128692 
##             X.母体使用薬剤.ヘパリン1         X.母体使用薬剤.Caブロッカー1 
##                             1.066053                             1.326646 
##       X.母体産科既往歴.妊娠高血圧症1                              経産婦1 
##                             1.138819                             1.120676
# write.csv(vif_8.2, file = "vif_8.2.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)

# calibration plotを描く
prediction_8.2_calib <- predict(model_8.2, newdata = df_miss_verify, type = 'response')
df_miss_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_miss_verify$X.産科合併症.常位胎盤早期剥離)
class(df_miss_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.2_calib, y=df_miss_verify$X.産科合併症.常位胎盤早期剥離,g=10)

##           Dxy       C (ROC)            R2             D      D:Chi-sq 
##  2.248575e-01  6.124288e-01  2.072791e-02  2.208640e-03  4.718202e+02 
##           D:p             U      U:Chi-sq           U:p             Q 
##            NA  9.485753e+00  2.022099e+06  0.000000e+00 -9.483544e+00 
##         Brier     Intercept         Slope          Emax           E90 
##  1.010733e+00 -5.296658e-01  8.734430e-01  1.003696e+00  1.001833e+00 
##          Eavg           S:z           S:p 
##  1.000832e+00  4.775380e+03  0.000000e+00
# png("calibration_plot_8.2.png", width = 800, height = 600)
# val.prob(p = prediction_8.2_calib, y = df_miss_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()
df_miss_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_miss_verify$X.産科合併症.常位胎盤早期剥離)


# 8.3 ロジスティック回帰、欠測補完、変数は手動で選択
model_8.3 <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠中喫煙+X.産科合併症.切迫流産.22週未満性器出血.+
                            X.産科合併症.切迫早産+
                        X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.羊水過多+
                        X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
                        X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.塩酸リトドリン+
                        X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+
                        早産歴あり+X.母体使用薬剤.ヘパリン+
                        X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
                      family=binomial, data=df_imp_test)
model_8.3
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. + 
##     X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 + 
##     X.産科合併症.FGR + X.産科合併症.羊水過多 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 + 
##     X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 + 
##     X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン + 
##     X.母体基礎疾患.自己免疫疾患 + 早産歴あり + 
##     X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 + 
##     痩せ + 肥満 + 経産婦, family = binomial, data = df_imp_test)
## 
## Coefficients:
##                              (Intercept)  
##                                 -4.93613  
##                                不妊治療2  
##                                 -0.02952  
##                                不妊治療3  
##                                 -0.16499  
##                              妊娠中喫煙1  
##                                  0.22718  
## X.産科合併症.切迫流産.22週未満性器出血.1  
##                                  0.19375  
##                   X.産科合併症.切迫早産1  
##                                  0.26038  
##           X.産科合併症.妊娠高血圧症候群1  
##                                  0.66946  
##                        X.産科合併症.FGR1  
##                                  0.63468  
##                   X.産科合併症.羊水過多1  
##                                  0.40470  
##       X.母体産科既往歴.常位胎盤早期剥離1  
##                                  1.62624  
##                   X.母体産科既往歴.死産1  
##                                  0.10006  
##                    X.母体産科既往歴.FGR1  
##                                 -0.03399  
##             X.母体基礎疾患.本態性高血圧1  
##                                  0.34179  
##           X.母体使用薬剤.塩酸リトドリン1  
##                                  0.24851  
##               X.母体使用薬剤.アスピリン1  
##                                 -0.19170  
##             X.母体基礎疾患.自己免疫疾患1  
##                                  0.11064  
##                              早産歴あり1  
##                                  0.24681  
##                 X.母体使用薬剤.ヘパリン1  
##                                  0.50647  
##           X.母体産科既往歴.妊娠高血圧症1  
##                                  0.23890  
##                                    痩せ1  
##                                  0.01135  
##                                    肥満1  
##                                 -0.03183  
##                                  経産婦1  
##                                  0.05400  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053920 Residual
## Null Deviance:       112100 
## Residual Deviance: 110100    AIC: 110200
## 続いてAUCを計算
prediction_8.3 <- predict(model_8.3, type = "response")
roc_8.3 <- roc(df_imp_test$X.産科合併症.常位胎盤早期剥離, prediction_8.3)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_8.3)
## Area under the curve: 0.6107
## 検証用データにあてはめる。
prediction_8.3_verify<- predict(model_8.3, newdata = df_imp_verify, type = "response")
roc_8.3_verify <- roc(df_imp_verify$X.産科合併症.常位胎盤早期剥離, prediction_8.3_verify)
## Setting levels: control = 1, case = 2
## Setting direction: controls < cases
auc(roc_8.3_verify)
## Area under the curve: 0.5873
## vifを計算
vif_8.3 <- vif(model_8.3)
vif_8.3
##                                不妊治療2 
##                                 1.025609 
##                                不妊治療3 
##                                 1.036762 
##                              妊娠中喫煙1 
##                                 1.003710 
## X.産科合併症.切迫流産.22週未満性器出血.1 
##                                 1.014004 
##                   X.産科合併症.切迫早産1 
##                                 1.998500 
##           X.産科合併症.妊娠高血圧症候群1 
##                                 1.161015 
##                        X.産科合併症.FGR1 
##                                 1.069814 
##                   X.産科合併症.羊水過多1 
##                                 1.004835 
##       X.母体産科既往歴.常位胎盤早期剥離1 
##                                 1.098473 
##                   X.母体産科既往歴.死産1 
##                                 1.057454 
##                    X.母体産科既往歴.FGR1 
##                                 1.064994 
##             X.母体基礎疾患.本態性高血圧1 
##                                 1.072702 
##           X.母体使用薬剤.塩酸リトドリン1 
##                                 2.004094 
##               X.母体使用薬剤.アスピリン1 
##                                 1.088589 
##             X.母体基礎疾患.自己免疫疾患1 
##                                 1.020704 
##                              早産歴あり1 
##                                 1.140655 
##                 X.母体使用薬剤.ヘパリン1 
##                                 1.067418 
##           X.母体産科既往歴.妊娠高血圧症1 
##                                 1.154659 
##                                    痩せ1 
##                                 1.020080 
##                                    肥満1 
##                                 1.037726 
##                                  経産婦1 
##                                 1.124905
# write.csv(vif_8.3, file = "vif_8.3.csv", fileEncoding = "SHIFT-JIS",row.names = FALSE)

# calibration plotを描く
prediction_8.3_calib <- predict(model_8.3, newdata = df_imp_verify, type = 'response')
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.numeric(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
class(df_imp_verify$X.産科合併症.常位胎盤早期剥離)
## [1] "numeric"
val.prob(p=prediction_8.3_calib, y=df_imp_verify$X.産科合併症.常位胎盤早期剥離,g=10)

##           Dxy       C (ROC)            R2             D      D:Chi-sq 
##  1.748256e-01  5.874128e-01  1.341423e-02  1.427124e-03  3.052228e+02 
##           D:p             U      U:Chi-sq           U:p             Q 
##            NA  9.470875e+00  2.018927e+06  0.000000e+00 -9.469448e+00 
##         Brier     Intercept         Slope          Emax           E90 
##  1.011273e+00 -5.723053e-01  8.598175e-01  1.004241e+00  1.001785e+00 
##          Eavg           S:z           S:p 
##  1.000628e+00  4.821181e+03  0.000000e+00
# png("calibration_plot_8.3.png", width = 800, height = 600)
# val.prob(p = prediction_8.3_calib, y = df_imp_verify$X.産科合併症.常位胎盤早期剥離, g = 10)
# dev.off()
df_imp_verify$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_verify$X.産科合併症.常位胎盤早期剥離)


# 8.4 ロジスティック回帰、欠測未補完、変数は手動で選択
model_glm_miss_self <- glm(X.産科合併症.常位胎盤早期剥離 ~不妊治療+妊娠中喫煙+X.産科合併症.切迫流産.22週未満性器出血.+
                            X.産科合併症.切迫早産+
                            X.産科合併症.妊娠高血圧症候群+X.産科合併症.FGR+X.産科合併症.羊水過多+
                            X.母体産科既往歴.常位胎盤早期剥離+X.母体産科既往歴.死産+X.母体産科既往歴.FGR+
                            X.母体基礎疾患.本態性高血圧+X.母体使用薬剤.塩酸リトドリン+
                            X.母体使用薬剤.アスピリン+X.母体基礎疾患.自己免疫疾患+
                            早産歴あり+X.母体使用薬剤.ヘパリン+
                            X.母体産科既往歴.妊娠高血圧症+痩せ+肥満+経産婦,
                          family=binomial, data=df_miss_test)
model_glm_miss_self
## 
## Call:  glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. + 
##     X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 + 
##     X.産科合併症.FGR + X.産科合併症.羊水過多 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 + 
##     X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 + 
##     X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン + 
##     X.母体基礎疾患.自己免疫疾患 + 早産歴あり + 
##     X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 + 
##     痩せ + 肥満 + 経産婦, family = binomial, data = df_miss_test)
## 
## Coefficients:
##                              (Intercept)  
##                                 -4.93613  
##                                不妊治療2  
##                                 -0.02952  
##                                不妊治療3  
##                                 -0.16499  
##                              妊娠中喫煙1  
##                                  0.22718  
## X.産科合併症.切迫流産.22週未満性器出血.1  
##                                  0.19375  
##                   X.産科合併症.切迫早産1  
##                                  0.26038  
##           X.産科合併症.妊娠高血圧症候群1  
##                                  0.66946  
##                        X.産科合併症.FGR1  
##                                  0.63468  
##                   X.産科合併症.羊水過多1  
##                                  0.40470  
##       X.母体産科既往歴.常位胎盤早期剥離1  
##                                  1.62624  
##                   X.母体産科既往歴.死産1  
##                                  0.10006  
##                    X.母体産科既往歴.FGR1  
##                                 -0.03399  
##             X.母体基礎疾患.本態性高血圧1  
##                                  0.34179  
##           X.母体使用薬剤.塩酸リトドリン1  
##                                  0.24851  
##               X.母体使用薬剤.アスピリン1  
##                                 -0.19170  
##             X.母体基礎疾患.自己免疫疾患1  
##                                  0.11064  
##                              早産歴あり1  
##                                  0.24681  
##                 X.母体使用薬剤.ヘパリン1  
##                                  0.50647  
##           X.母体産科既往歴.妊娠高血圧症1  
##                                  0.23890  
##                                    痩せ1  
##                                  0.01135  
##                                    肥満1  
##                                 -0.03183  
##                                  経産婦1  
##                                  0.05400  
## 
## Degrees of Freedom: 1053941 Total (i.e. Null);  1053920 Residual
## Null Deviance:       112100 
## Residual Deviance: 110100    AIC: 110200
summary(model_glm_miss_self)
## 
## Call:
## glm(formula = X.産科合併症.常位胎盤早期剥離 ~ 不妊治療 + 
##     妊娠中喫煙 + X.産科合併症.切迫流産.22週未満性器出血. + 
##     X.産科合併症.切迫早産 + X.産科合併症.妊娠高血圧症候群 + 
##     X.産科合併症.FGR + X.産科合併症.羊水過多 + 
##     X.母体産科既往歴.常位胎盤早期剥離 + X.母体産科既往歴.死産 + 
##     X.母体産科既往歴.FGR + X.母体基礎疾患.本態性高血圧 + 
##     X.母体使用薬剤.塩酸リトドリン + X.母体使用薬剤.アスピリン + 
##     X.母体基礎疾患.自己免疫疾患 + 早産歴あり + 
##     X.母体使用薬剤.ヘパリン + X.母体産科既往歴.妊娠高血圧症 + 
##     痩せ + 肥満 + 経産婦, family = binomial, data = df_miss_test)
## 
## Coefficients:
##                                          Estimate Std. Error  z value Pr(>|z|)
## (Intercept)                              -4.93613    0.01827 -270.152  < 2e-16
## 不妊治療2                                -0.02952    0.03730   -0.791   0.4287
## 不妊治療3                                -0.16499    0.03810   -4.330 1.49e-05
## 妊娠中喫煙1                               0.22718    0.04942    4.597 4.29e-06
## X.産科合併症.切迫流産.22週未満性器出血.1  0.19375    0.07623    2.542   0.0110
## X.産科合併症.切迫早産1                    0.26038    0.03329    7.821 5.26e-15
## X.産科合併症.妊娠高血圧症候群1            0.66946    0.03335   20.071  < 2e-16
## X.産科合併症.FGR1                         0.63468    0.03786   16.765  < 2e-16
## X.産科合併症.羊水過多1                    0.40470    0.09848    4.109 3.97e-05
## X.母体産科既往歴.常位胎盤早期剥離1        1.62624    0.06951   23.397  < 2e-16
## X.母体産科既往歴.死産1                    0.10006    0.08666    1.155   0.2482
## X.母体産科既往歴.FGR1                    -0.03399    0.09268   -0.367   0.7138
## X.母体基礎疾患.本態性高血圧1              0.34179    0.08010    4.267 1.98e-05
## X.母体使用薬剤.塩酸リトドリン1            0.24851    0.03237    7.677 1.63e-14
## X.母体使用薬剤.アスピリン1               -0.19170    0.09648   -1.987   0.0469
## X.母体基礎疾患.自己免疫疾患1              0.11064    0.09908    1.117   0.2641
## 早産歴あり1                               0.24681    0.05088    4.851 1.23e-06
## X.母体使用薬剤.ヘパリン1                  0.50647    0.06620    7.651 2.00e-14
## X.母体産科既往歴.妊娠高血圧症1            0.23890    0.05601    4.265 2.00e-05
## 痩せ1                                     0.01135    0.03281    0.346   0.7294
## 肥満1                                    -0.03183    0.03463   -0.919   0.3580
## 経産婦1                                   0.05400    0.02146    2.516   0.0119
##                                             
## (Intercept)                              ***
## 不妊治療2                                   
## 不妊治療3                                ***
## 妊娠中喫煙1                              ***
## X.産科合併症.切迫流産.22週未満性器出血.1 *  
## X.産科合併症.切迫早産1                   ***
## X.産科合併症.妊娠高血圧症候群1           ***
## X.産科合併症.FGR1                        ***
## X.産科合併症.羊水過多1                   ***
## X.母体産科既往歴.常位胎盤早期剥離1       ***
## X.母体産科既往歴.死産1                      
## X.母体産科既往歴.FGR1                       
## X.母体基礎疾患.本態性高血圧1             ***
## X.母体使用薬剤.塩酸リトドリン1           ***
## X.母体使用薬剤.アスピリン1               *  
## X.母体基礎疾患.自己免疫疾患1                
## 早産歴あり1                              ***
## X.母体使用薬剤.ヘパリン1                 ***
## X.母体産科既往歴.妊娠高血圧症1           ***
## 痩せ1                                       
## 肥満1                                       
## 経産婦1                                  *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 112082  on 1053941  degrees of freedom
## Residual deviance: 110148  on 1053920  degrees of freedom
## AIC: 110192
## 
## Number of Fisher Scoring iterations: 7
## 続いてAUCを計算
prediction_model_glm_miss_self <- predict(model_glm_miss_self, type = "response")
roc_model_glm_miss_self <- roc(df_miss_test$X.産科合併症.常位胎盤早期剥離, prediction_model_glm_miss_self)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
auc(roc_model_glm_miss_self)
## Area under the curve: 0.6107
## 検証用データにあてはめる。
prediction_miss_self_verify<- predict(model_glm_miss_self, newdata = df_miss_verify, type = "response")
roc_logistic_miss_self_verify <- roc(df_miss_verify$X.産科合併症.常位胎盤早期剥離, prediction_miss_self_verify)
## Setting levels: control = 1, case = 2
## Setting direction: controls < cases
auc(roc_logistic_miss_self_verify)
## Area under the curve: 0.5873
# 8.5 SVM 欠測補完あり
# model_8.5<-ksvm(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# saveRDS(model_8.5, file = "model_8.5.rds")
model_8.5<-readRDS("model_8.5.rds")
model_8.5
## Support Vector Machine object of class "ksvm" 
## 
## SV type: C-svc  (classification) 
##  parameter : cost C = 1 
## 
## Gaussian Radial Basis kernel function. 
##  Hyperparameter : sigma =  2.17772275990075e-05 
## 
## Number of Support Vectors : 36886 
## 
## Objective Function Value : -19789.06 
## Training error : 0.009388
# > model_8.5
# Support Vector Machine object of class "ksvm" 
# 
# SV type: C-svc  (classification)  これは分類を表す
# parameter : cost C = 1  cパラメータの誤分類コスト 目標0.01-10.00
# 
# Gaussian Radial Basis kernel function. 
# Hyperparameter : sigma =  2.17772275990075e-05 
# 
# Number of Support Vectors : 36886 
# 
# Objective Function Value : -19789.06 
# Training error : 0.009388  訓練誤差0.9388%

# 答え合わせ
# まずは学習データで
# result_svm<-predict(model_8.5, df_imp_test)
# saveRDS(result_svm, file="result_svm.rds")
# result_svm <- readRDS("result_svm.rds")
# summary(result_svm)
# table(result_svm)
# table(df_imp_test$X.産科合併症.常位胎盤早期剥離)
# table(result_svm, df_imp_test$X.産科合併症.常位胎盤早期剥離)
# 続いて検証データで
# result_svm_verify <- predict(model_8.5, data = df_imp_verify)
## 検証用データでエラーが出てしまう

# ROCの確認
# svm_probabilities <- predict(model_8.5, newdata = df_imp_test, type = "response")
# summary(svm_probabilities)
# svm_probabilities<-as.numeric(svm_probabilities)
# df_imp_test$X.産科合併症.常位胎盤早期剥離 <- as.factor(df_imp_test$X.産科合併症.常位胎盤早期剥離)
# 
# roc_8.5 <- roc(response = df_imp_test$X.産科合併症.常位胎盤早期剥離, predictor = svm_probabilities)
# roc_8.5 <- roc(response = df_imp_test$X.産科合併症.常位胎盤早期剥離, predictor = svm_probabilities, levels = c(0, 1))
# auc_8.5 <- auc(roc_8.5)

# SVMの検証用データでエラーが出る



# 8.8 ランダムフォレスト

# model_8.8<-randomForest(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# saveRDS(model_8.8, file="model_8.8.rds")
model_8.8<-readRDS("model_8.8.rds")
model_8.8
## 
## Call:
##  randomForest(formula = X.産科合併症.常位胎盤早期剥離 ~      ., data = df_no_missing) 
##                Type of random forest: classification
##                      Number of trees: 500
## No. of variables tried at each split: 9
## 
##         OOB estimate of  error rate: 0.92%
## Confusion matrix:
##         1   2  class.error
## 1 1044032   5 4.789102e-06
## 2    9666 229 9.768570e-01
# result_8.8<-predict(model_8.8,df_imp_verify_selected)

# 8.9 決定木
# rpart(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)
# 8.10 ニューラルネットワーク
# nnet(X.産科合併症.常位胎盤早期剥離 ~., data=df_imp_test)