# ============================================================
# ⚙️ CÀI ĐẶT CHUNG
# ============================================================
knitr::opts_chunk$set(echo = FALSE, message = FALSE, warning = FALSE)

# Nạp thư viện cần thiết
library(dplyr)
library(ggplot2)
library(readr)
library(gmodels)
library(broom)
library(knitr)
library(car)
library(summarytools)

# ============================================================
# 📊 PHÂN TÍCH: CÁC YẾU TỐ LIÊN QUAN ĐẾN CHĂM SÓC TRƯỚC & SAU SINH
# ============================================================

# --- 1. Đọc và ghép dữ liệu ---
wm <- read_csv("C:/Users/DELL/Downloads/wm (1).csv")
hh <- read_csv("C:/Users/DELL/Downloads/hh (1).csv")
hl <- read_csv("C:/Users/DELL/Downloads/hl.csv")

data <- wm %>%
  left_join(hh, by = c("HH1", "HH2")) %>%
  left_join(hl, by = c("HH1", "HH2"))

# Hiển thị 5 dòng đầu tiên của dữ liệu gốc
kable(head(data, 5), caption = "Bảng 1. Năm dòng đầu tiên của dữ liệu gốc")
Bảng 1. Năm dòng đầu tiên của dữ liệu gốc
HH1 HH2 LN WM1 WM2 WM3 WMINT WM4 WM5 WM6D WM6M WM6Y WM8 WM9 WM17 WM7H WM7M WM10H WM10M WM11 WM12 WM13 WM14 WM15 WM22 WM23 WM24 WMHINT WMFIN WB3M WB3Y WB4 WB5 WB6A WB6B WB7 WB9 WB10A WB10B WB11 WB12A WB12B WB14 WB15 WB16 WB17 WB18 WB19A WB19B WB19C WB19D WB19E WB19F WB19X WB19NR MT1 MT2 MT3 MT4 MT5 MT6A MT6B MT6C MT6D MT6E MT6F MT6G MT6H MT6I MT9 MT10 MT11 MT12 CM1 CM2 CM3 CM4 CM5 CM6 CM7 CM8 CM9 CM10 CM11 CM12 CM15 CM17 BH11 INTROBX BHAUX INTROBH AB0B AB1A AB1B AB2M AB2Y AB9 AB10 AB11 AB12A AB12B AB12C AB12D AB12E AB12F AB12G AB12H AB12X AB12Z AB12NR AB13 AB14A AB14B AB14C AB14D AB14E AB14X AB14Z AB14NR DB2 DB4 MN2 MN3A MN3B MN3F MN3G MN3X MN3NR MN4AU MN4AN MN5 MN6A MN6B MN6C MN7 MN8 MN9 MN11 MN12 MN14 MN19A MN19B MN19F MN19G MN19H MN19X MN19Y MN19NR MN20 MN21 MN22 MN23 MN24 MN25 MN26U MN26N MN28 MN29 MN30 MN31A MN31B MN31C MN31X MN31Z MN31NR MN32 MN33 MN34A MN34 MN35 MN36 MN37U MN37N MN38 MN39A MN39B MN39C MN39D MN39E MN39F MN39G MN39H MN39I MN39J MN39X MN39Y MN39NR PN3U PN3N PN4 PN5 PN6 PN8 PN9 PN10 PN11 PN12 PN13U PN13N PN14A PN14B PN14F PN14G PN14H PN14X PN14Y PN14NR PN15 PN17 PN19 PN20 PN21 PN22U PN22N PN23A PN23B PN23F PN23G PN23H PN23X PN23NR PN24 PN25A PN25B PN25C PN27 PN29 PN30 CP1 CP2 CP3 CP4A CP4B CP4C CP4D CP4E CP4F CP4G CP4H CP4I CP4J CP4K CP4L CP4M CP4X CP4NR CP5 UN2 UN4 UN5 UN7 UN8U UN8N UN11 UN12A UN12B UN12C UN12D UN12E UN12F UN12G UN12H UN12I UN12X UN12Z UN12NR UN14U UN14N UN16 UN17 UN18 UN19 DV1A DV1B DV1C DV1D DV1E VT1 VT2 VT3 VT5 VT6 VT7A VT7B VT7X VT7NR VT8 VT9 VT10 VT11 VT12 VT13 VT14 VT17 VT18A VT18B VT18X VT18NR VT19 VT20 VT21 VT22A VT22B VT22C VT22D VT22E VT22F VT22X MA1 MA2 MA3 MA4 MA5 MA6 MA7 MA8M MA8Y MA11 SB1 SB2U SB2N SB3 SB4 SB6 SB7 SB8 SB9 SB12 SB13 HA1 HA2 HA3 HA4 HA5 HA6 HA7 HA8A HA8B HA8C HA10 HA13A HA13B HA13C HA13D HA14 HA15 HA16 HA18 HA19 HA20 HA22 HA23 HA24 HA25 HA26 HA27 HA28 HA29 HA30 HA31 HA32 HA33 HA34 HA35 HA36 CCP0 CCP1 CCP2 CCP3 CCP3AM CCP3AY CCP3BM CCP3BY CCP3CM CCP3CY CCP4 CCP4A CCP5 CCP6 CCP7M CCP7Y CCP8M CCP8Y LS1 LS2 LS3 LS4 WM25$1 WM25$2 WM25$3 WM26A$1 WM26A$2 WM26A$3 WM26B$1 WM26B$2 WM26B$3 WM27A$1 WM27A$2 WM27A$3 WM27B$1 WM27B$2 WM27B$3 WM27C$1 WM27C$2 WM27C$3 WM27D$1 WM27D$2 WM27D$3 WM27E$1 WM27E$2 WM27E$3 WM27X$1 WM27X$2 WM27X$3 WM28$1 WM28$2 WM28$3 HH4.x HH6.x HH7.x HH7A.x WDOI WAGE WDOB WDOM WAGEM WDOBFC WDOBLC MSTATUS CEB CSURV CDEAD welevel insurance ethnicity.x ethnicity2.x BH3_FIRST BH3_LAST BH4D_first BH4M_first BH4Y_first BH6_first BH4D_last BH4M_last BH4Y_last BH6_last wmweight wscore.x windex5.x windex10.x wscoreu.x windex5u.x windex10u.x wscorer.x windex5r.x windex10r.x PSU.x stratum.x HH3 HH4.y HH5D.x HH5M.x HH5Y.x HH6.y HH7.y HH8 HH9 HH10 HH11H HH11M HH12 HH46 HH13H HH13M HH14 HH15 HH16 HH17 HH26A HH26B HH26C HH33X$01 HH33X$02 HH33X$03 HH33X$04 HH33X$05 HH33X$06 HH33X$07 HH33X$08 HH33X$09 HH33X$10 HH33X$11 HH33X$12 HH33X$13 HH33X$14 HH33X$15 HH33X$16 HH33X$17 HH33X$18 HH33X$19 HH33X$20 HH33X$21 HH33X$22 HH33X$23 HH33X$24 HH33X$25 HH33X$26 HH33X$27 HH33X$28 HH33X$29 HH33X$30 HH33X$31 HH33X$32 HH33X$33 HH33X$34 HH33X$35 HH33X$36 HH33X$37 HH33X$38 HH33X$39 HH33X$40 HH33X$41 HH33X$42 HH33X$43 HH33X$44 HH33X$45 HH33X$46 HH33X$47 HH33X$48 HH33X$49 HH33X$50 HH33 HH39X$01 HH39X$02 HH39X$03 HH39X$04 HH39X$05 HH39X$06 HH39X$07 HH39X$08 HH39X$09 HH39X$10 HH39X$11 HH39X$12 HH39X$13 HH39X$14 HH39X$15 HH39X$16 HH39X$17 HH39X$18 HH39X$19 HH39X$20 HH39X$21 HH39X$22 HH39X$23 HH39X$24 HH39X$25 HH39X$26 HH39X$27 HH39X$28 HH39X$29 HH39X$30 HH39X$31 HH39X$32 HH39X$33 HH39X$34 HH39X$35 HH39X$36 HH39X$37 HH39X$38 HH39X$39 HH39X$40 HH39X$41 HH39X$42 HH39X$43 HH39X$44 HH39X$45 HH39X$46 HH39X$47 HH39X$48 HH39X$49 HH39X$50 HH39 HH44 HH47 HH48 HH49 HH50 HH50A HH51 HH52 HH53 HH54 HH55 HH56 HH60 HH61 HH67 HH69 INTROHL HHAUX HHWQ HHFIN HC2 HC3 HC4 HC5 HC6 HC7A HC7B HC7C HC7D HC7E HC7F HC8 HC9A HC9B HC9C HC9D HC9E HC9F HC9G HC9H HC9I HC10A HC10B HC10C HC10D HC10E HC10F HC10G HC10H HC10I HC10J HC11 HC12 HC13 HC14 HC15 HC16 HC16A HC16B HC16C HC16D HC17 HC18A HC18B HC18C HC18D HC18E HC18F HC18G HC19 ST2$1 ST2$2 ST2$3 ST2$4 ST2$5 ST2$6 ST2$7 ST2$8 ST3$1 ST3$2 ST3$3 ST3$4 ST3$5 ST3$6 ST3$7 ST3$8 ST4U$1 ST4U$2 ST4U$3 ST4U$4 ST4U$5 ST4U$6 ST4U$7 ST4U$8 ST4N$1 ST4N$2 ST4N$3 ST4N$4 ST4N$5 ST4N$6 ST4N$7 ST4N$8 EU1 EU2 EU3 EU4 EU5 EU6 EU7 EU8 EU9 WS1 WS2 WS3 WS4 WS5 WS6 WS7 WS7A WS8 WS9 WS10A WS10B WS10C WS10D WS10E WS10F WS10X WS10Z WS10NR WS11 WS12 WS13 WS14 WS15 WS16 WS17 HW1 HW2 HW3 HW4 HW5 HW6 HW7A HW7B HW7NR HH62$1 HH62$2 HH62$3 HH63A$1 HH63A$2 HH63A$3 HH63B$1 HH63B$2 HH63B$3 HH64A$1 HH64A$2 HH64A$3 HH64B$1 HH64B$2 HH64B$3 HH64C$1 HH64C$2 HH64C$3 HH65D$1 HH65D$2 HH65D$3 HH64E$1 HH64E$2 HH64E$3 HH64X$1 HH64X$2 HH64X$3 HH65$1 HH65$2 HH65$3 WQ1 WQ2 WQ3 WQ4 WQ5D WQ5M WQ5Y WQ6 WQ7 WQ8 WQ31 WQ10H WQ10M WQ23H WQ23M WQ11 WQ12 WQ14 WQ15A WQ15B WQ15C WQ15D WQ15E WQ15F WQ15X WQ15Z WQ15NR WQ17 WQ18 WQ19 WQ19A WQ20 WQ21 WQ23BD WQ23BM WQ23BY WQ24D WQ24M WQ24Y WQ25H WQ25M WQ26 WQ27 WQ29 HHSEX HHAGE SR_DAY SR_MONTH SR_YEAR SR_STATUS SR_STAFF LT_DAY_FROM LT_MONTH_FROM LT_YEAR_FROM LT_DAY_TO LT_MONTH_TO LT_YEAR_TO LT_RESULT LT_STAFF HH7A.y ethnicity.y helevel.x hhweight.x hlwt_mem wqhweight wqsweight wqhhlwt_mem wqshlwt_mem wscore.y windex5.y windex10.y wscoreu.y windex5u.y windex10u.y wscorer.y windex5r.y windex10r.y PSU.y stratum.y HL1 HL3 HL4 HL5M HL5Y HL6 HL8 HL9 HL10 HL11 HL12 HL13 HL14 HL15 HL16 HL17 HL18 HL19 HL20 ED1 ED2A ED3 ED4 ED5A ED5B ED6 ED7 ED8 ED9 ED10A ED10B ED11 ED12 ED13A ED13B ED13C ED13X ED13Z ED13NR ED14 ED15 ED16A ED16B HH4 HH5D.y HH5M.y HH5Y.y HH6 HH7 HH7A MLINE FLINE hhweight.y hlweight ethnicity ethnicity2.y helevel.y melevel felevel schage wscore windex5 windex10 wscoreu windex5u windex10u wscorer windex5r windex10r PSU stratum
1 2 3 1 2 3 92 91 92 19 11 2020 2 1 1 21 54 21 55 1 1 1 1 3 2 1 1 94 3 3 1984 36 1 5 NA NA NA NA NA NA NA NA NA 95 NA NA 1 A NA NA NA NA NA NA NA 3 3 3 1 3 1 1 1 1 1 2 1 2 2 NA 3 1 3 1 1 1 0 2 NA NA 2 NA NA 1 1 1 0 2 1 2 1 NA 1 5 1 2012 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA 2 7 2 2 2 NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 2 2 2 2 2 1 40 1 98 NA NA 1 1 2008 NA 18 4 1 NA NA NA NA NA NA NA NA 1 1 2 1 2 2 1 1 1 2 1 NA NA NA NA NA NA NA NA NA NA NA NA 1 3 1 NA 1 2 1 1 1 1 2 2 2 NA 1 1 2 NA NA 4 2000 11 2019 2 NA 2 NA NA NA NA NA 3 7 1 1 1 NA NA 2 NA NA 3 NA NA NA NA NA NA NA NA C NA NA D NA NA NA NA NA NA NA NA 2 NA NA 91 1 1 1 1451 5 1011 1297 23 1320 1320 1 1 1 0 5 1 1 1 1 1 10 12 2009 10 10 12 2009 10 0.7721628 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 94 91 18 11 2020 1 1 2 2 2 10 54 1 1 11 6 1 1 1 3 1 4 10 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 4 1 0 0 0 1 1 0 0 1 1 1 NA NA 1 2 NA 3 1 4 33 35 33 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 2 NA 2 NA 2 NA 2 NA NA NA NA NA NA NA 1 1 1 2 2 1 1 1 2 2 2 NA NA 2 1 2 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 5 NA NA 3 NA NA NA 2 97 NA NA 1 11 NA NA NA NA NA 2 2 NA 1 A B NA D NA NA NA NA NA 12 1 1 1 2 NA NA 1 1 1 NA NA NA A B NA 1 NA NA 2 NA NA 1 NA NA NA NA NA NA NA NA C NA NA NA NA NA E NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 63 NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 0.8770072 3.244075 0.8378049 0.8357933 3.041952 3.031846 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 1 1 1 8 1957 63 0 NA 0 2 NA NA NA NA NA NA NA NA NA 1 63 1 1 2 9 1 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 91 18 11 2020 1 1 1 NA NA 0.8770072 0.7884295 1 1 2 NA NA 63 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17
1 2 3 1 2 3 92 91 92 19 11 2020 2 1 1 21 54 21 55 1 1 1 1 3 2 1 1 94 3 3 1984 36 1 5 NA NA NA NA NA NA NA NA NA 95 NA NA 1 A NA NA NA NA NA NA NA 3 3 3 1 3 1 1 1 1 1 2 1 2 2 NA 3 1 3 1 1 1 0 2 NA NA 2 NA NA 1 1 1 0 2 1 2 1 NA 1 5 1 2012 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA 2 7 2 2 2 NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 2 2 2 2 2 1 40 1 98 NA NA 1 1 2008 NA 18 4 1 NA NA NA NA NA NA NA NA 1 1 2 1 2 2 1 1 1 2 1 NA NA NA NA NA NA NA NA NA NA NA NA 1 3 1 NA 1 2 1 1 1 1 2 2 2 NA 1 1 2 NA NA 4 2000 11 2019 2 NA 2 NA NA NA NA NA 3 7 1 1 1 NA NA 2 NA NA 3 NA NA NA NA NA NA NA NA C NA NA D NA NA NA NA NA NA NA NA 2 NA NA 91 1 1 1 1451 5 1011 1297 23 1320 1320 1 1 1 0 5 1 1 1 1 1 10 12 2009 10 10 12 2009 10 0.7721628 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 94 91 18 11 2020 1 1 2 2 2 10 54 1 1 11 6 1 1 1 3 1 4 10 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 4 1 0 0 0 1 1 0 0 1 1 1 NA NA 1 2 NA 3 1 4 33 35 33 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 2 NA 2 NA 2 NA 2 NA NA NA NA NA NA NA 1 1 1 2 2 1 1 1 2 2 2 NA NA 2 1 2 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 5 NA NA 3 NA NA NA 2 97 NA NA 1 11 NA NA NA NA NA 2 2 NA 1 A B NA D NA NA NA NA NA 12 1 1 1 2 NA NA 1 1 1 NA NA NA A B NA 1 NA NA 2 NA NA 1 NA NA NA NA NA NA NA NA C NA NA NA NA NA E NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 63 NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 0.8770072 3.244075 0.8378049 0.8357933 3.041952 3.031846 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 2 2 2 2 1958 62 0 NA 0 2 NA NA NA NA NA NA NA NA NA 2 62 1 1 1 5 1 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 91 18 11 2020 1 1 1 NA NA 0.8770072 0.7775765 1 1 2 NA NA 62 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17
1 2 3 1 2 3 92 91 92 19 11 2020 2 1 1 21 54 21 55 1 1 1 1 3 2 1 1 94 3 3 1984 36 1 5 NA NA NA NA NA NA NA NA NA 95 NA NA 1 A NA NA NA NA NA NA NA 3 3 3 1 3 1 1 1 1 1 2 1 2 2 NA 3 1 3 1 1 1 0 2 NA NA 2 NA NA 1 1 1 0 2 1 2 1 NA 1 5 1 2012 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA 2 7 2 2 2 NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 2 2 2 2 2 1 40 1 98 NA NA 1 1 2008 NA 18 4 1 NA NA NA NA NA NA NA NA 1 1 2 1 2 2 1 1 1 2 1 NA NA NA NA NA NA NA NA NA NA NA NA 1 3 1 NA 1 2 1 1 1 1 2 2 2 NA 1 1 2 NA NA 4 2000 11 2019 2 NA 2 NA NA NA NA NA 3 7 1 1 1 NA NA 2 NA NA 3 NA NA NA NA NA NA NA NA C NA NA D NA NA NA NA NA NA NA NA 2 NA NA 91 1 1 1 1451 5 1011 1297 23 1320 1320 1 1 1 0 5 1 1 1 1 1 10 12 2009 10 10 12 2009 10 0.7721628 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 94 91 18 11 2020 1 1 2 2 2 10 54 1 1 11 6 1 1 1 3 1 4 10 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 4 1 0 0 0 1 1 0 0 1 1 1 NA NA 1 2 NA 3 1 4 33 35 33 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 2 NA 2 NA 2 NA 2 NA NA NA NA NA NA NA 1 1 1 2 2 1 1 1 2 2 2 NA NA 2 1 2 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 5 NA NA 3 NA NA NA 2 97 NA NA 1 11 NA NA NA NA NA 2 2 NA 1 A B NA D NA NA NA NA NA 12 1 1 1 2 NA NA 1 1 1 NA NA NA A B NA 1 NA NA 2 NA NA 1 NA NA NA NA NA NA NA NA C NA NA NA NA NA E NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 63 NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 0.8770072 3.244075 0.8378049 0.8357933 3.041952 3.031846 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 3 3 2 3 1984 36 3 NA 0 2 NA NA NA NA NA NA NA NA NA 3 36 1 1 5 NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 91 18 11 2020 1 1 1 NA NA 0.8770072 0.8810134 1 1 2 NA NA 36 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17
1 2 3 1 2 3 92 91 92 19 11 2020 2 1 1 21 54 21 55 1 1 1 1 3 2 1 1 94 3 3 1984 36 1 5 NA NA NA NA NA NA NA NA NA 95 NA NA 1 A NA NA NA NA NA NA NA 3 3 3 1 3 1 1 1 1 1 2 1 2 2 NA 3 1 3 1 1 1 0 2 NA NA 2 NA NA 1 1 1 0 2 1 2 1 NA 1 5 1 2012 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA 2 7 2 2 2 NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 2 2 2 2 2 1 40 1 98 NA NA 1 1 2008 NA 18 4 1 NA NA NA NA NA NA NA NA 1 1 2 1 2 2 1 1 1 2 1 NA NA NA NA NA NA NA NA NA NA NA NA 1 3 1 NA 1 2 1 1 1 1 2 2 2 NA 1 1 2 NA NA 4 2000 11 2019 2 NA 2 NA NA NA NA NA 3 7 1 1 1 NA NA 2 NA NA 3 NA NA NA NA NA NA NA NA C NA NA D NA NA NA NA NA NA NA NA 2 NA NA 91 1 1 1 1451 5 1011 1297 23 1320 1320 1 1 1 0 5 1 1 1 1 1 10 12 2009 10 10 12 2009 10 0.7721628 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 94 91 18 11 2020 1 1 2 2 2 10 54 1 1 11 6 1 1 1 3 1 4 10 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 4 1 0 0 0 1 1 0 0 1 1 1 NA NA 1 2 NA 3 1 4 33 35 33 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 2 NA 2 NA 2 NA 2 NA NA NA NA NA NA NA 1 1 1 2 2 1 1 1 2 2 2 NA NA 2 1 2 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 5 NA NA 3 NA NA NA 2 97 NA NA 1 11 NA NA NA NA NA 2 2 NA 1 A B NA D NA NA NA NA NA 12 1 1 1 2 NA NA 1 1 1 NA NA NA A B NA 1 NA NA 2 NA NA 1 NA NA NA NA NA NA NA NA C NA NA NA NA NA E NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 63 NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 0.8770072 3.244075 0.8378049 0.8357933 3.041952 3.031846 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17 4 5 1 12 2009 10 0 NA 0 1 1 1 3 NA 1 2 NA 3 3 4 10 1 1 2 6 2 1 1 1 2 6 1 2 NA NA NA NA NA NA 2 1 1 5 91 18 11 2020 1 1 1 3 0 0.8770072 0.7970557 1 1 2 5 5 10 1.1852733 5 10 1.179146 5 9 NA NA NA 1 17
1 4 2 1 4 2 92 91 92 18 11 2020 1 1 1 11 48 12 6 1 1 1 1 3 NA NA NA 94 3 2 1996 24 1 2 9 1 NA NA NA NA NA NA NA 10 1 2 1 NA NA NA NA E NA NA NA 3 3 3 2 NA NA NA NA NA NA NA NA NA NA 1 3 1 3 1 1 1 2 2 NA NA 2 NA NA 3 1 1 0 2 1 2 1 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 1 NA NA NA NA NA E NA NA NA NA NA NA NA NA NA NA 1 NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 1 2 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA 1 1 2 2 2 2 2 2 2 1 27 2 NA NA NA 1 12 2013 NA 18 1 4 2 1 NA 2 NA NA NA 1 1 1 1 1 1 2 2 1 1 1 2 NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 2 NA 2 2 1 1 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA 1 2 NA NA NA NA 1 9 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 91 1 1 1 1451 2 1154 1368 17 1393 1424 1 3 3 0 2 1 1 1 1 2 13 1 2016 4 28 8 2018 2 1.0933674 0.1707833 2 3 -0.952136 1 1 NA NA NA 1 17 94 91 18 11 2020 1 1 2 2 2 11 23 1 1 11 40 1 1 1 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 6 1 0 1 3 0 1 0 3 0 1 1 NA NA 1 2 NA 3 1 1 11 31 33 2 1 1 2 2 1 1 2 1 1 1 2 1 2 2 1 2 1 1 1 2 2 2 2 2 2 2 1 1 2 2 NA 2 NA 2 NA 2 NA NA NA NA NA NA NA 2 1 1 2 2 1 1 2 2 2 2 NA NA 2 1 NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 5 NA NA 3 NA NA NA 1 97 NA NA 1 11 NA NA NA NA NA 2 2 NA 1 A NA NA D NA NA NA NA NA 12 4 NA 2 2 NA NA 1 1 1 NA NA NA A B NA 1 NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA E NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 54 NA NA NA NA NA NA NA NA NA NA NA NA NA 1 1 2 0.8770072 6.004683 0.8378049 0.8357933 5.630560 5.611853 0.1707833 2 3 -0.952136 1 1 NA NA NA 1 17 1 1 2 2 1966 54 0 NA 0 2 NA NA NA NA NA NA NA NA NA 1 54 1 1 2 9 1 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 91 18 11 2020 1 1 1 NA NA 0.8770072 0.8452578 1 1 2 NA NA 54 0.1707833 2 3 -0.952136 1 1 NA NA NA 1 17
# --- 2. Tạo và tái mã hóa biến ---
data <- data %>%
  mutate(
    age = WAGE,
    education = melevel,
    wealth = windex5,
    urban_rural = HH6,
    region = HH7,
    marital_status = WM3,
    parity = CEB,
    num_anc = MN5,
    delivery_place = WM15,
    pnc_by = PN4
  ) %>%
  mutate(
    age_group = cut(age, breaks = c(15, 19, 24, 29, 34, 39, 49),
                    labels = c("15–19", "20–24", "25–29", "30–34", "35–39", "40–49")),
    anc4plus = ifelse(num_anc >= 4, 1, 0),
    pncs_skilled = ifelse(pnc_by %in% c(1, "skilled"), 1, 0),
    facility_delivery = ifelse(delivery_place %in% c(1, "facility"), 1, 0),
    urban_rural = factor(urban_rural, levels = c(1, 2), labels = c("Thành thị", "Nông thôn")),
    wealth_quintile = factor(wealth, levels = 1:5,
                             labels = c("Nghèo nhất", "Nghèo", "Trung bình", "Giàu", "Giàu nhất")),
    region = as.factor(region),
    education = as.factor(education),
    marital_status = as.factor(marital_status)
  )

# Loại bỏ giá trị thiếu
data <- data %>%
  filter(complete.cases(data[, c("age", "education", "wealth", "urban_rural",
                                 "region", "marital_status", "parity",
                                 "num_anc", "pnc_by", "delivery_place")]))

# --- 3. Thống kê mô tả ---
descr <- data %>%
  summarise(
    Tong_mau = n(),
    Ty_le_ANC4 = mean(anc4plus, na.rm = TRUE) * 100,
    Ty_le_PNC_skilled = mean(pncs_skilled, na.rm = TRUE) * 100,
    Ty_le_Facility = mean(facility_delivery, na.rm = TRUE) * 100
  )
kable(descr, caption = "Bảng 2. Tỷ lệ chung của các chỉ số chăm sóc trước & sau sinh")
Bảng 2. Tỷ lệ chung của các chỉ số chăm sóc trước & sau sinh
Tong_mau Ty_le_ANC4 Ty_le_PNC_skilled Ty_le_Facility
2801 83.8272 90.03927 6.176366
# --- 4. Biểu đồ mô tả ---
## Biểu đồ 1: Tỷ lệ ANC4+ theo vùng
ggplot(data, aes(x = region, fill = factor(anc4plus))) +
  geom_bar(position = "fill") +
  labs(title = "Tỷ lệ phụ nữ được khám thai ≥4 lần theo vùng",
       x = "Vùng địa lý", y = "Tỷ lệ", fill = "Khám ≥4 lần") +
  theme_minimal()

## Biểu đồ 2: Tỷ lệ ANC4+ theo khu vực cư trú
ggplot(data, aes(x = urban_rural, fill = factor(anc4plus))) +
  geom_bar(position = "fill") +
  labs(title = "So sánh tỷ lệ khám thai ≥4 lần giữa thành thị và nông thôn",
       x = "Khu vực cư trú", y = "Tỷ lệ", fill = "Khám ≥4 lần") +
  theme_minimal()

## Biểu đồ 3: Phân phối số lần khám thai
ggplot(data, aes(x = num_anc)) +
  geom_histogram(binwidth = 1, fill = "skyblue", color = "black") +
  labs(title = "Phân phối số lần khám thai của phụ nữ",
       x = "Số lần khám thai", y = "Tần số") +
  theme_minimal()

# --- 5. Phân tích hai biến (Kiểm định Chi-square) ---
tab1 <- CrossTable(data$education, data$anc4plus, chisq = TRUE)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## | Chi-square contribution |
## |           N / Row Total |
## |           N / Col Total |
## |         N / Table Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  2801 
## 
##  
##                | data$anc4plus 
## data$education |         0 |         1 | Row Total | 
## ---------------|-----------|-----------|-----------|
##              0 |       128 |        86 |       214 | 
##                |   252.002 |    48.619 |           | 
##                |     0.598 |     0.402 |     0.076 | 
##                |     0.283 |     0.037 |           | 
##                |     0.046 |     0.031 |           | 
## ---------------|-----------|-----------|-----------|
##              1 |       117 |       260 |       377 | 
##                |    51.486 |     9.933 |           | 
##                |     0.310 |     0.690 |     0.135 | 
##                |     0.258 |     0.111 |           | 
##                |     0.042 |     0.093 |           | 
## ---------------|-----------|-----------|-----------|
##              2 |       133 |       647 |       780 | 
##                |     0.372 |     0.072 |           | 
##                |     0.171 |     0.829 |     0.278 | 
##                |     0.294 |     0.276 |           | 
##                |     0.047 |     0.231 |           | 
## ---------------|-----------|-----------|-----------|
##              3 |        64 |       588 |       652 | 
##                |    16.291 |     3.143 |           | 
##                |     0.098 |     0.902 |     0.233 | 
##                |     0.141 |     0.250 |           | 
##                |     0.023 |     0.210 |           | 
## ---------------|-----------|-----------|-----------|
##              4 |         3 |       169 |       172 | 
##                |    22.141 |     4.272 |           | 
##                |     0.017 |     0.983 |     0.061 | 
##                |     0.007 |     0.072 |           | 
##                |     0.001 |     0.060 |           | 
## ---------------|-----------|-----------|-----------|
##              5 |         8 |       598 |       606 | 
##                |    82.660 |    15.948 |           | 
##                |     0.013 |     0.987 |     0.216 | 
##                |     0.018 |     0.255 |           | 
##                |     0.003 |     0.213 |           | 
## ---------------|-----------|-----------|-----------|
##   Column Total |       453 |      2348 |      2801 | 
##                |     0.162 |     0.838 |           | 
## ---------------|-----------|-----------|-----------|
## 
##  
## Statistics for All Table Factors
## 
## 
## Pearson's Chi-squared test 
## ------------------------------------------------------------
## Chi^2 =  506.9385     d.f. =  5     p =  2.538172e-107 
## 
## 
## 
tab2 <- CrossTable(data$wealth_quintile, data$anc4plus, chisq = TRUE)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## | Chi-square contribution |
## |           N / Row Total |
## |           N / Col Total |
## |         N / Table Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  2801 
## 
##  
##                      | data$anc4plus 
## data$wealth_quintile |         0 |         1 | Row Total | 
## ---------------------|-----------|-----------|-----------|
##           Nghèo nhất |       391 |       584 |       975 | 
##                      |   345.220 |    66.603 |           | 
##                      |     0.401 |     0.599 |     0.348 | 
##                      |     0.863 |     0.249 |           | 
##                      |     0.140 |     0.208 |           | 
## ---------------------|-----------|-----------|-----------|
##                Nghèo |        49 |       446 |       495 | 
##                      |    12.047 |     2.324 |           | 
##                      |     0.099 |     0.901 |     0.177 | 
##                      |     0.108 |     0.190 |           | 
##                      |     0.017 |     0.159 |           | 
## ---------------------|-----------|-----------|-----------|
##           Trung bình |         9 |       443 |       452 | 
##                      |    56.209 |    10.844 |           | 
##                      |     0.020 |     0.980 |     0.161 | 
##                      |     0.020 |     0.189 |           | 
##                      |     0.003 |     0.158 |           | 
## ---------------------|-----------|-----------|-----------|
##                 Giàu |         4 |       435 |       439 | 
##                      |    63.224 |    12.198 |           | 
##                      |     0.009 |     0.991 |     0.157 | 
##                      |     0.009 |     0.185 |           | 
##                      |     0.001 |     0.155 |           | 
## ---------------------|-----------|-----------|-----------|
##            Giàu nhất |         0 |       440 |       440 | 
##                      |    71.160 |    13.729 |           | 
##                      |     0.000 |     1.000 |     0.157 | 
##                      |     0.000 |     0.187 |           | 
##                      |     0.000 |     0.157 |           | 
## ---------------------|-----------|-----------|-----------|
##         Column Total |       453 |      2348 |      2801 | 
##                      |     0.162 |     0.838 |           | 
## ---------------------|-----------|-----------|-----------|
## 
##  
## Statistics for All Table Factors
## 
## 
## Pearson's Chi-squared test 
## ------------------------------------------------------------
## Chi^2 =  653.5597     d.f. =  4     p =  3.952628e-140 
## 
## 
## 
# --- 6. Mô hình hồi quy logistic ---
model1 <- glm(facility_delivery ~ age + education + wealth_quintile +
                urban_rural + region + marital_status + parity,
              data = data, family = binomial)

# Hệ số OR
exp_coef <- exp(cbind(OR = coef(model1), confint(model1)))
kable(exp_coef, caption = "Bảng 3. Ước lượng Odds Ratio (và khoảng tin cậy 95%)")
Bảng 3. Ước lượng Odds Ratio (và khoảng tin cậy 95%)
OR 2.5 % 97.5 %
(Intercept) 0.1603107 0.0406208 0.5862680
age 0.8326733 0.7052323 0.9802738
education1 0.5271235 0.3318191 0.8348629
education2 0.1924676 0.1171612 0.3130552
education3 0.0501216 0.0217010 0.1043788
education4 0.1254848 0.0423314 0.3215120
education5 0.0808441 0.0351957 0.1770263
wealth_quintileNghèo 0.7340847 0.4249737 1.2312450
wealth_quintileTrung bình 0.2957971 0.1080229 0.6833860
wealth_quintileGiàu 0.9422251 0.4312823 1.9466261
wealth_quintileGiàu nhất 1.5042816 0.6282935 3.4918554
urban_ruralNông thôn 0.8123904 0.4865882 1.3831585
region2 1.5500032 0.7798090 3.1683769
region3 1.3180142 0.6361535 2.7608305
region4 1.1034937 0.5376618 2.3088311
region5 1.0861142 0.5018252 2.3240477
region6 0.7300188 0.3338161 1.6081195
marital_status2 2.6846062 1.2677705 6.6410501
marital_status3 3.0850956 1.3115001 8.1972030
marital_status4 1.6595847 0.6929319 4.4532476
marital_status5 1.1333317 0.2745084 4.1343708
marital_status6 5.0119953 1.6097996 16.2436044
marital_status7 3.7349831 0.8328361 15.0323756
marital_status8 6.7916975 1.9508300 23.8330293
marital_status9 0.0000010 0.0000000 0.0000000
parity 1.2203196 1.0326714 1.4412065
# Kiểm tra đa cộng tuyến
vif_table <- vif(model1)
kable(as.data.frame(vif_table), caption = "Bảng 4. Kiểm tra đa cộng tuyến (VIF)")
Bảng 4. Kiểm tra đa cộng tuyến (VIF)
GVIF Df GVIF^(1/(2*Df))
age 1.846013 1 1.358680
education 2.482720 5 1.095198
wealth_quintile 3.640564 4 1.175293
urban_rural 1.567641 1 1.252055
region 2.500894 5 1.095997
marital_status 1.790419 8 1.037074
parity 1.813313 1 1.346593
# --- 7. Kết luận sơ bộ ---
cat("
**Kết luận sơ bộ:**
- Tỷ lệ phụ nữ được khám thai ≥4 lần trung bình khoảng ", round(descr$Ty_le_ANC4, 1), "%.
- Có sự khác biệt giữa các vùng địa lý và giữa thành thị/nông thôn.
- Học vấn và mức sống có liên quan đáng kể đến khả năng khám ≥4 lần (p < 0.05).
- Mô hình hồi quy logistic cho thấy: học vấn cao, mức sống tốt, sống ở thành thị → khả năng sinh con tại cơ sở y tế cao hơn.
")
## 
## **Kết luận sơ bộ:**
## - Tỷ lệ phụ nữ được khám thai ≥4 lần trung bình khoảng  83.8 %.
## - Có sự khác biệt giữa các vùng địa lý và giữa thành thị/nông thôn.
## - Học vấn và mức sống có liên quan đáng kể đến khả năng khám ≥4 lần (p < 0.05).
## - Mô hình hồi quy logistic cho thấy: học vấn cao, mức sống tốt, sống ở thành thị → khả năng sinh con tại cơ sở y tế cao hơn.