library(readxl)
dat <- read_excel("1_ raw.xlsx", sheet = "AGO 17",
na = "-", col_names = FALSE)
# Copia para trabajar sobre ella
data <- dat
#data <- as.data.frame(data) #Convirtiendo a data frame para facilitar los análisis.
# Asignando nombres de variables
#colnames(data) <- data[1,]
#data <- data[-1,]
#Eliminando 1er columna con índices innecesarios
#data <- data[,-1]
#Convirtiendo NAs a "No" en las columnas de sintomatologia.
dat$`FiebreEscalofríos`[is.na(dat$`FiebreEscalofríos`)] <- "NO"
dat$`Mialgias (Dolor Muscular)`[is.na(dat$`Mialgias (Dolor Muscular)`)] <- "NO"
dat$`Erupción cutánea`[is.na(dat$`Erupción cutánea`)] <- "NO"
dat$`Malestar general`[is.na(dat$`Malestar general`)] <- "NO"
dat$`Nauseas y Vomitos`[is.na(dat$`Nauseas y Vomitos`)] <- "NO"
dat$Fatiga[is.na(dat$Fatiga)] <- "NO"
dat$`Cefalea (Dolor de cabeza)`[is.na(dat$`Diaforesis (Sudoración)`)] <- "NO"
dat$`Diaforesis (Sudoración)`[is.na(dat$`Diaforesis (Sudoración)`)] <- "NO"
dat$`Tos y expectoración de 2 semanas o más`[is.na(dat$`Tos y expectoración de 2 semanas o más`)] <- "NO"
dat$`Artralgias (Dolor articular)`[is.na(dat$`Artralgias (Dolor articular)`)] <- "NO"
dat$Otro[is.na(dat$Otro)] <- "NO"
head(dat)
dims <- dim(data)
La base de datos resultante se compone de 1781 entradas con 47 variables.
#source("functions/QOfCategoricalF.R")
#rcdCat <- QOfCategoricalF(dat)
#rcdCat <- rcdCat[-1,]
#data1 <- data[,-c(6,45,46)]
vars <- as.data.frame(colnames(data))
source("functions/QOfCategoricalF.R")
socioDem <- QOfCategoricalF(dat[,2:14])
#socioDemVars <- c("Género", "Inscripción", "Carrera", "Edad", "Sem/Tetra", "Residencia", "Dormitorio", "Dirección", "Procedencia", "email", "cell", "Edo")
columnas <- c("Count", "Missing", "Cardinality", "Mode", "Mode Frec", "Mode %", "Mode2", "Mode2 Frec", "Mode2 %")
colnames(socioDem) <- columnas
socioDem
Count Missing Cardinality Mode Mode Frec Mode % Mode2 Mode2 Frec Mode2 %
1 1781 0 1781 1000345 1 0.06% 1000697 1 0.06%
2 1781 0 2 Hombre 897 50.36% Mujer 884 49.64%
3 1781 0 2 SI 1718 96.46% NO 63 3.54%
4 1781 0 63 Médico Cirujano 474 26.61% Cirujano Dentista 118 6.63%
5 1781 0 43 19 251 14.09% 20 250 14.04%
6 1781 0 10 3 370 20.77% 5 359 20.16%
7 1781 0 2 Externo 1189 66.76% Interno 592 33.24%
8 1781 1189 4 4 221 12.41% 3 211 11.85%
9 1781 32 1115 Dormitorio 4 161 9.04% Dormitorio 3 124 6.96%
10 1781 25 475 Montemorelos 142 7.97% Veracruz 123 6.91%
11 1781 35 1742 null 3 0.17% ojitoscafe7@gmail.com 2 0.11%
12 1781 43 1694 null 27 1.52% 0 14 0.79%
13 1781 0 1 Autorizado 1781 100% <NA> <NA> NA%
sintomas <- QOfCategoricalF(dat[,15:25])
#sintomasVars <- c("Fiebre", "Mialgias", "Erupción Cutánea", "Malestar gral", "Náusea/Vómito", "Fatiga", "Cefalea", "Diaforesis", "Tos", "Artralgias", "Otro")
colnames(sintomas) <- columnas
sintomas
Count Missing Cardinality Mode Mode Frec Mode % Mode2 Mode2 Frec Mode2 %
1 1781 0 2 NO 1756 98.6% Si 25 1.4%
2 1781 0 2 NO 1754 98.48% Si 27 1.52%
3 1781 0 2 NO 1773 99.55% Si 8 0.45%
4 1781 0 2 NO 1759 98.76% Si 22 1.24%
5 1781 0 2 NO 1757 98.65% Si 24 1.35%
6 1781 0 2 NO 1762 98.93% Si 19 1.07%
7 1781 0 2 NO 1778 99.83% Si 3 0.17%
8 1781 0 2 NO 1778 99.83% Si 3 0.17%
9 1781 0 2 NO 1756 98.6% Si 25 1.4%
10 1781 0 2 NO 1765 99.1% Si 16 0.9%
11 1781 0 1 NO 1781 100% <NA> <NA> NA%
#app <- rcdCat[25:43,]
names(dat[26:44]) <- c("Alergia a comidas","Cuales?1", "Alergia a meds", "Cuales?2", "Uso meds", "Cuales?3", "ABO_Rh", "Donar sangre", "Enfermedades cronicas", "Cuales?4", "Visita dentista", "Frecuencia cepillado", "Sangrado en encias al cepillar", "Perdida de dientes", "Hiper-sensibilidad dientes", "Qx bucal mayores", "Cuales?5", "Info salud sex", "Interés en info salud sex")
app <- QOfCategoricalF(dat[,26:44])
#appVars <- c("Alergia a comidas","Cuales?1", "Alergia a meds", "Cuales?2", "Uso meds", "Cuales?3", "ABO_Rh", "Donar sangre", "Enfermedades crónicas", "Cuales?4", "Visita dentista", "Frecuencia cepillado", "Sangrado en encias al cepillar", "Pérdida de dientes", "Hiper-sensibilidad dientes", "Qx bucal mayores", "Cuales?5", "Info salud sex", "Interés en info salud sex")
colnames(app) <- columnas
app
Count Missing Cardinality Mode Mode Frec Mode % Mode2 Mode2 Frec Mode2 %
1 1781 10 2 NO 1665 93.49% SI 106 5.95%
2 1781 1647 87 negado 41 2.3% soya 3 0.17%
3 1781 3 2 NO 1616 90.74% SI 162 9.1%
4 1781 1593 90 negado 41 2.3% Penicilina 37 2.08%
5 1781 9 2 NO 1635 91.8% SI 137 7.69%
6 1781 1609 104 negado 42 2.36% Asma 7 0.39%
7 1781 297 8 O+ 1036 58.17% A+ 267 14.99%
8 1781 9 2 SI 1237 69.46% NO 535 30.04%
9 1781 1642 12 Asma,- 53 2.98% Otros,- 52 2.92%
10 1781 1781 0 NULL <NA> NA% NULL <NA> NA%
11 1781 10 3 1 año 1545 86.75% Más de 3 año 196 11.01%
12 1781 10 3 3 o mas veces 1346 75.58% 2 veces 399 22.4%
13 1781 10 3 No 1501 84.28% Ocasionalmente 198 11.12%
14 1781 10 2 No 1685 94.61% Si 86 4.83%
15 1781 10 2 No 1363 76.53% Si 408 22.91%
16 1781 10 2 No 1484 83.32% Si 287 16.11%
17 1781 1523 103 negado 37 2.08% Endodoncia 15 0.84%
18 1781 10 2 Si 1613 90.57% No 158 8.87%
19 1781 10 2 Si 1036 58.17% No 735 41.27%
#antropometria <- rcdCat[46,]
antropometria <- QOfCategoricalF(dat[,47])
#antropometriaVars <- c("Presión")
colnames(antropometria) <- columnas
antropometria
Count Missing Cardinality Mode Mode Frec Mode % Mode2 Mode2 Frec Mode2 %
1 1781 4 830 120/80 290 16.28% 120/70 148 8.31%
source("functions/QOfContinuousF.R")
#rcdCont <- data[,44:45]
dat$Peso <- as.numeric(dat$Peso)
dat$Talla <- as.numeric(dat$Talla)
#rcdCont$Peso <- as.numeric(rcdCont$Peso)
#rcdCont$Talla <- as.numeric(rcdCont$Talla)
rcdCont <- QOfContinuousF(dat[,45:46])
rcdCont
Count Miss Card Min Qrt1 Median Qrt3 Max Mean Sdev
Peso 1781 1 106 0 0 48.00 65.00 137 35.12 35.16
Talla 1781 1 55 0 0 1.52 1.66 163 1.13 6.48