Instalar paquetes si es necesario install.packages(“MASS”) Modelos Probit y Logit Ordenado install.packages(“VGAM”) Modelos Logit y Probit Ordenado install.packages(“margins”) Efectos marginales install.packages(“pROC”) Curva ROC install.packages(“ggplot2”) Gráficos install.packages(“nnet”) Matriz de confusión install.packages(“modelsummary”) Exportar a word install.packages(“pandoc”) Exportar a word install.packages(“officer”) install.packages(“flextable”) install.packages(“broom”) install.packages(“Rchoice”) install.packages(c(“officer”, “flextable”, “broom”))
Cargar librerías
library(MASS)library(VGAM)
Cargando paquete requerido: stats4
Cargando paquete requerido: splines
library(margins)library(pROC)
Type 'citation("pROC")' for a citation.
Adjuntando el paquete: 'pROC'
The following objects are masked from 'package:stats':
cov, smooth, var
Please cite the 'maxLik' package as:
Henningsen, Arne and Toomet, Ott (2011). maxLik: A package for maximum likelihood estimation in R. Computational Statistics 26(3), 443-458. DOI 10.1007/s00180-010-0217-1.
If you have questions, suggestions, or comments regarding the 'maxLik' package, please use a forum or 'tracker' at maxLik's R-Forge site:
https://r-forge.r-project.org/projects/maxlik/
Model: ordinal
Model estimated on: vie. jun. 06 07:57:10 p. m. 2025
Call:
Rchoice(formula = intensidad_dpp ~ lingrl + anios_esc + edad +
t_hijos + etnia + area, data = data, na.action = na.omit,
family = ordinal("logit"), method = "bfgs")
Frequencies of categories:
y
1 2 3
0.7798 0.1088 0.1114
The estimation took: 0h:0m:2s
Coefficients:
Estimate Std. Error z-value Pr(>|z|)
kappa.1 0.822194 0.018816 43.697 < 2e-16 ***
constant -2.352638 0.100572 -23.393 < 2e-16 ***
lingrl 0.001703 0.007114 0.239 0.81077
anios_esc -0.009924 0.004865 -2.040 0.04136 *
edad 0.034483 0.003190 10.810 < 2e-16 ***
t_hijos 0.039105 0.018717 2.089 0.03669 *
etnia 0.344926 0.059842 5.764 8.22e-09 ***
area 0.118337 0.042259 2.800 0.00511 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Optimization of log-likelihood by BFGS maximization
Log Likelihood: -11050
Number of observations: 16451
Number of iterations: 129
Exit of MLE: successful convergence
Análisis:
El ingreso es una variable que no presenta significacia estadística, por tanto, no permite conocer su efecto sobre la intensidad de depresión. A medida que aumenta un año de escolaridad reduce la intensidad de depresión post parto, dado que, es estadísticamente significativa. Cuando las mujeres aumentan un año de edad, de igual forma incrementa la depresión post parto. A medida que tienen un hijo más, es más probable que sufran de depresión post parto. Las mujeres de la etnia índigena tienen mayor probabilidad de padecer de depresión post parto. Las mujeres que habitan en zonas rurales tienen mayor probabilidad de sufrir de depresión post parto.
RMSE significa Root Mean Squared Error (Raíz del Error Cuadrático Medio). Es una métrica común para evaluar la precisión de modelos de predicción, especialmente en regresión. Más bajo = mejor. Un RMSE de 0 indica predicciones perfectas.
Este es más usual en casos de variables cuantitativas, para determinar la precisión lo hacemos con la matriz de confusión.
Criterio de información de Akaike (AIC) y criterio de Información Bayesiano (BIC)
Convertir las probabilidades en categorías predichas (tomando la categoría con mayor probabilidad)
pred_clases <-apply(pred_logit_ord, 1, which.max)
Crear matriz de confusión
conf_matrix <-table(Predicho = pred_clases, Real =as.numeric(data$intensidad_dpp))
Mostrar matriz de confusión
print(conf_matrix)
Real
Predicho 1 2 3
1 12828 1790 1833
Calcular exactitud del modelo
exactitud <-sum(diag(conf_matrix)) /sum(conf_matrix)cat("Exactitud del modelo Logit Ordenado:", exactitud, "\n")
Exactitud del modelo Logit Ordenado: 0.7797702
Análisis:
Los efectos marginales logit muestran que las variables con mayor impacto en la probabilidad de sufrir una mayor intensidad de depresión postparto son la etnia, el área de residencia, la edad y el número de hijos. Ser indígena aumenta en promedio un 6.1% la probabilidad de mayor depresión, vivir en zona rural la incrementa en un 2.1%, mientras que cada año adicional de edad y cada hijo extra elevan la probabilidad en 0.6% y 0.7% respectivamente. Por el contrario, ni el ingreso ni los años de escolaridad muestran un efecto estadísticamente significativo sobre la intensidad de la depresión.
Efectos marginales probit
X <-cbind(1, probitord$mf[, -1])
coeficientes<- probitord$coefficients
coeficientes_1<- coeficientes[2:8]
ai <-crossprod(t(X), coeficientes_1) #producto cruzado por los coeficientes
conf_matrix <-table(Predicho = pred_clases, Real =as.numeric(data$intensidad_dpp))
Mostrar matriz de confusión
print(conf_matrix)
Real
Predicho 1 2 3
1 12828 1790 1833
Calcular exactitud del modelo
exactitud <-sum(diag(conf_matrix)) /sum(conf_matrix)cat("Exactitud del modelo probit Ordenado:", exactitud, "\n")
Exactitud del modelo probit Ordenado: 0.7797702
Análisis:
Según los efectos marginales del modelo probit, las variables que aumentan significativamente la probabilidad de sufrir una mayor intensidad de depresión postparto son la etnia, la zona de residencia, la edad y el número de hijos. Ser indígena incrementa esta probabilidad en 5.7%, vivir en zona rural en 2.1%, mientras que cada año adicional de edad y cada hijo aumentan la probabilidad en 0.6% y 0.7% respectivamente. Y tal como en el anterior modelo marginal, ni el ingreso ni los años de escolaridad muestran efectos estadísticamente significativos sobre la intensidad de la depresión postparto.