1. Introducción

El análisis de datos en el sector de seguros médicos es crucial para optimizar la asignación de recursos y gestionar los riesgos financieros. Este estudio se centra en explorar cómo variables individuales como la edad, el sexo, el IMC (Índice de Masa Corporal), el número de hijos y el estado de fumador, y los gastos médicos influyen en los costos de las pólizas de salud. Estas variables no solo ayudan a identificar patrones de comportamiento en los asegurados, sino que también permiten diseñar estrategias personalizadas para mejorar la eficiencia y sostenibilidad del sistema.

A través de técnicas estadísticas avanzadas como el Modelos Lineal Generalizado (Inversa Gausiana), se busca comprender mejor la variabilidad de los costos médicos y los factores que los determinan. El enfoque metodológico utilizado en este estudio también facilita la predicción de gastos y la creación de modelos que optimicen las toma de decisiones.

2. Exploración de Datos

2.1. Descripción de Variables

  • Edad (numérica): Representa la edad de los individuos en años. Es una variable continua.

  • Sexo (categórica): Indica el sexo del individuo. Está representado por:

    • F para femenino.

    • M para masculino.

  • IMC (numérica): Índice de Masa Corporal (BMI en inglés), una medida de la relación entre peso y altura, utilizada para evaluar el estado de salud. Es una variable continua.

  • Hijos (numérica discreta): Indica el número de hijos o dependientes del individuo. Es una variable discreta, ya que solo toma valores enteros.

  • Fumador (binaria): Indica si el individuo es fumador o no:

    • Y para sí (fumador).

    • N para no (no fumador).

  • Región (categórica): Representa la región geográfica en la que reside el individuo. Los posibles valores son:

    • southwest (Suroeste).

    • southeast (Sureste).

    • northwest (Noroeste).

    • northeast (Noreste).

  • Gastos (numérica): Indica los costos médicos facturados en unidades monetarias. Es una variable continua y constituye la variable objetivo en el análisis.

2.2. Exploración de Datos

Se llevaron a cabo diversas transformaciones y exploraciones iniciales en el conjunto de datos Medical_Cost.csv para preparar su análisis. Los datos fueron cargados utilizando read_delim, asegurando su correcto formato y eliminando posibles inconsistencias en los delimitadores y espacios. Posteriormente, las variables clave como sex y smoker fueron recodificadas a valores más simples (“F”, “M”, “Y”, “N”), mientras que region se transformó en un factor categórico con niveles ordenados que facilitan comparaciones geográficas. Además, los nombres de las columnas se tradujeron al español para una mejor interpretación, resultando en etiquetas como Edad, Sexo, IMC, Hijos, Fumador, Region y Gastos. Se verificó la estructura del dataset con funciones como summary, str y dim, permitiendo identificar dimensiones, tipos de variables y posibles valores faltantes mediante colSums(is.na(data)). Este proceso asegura que los datos estén limpios, organizados y listos para análisis posteriores relacionados con gastos médicos y factores asociados.

3. Análisis Exploratorio

## spc_tbl_ [1,338 × 7] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ Edad   : num [1:1338] 19 18 28 33 32 31 46 37 37 60 ...
##  $ Sexo   : Factor w/ 2 levels "F","M": 1 2 2 2 2 1 1 1 2 1 ...
##  $ IMC    : num [1:1338] 27.9 33.8 33 22.7 28.9 ...
##  $ Hijos  : num [1:1338] 0 1 3 0 0 0 1 3 2 0 ...
##  $ Fumador: Factor w/ 2 levels "Y","N": 1 2 2 2 2 2 2 2 2 2 ...
##  $ Region : Factor w/ 4 levels "southwest","southeast",..: 1 2 2 3 3 2 2 3 4 3 ...
##  $ Gastos : num [1:1338] 16885 1726 4449 21984 3867 ...
##  - attr(*, "problems")=<externalptr>
##       Edad       Sexo         IMC            Hijos       Fumador 
##  Min.   :18.00   F:662   Min.   :15.96   Min.   :0.000   Y: 274  
##  1st Qu.:27.00   M:676   1st Qu.:26.30   1st Qu.:0.000   N:1064  
##  Median :39.00           Median :30.40   Median :1.000           
##  Mean   :39.21           Mean   :30.66   Mean   :1.095           
##  3rd Qu.:51.00           3rd Qu.:34.69   3rd Qu.:2.000           
##  Max.   :64.00           Max.   :53.13   Max.   :5.000           
##        Region        Gastos     
##  southwest:325   Min.   : 1122  
##  southeast:364   1st Qu.: 4740  
##  northwest:325   Median : 9382  
##  northeast:324   Mean   :13270  
##                  3rd Qu.:16640  
##                  Max.   :63770

3.1. Análisis Univariado de Gastos

## 
##  Shapiro-Wilk normality test
## 
## data:  data$Gastos
## W = 0.81469, p-value < 2.2e-16

l test de Shapiro-Wilk aplicado a la variable Gastos muestra que los datos no siguen una distribución normal, con un valor W de 0.81469 y un p-value < 2.2e-16. El diagrama de barras refleja que los gastos están fuertemente sesgados hacia la derecha, con la mayoría de las observaciones concentradas en rangos más bajos. Además, el boxplot indica la presencia de varios datos atípicos en el rango superior, mostrando individuos con costos médicos significativamente elevados en comparación con el promedio.

3.2. Análisis Bivariado

3.2.1. Análisis Bivariado de Edad vs Gastos

## 
##  Pearson's product-moment correlation
## 
## data:  data$Edad and data$Gastos
## t = 11.453, df = 1336, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2494144 0.3470386
## sample estimates:
##       cor 
## 0.2990087

El análisis bivariado entre la variable Edad y Gastos muestra una correlación positiva estadísticamente significativa, con un coeficiente de correlación de 0.2990 (p-value < 2.2e-16). Esto indica que, a medida que aumenta la edad, los gastos médicos tienden a incrementarse de manera moderada. La línea de tendencia en el diagrama de dispersión refleja este patrón ascendente, aunque los puntos muestran una dispersión considerable, sugiriendo que otros factores también influyen en los gastos médicos. La correlación, aunque moderada, tiene un intervalo de confianza del 95% entre 0.2494 y 0.3470, confirmando la solidez de esta relación.

3.2.2. Análisis Bivariado de IMC vs Gastos

## 
##  Pearson's product-moment correlation
## 
## data:  data$IMC and data$Gastos
## t = 7.3966, df = 1336, p-value = 2.459e-13
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1463051 0.2492821
## sample estimates:
##       cor 
## 0.1983409

El análisis bivariado entre la variable IMC y Gastos muestra una correlación positiva estadísticamente significativa, con un coeficiente de correlación de 0.1983 (p-value = 2.459e-13). Esto indica una relación débil pero positiva, donde un mayor IMC tiende a asociarse con mayores gastos médicos. El intervalo de confianza al 95% (0.1463, 0.2493) confirma la fiabilidad de esta correlación, aunque su magnitud es moderada. Visualmente, el diagrama de dispersión sugiere una tendencia ascendente leve, mientras que la presencia de dispersión considerable implica que hay otros factores que también influyen significativamente en los gastos médicos

3.2.4. Análisis Bivariado de Región vs Gastos

## Analysis of Variance Table
## 
## Response: Gastos
##             Df     Sum Sq   Mean Sq F value  Pr(>F)  
## Region       3 1.3008e+09 433587959  2.9696 0.03089 *
## Residuals 1334 1.9477e+11 146007130                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El análisis de varianza (ANOVA) realizado para la variable Gastos con respecto a la variable categórica Región revela diferencias estadísticamente significativas entre las regiones, con un valor p = 0.03089. Esto indica que, al menos en una región, los gastos médicos promedio difieren de las demás.

3.3. Análisis Multivariado

Para el análisis multivariado se seleccionaron únicamente las variables numéricas (Edad, IMC, Hijos, y Gastos) debido a que el ACP trabaja exclusivamente con datos continuos y cuantitativos. Las variables categóricas como Sexo, Fumador, y Región fueron excluidas del análisis. Este enfoque permite identificar patrones subyacentes y reducir la dimensionalidad del conjunto de datos.

3.3.1. Análisis de Correlación

El análisis de correlación entre las variables Edad, IMC, Hijos y Gastos muestra que existen relaciones positivas moderadas entre Edad y Gastos (0.30) y entre IMC y Gastos (0.20), lo que sugiere que a mayor edad e índice de masa corporal, los gastos médicos tienden a aumentar, aunque no de manera muy pronunciada. La correlación entre Hijos y Gastos es débil (0.12), indicando que el número de hijos tiene poca influencia en los costos médicos. Otras relaciones, como entre Edad y Hijos (0.04), son prácticamente nulas, lo que refleja poca dependencia directa entre estas variables en este conjunto de datos. Estos patrones destacan la necesidad de explorar factores adicionales o interacciones para modelar de manera más precisa los gastos médicos.

4. Modelo

Dado el resultado del test de Shapiro-Wilk para la variable Gastos (P-value < 2.2e-16), se confirma que los datos no siguen una distribución normal. Esto tiene importantes implicaciones para el modelo, ya que la normalidad es una suposición clave para algunos métodos estadísticos como la regresión lineal clásica.

Por ello, el uso de un Modelo Lineal Generalizado (GLM) con una distribución adecuada, como la Inversa Gausiana, sería más adecuado. Esto permite manejar la naturaleza de los datos, incluyendo su posible sesgo y heterogeneidad. La transformación de datos o ajustes en las varianzas también puede ser considerados para mejorar el ajuste y la interpretación del modelo.

4.1. Resultados del Modelo

  • Modelo con Función de Enlace 1/mu^2
## 
## Call:
## glm(formula = Gastos ~ Edad + IMC + Hijos + Sexo + Region, family = inverse.gaussian(link = "1/mu^2"), 
##     data = data, start = rep(0.1, 8))
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      2.162e-08  1.394e-09  15.510  < 2e-16 ***
## Edad            -1.915e-10  2.025e-11  -9.456  < 2e-16 ***
## IMC             -1.766e-10  3.566e-11  -4.952 8.28e-07 ***
## Hijos           -4.413e-10  1.540e-10  -2.865  0.00423 ** 
## SexoM           -7.679e-10  4.829e-10  -1.590  0.11204    
## Regionsoutheast -9.453e-10  7.035e-10  -1.344  0.17929    
## Regionnorthwest -1.269e-10  7.239e-10  -0.175  0.86085    
## Regionnortheast -1.210e-09  8.025e-10  -1.508  0.13173    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for inverse.gaussian family taken to be 7.56392e-05)
## 
##     Null deviance: 0.12567  on 1337  degrees of freedom
## Residual deviance: 0.11582  on 1330  degrees of freedom
## AIC: 27821
## 
## Number of Fisher Scoring iterations: 25
  • Modelo con Función de Enlace Log
## 
## Call:
## glm(formula = Gastos ~ Edad + IMC + Hijos + Sexo + Region, family = inverse.gaussian(link = "log"), 
##     data = data)
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     7.503893   0.157026  47.788  < 2e-16 ***
## Edad            0.019842   0.001974  10.052  < 2e-16 ***
## IMC             0.032431   0.004690   6.916 7.21e-12 ***
## Hijos           0.063635   0.023032   2.763  0.00581 ** 
## SexoM           0.049328   0.053172   0.928  0.35373    
## Regionsoutheast 0.100190   0.076068   1.317  0.18803    
## Regionnorthwest 0.044657   0.073837   0.605  0.54541    
## Regionnortheast 0.138801   0.075605   1.836  0.06660 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for inverse.gaussian family taken to be 8.010346e-05)
## 
##     Null deviance: 0.12567  on 1337  degrees of freedom
## Residual deviance: 0.11276  on 1330  degrees of freedom
## AIC: 27785
## 
## Number of Fisher Scoring iterations: 12

AIC: 27785, Residual deviance: 0.11276 Variables significativas: Edad, IMC, Hijos (𝑝 < 0.05) Sexo y Región no tienen impacto estadísticamente significativo.

  • Modelo con Función de Enlace Identity
## 
## Call:
## glm(formula = Gastos ~ Edad + IMC + Hijos + Sexo + Region, family = inverse.gaussian(link = "identity"), 
##     data = data)
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     -9803.14     974.65 -10.058  < 2e-16 ***
## Edad              234.02      24.53   9.541  < 2e-16 ***
## IMC               415.90      41.31  10.068  < 2e-16 ***
## Hijos             701.28     246.18   2.849  0.00446 ** 
## SexoM            -964.25     416.03  -2.318  0.02061 *  
## Regionsoutheast  1129.67     679.33   1.663  0.09656 .  
## Regionnorthwest  1316.57     519.86   2.533  0.01144 *  
## Regionnortheast  2265.23     571.98   3.960 7.88e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for inverse.gaussian family taken to be 8.325468e-05)
## 
##     Null deviance: 0.12567  on 1337  degrees of freedom
## Residual deviance: 0.11138  on 1330  degrees of freedom
## AIC: 27768
## 
## Number of Fisher Scoring iterations: 17

AIC: 27768, Residual deviance: 0.11138 Variables significativas: Edad, IMC, Hijos, Región northeast, Región northwest, y Sexo (𝑝 < 0.05).

  • Modelo con Función de Enlace Inverse
## 
## Call:
## glm(formula = Gastos ~ Edad + IMC + Hijos + Sexo + Region, family = inverse.gaussian(link = "inverse"), 
##     data = data)
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      2.179e-04  1.298e-05  16.784  < 2e-16 ***
## Edad            -1.490e-06  1.513e-07  -9.853  < 2e-16 ***
## IMC             -2.017e-06  3.497e-07  -5.768 9.95e-09 ***
## Hijos           -4.366e-06  1.666e-06  -2.621  0.00887 ** 
## SexoM           -6.966e-06  4.174e-06  -1.669  0.09536 .  
## Regionsoutheast -7.989e-06  5.855e-06  -1.364  0.17267    
## Regionnorthwest -2.867e-06  6.245e-06  -0.459  0.64630    
## Regionnortheast -9.788e-06  6.094e-06  -1.606  0.10846    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for inverse.gaussian family taken to be 7.825098e-05)
## 
##     Null deviance: 0.12567  on 1337  degrees of freedom
## Residual deviance: 0.11408  on 1330  degrees of freedom
## AIC: 27800
## 
## Number of Fisher Scoring iterations: 2

AIC: 27800, Residual deviance: 0.11408 Variables significativas: Edad, IMC, Hijos (𝑝 < 0.05). Sexo y Región no presentan impacto relevante.

4.2. Análisis Comparativo de AIC

##                 df      AIC
## modelo_log       9 27784.75
## modelo_identity  9 27768.29
## modelo_inverse   9 27800.33
## modelo_mu        9 27820.60

El modelo con el enlace “identity” es el mejor, ya que tiene el AIC más bajo, indicando que es el más eficiente para describir los datos con la menor pérdida de información.

4.3. Análisis de Deviance

##           [,1]     [,2]      [,3]      [,4]
## [1,] 0.1127609 0.111382 0.1140812 0.1158232

El análisis de deviance compara cómo diferentes modelos estadísticos explican la variabilidad de los datos. Valores más bajos de deviance indican un mejor ajuste, ya que el modelo captura mejor las relaciones entre las variables. En este caso, modelo identity es el mejor que se ajusta.

4.4. Test de verosimilitud

Este prueba evalúa la contribución de las variables incluidas en el modelo de forma incremental:

  • Modelos con Sexo

  • Modelos sin Sexo

## 
## Call:  glm(formula = Gastos ~ Edad + IMC + Hijos + Region, family = inverse.gaussian(link = "identity"), 
##     data = data)
## 
## Coefficients:
##     (Intercept)             Edad              IMC            Hijos  
##         -9057.5            228.7            386.8            668.4  
## Regionsoutheast  Regionnorthwest  Regionnortheast  
##           956.7            779.6           1761.3  
## 
## Degrees of Freedom: 1337 Total (i.e. Null);  1331 Residual
## Null Deviance:       0.1257 
## Residual Deviance: 0.1116    AIC: 27770
  • Test de verosimilitud
## Analysis of Deviance Table
## 
## Model 1: Gastos ~ Edad + IMC + Hijos + Region
## Model 2: Gastos ~ Edad + IMC + Hijos + Sexo + Region
##   Resid. Df Resid. Dev Df  Deviance      F  Pr(>F)  
## 1      1331    0.11163                              
## 2      1330    0.11138  1 0.0002468 2.9644 0.08535 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La inclusión de la variable Sexo en el modelo no mejora significativamente el ajuste, ya que el valor p asociado es mayor a 0.05. Esto indica que Sexo no aporta una variabilidad adicional relevante en los gastos, por lo que podría considerarse su exclusión del modelo para simplificar el análisis y enfocarse en las variables más significativas como Edad, IMC, e Hijos.

  • Modelos con Regionsoutheast

  • Modelos sin Regionsoutheast

  • Test de verosimilitud

## Analysis of Deviance Table
## 
## Model 1: Gastos ~ Edad + IMC + Hijos + Regionnorthwest + Regionnortheast
## Model 2: Gastos ~ Edad + IMC + Hijos + data$Regionsoutheast + data$Regionnorthwest + 
##     data$Regionnortheast
##   Resid. Df Resid. Dev Df   Deviance      F Pr(>F)
## 1      1332    0.11178                            
## 2      1331    0.11163  1 0.00015013 1.8399 0.1752

La inclusión de la variable Regionsoutheast en el modelo no mejora significativamente el ajuste, ya que el valor p asociado es mayor a 0.05 (p = 0.1752). Esto indica que esta variable no aporta una variabilidad adicional relevante a los gastos. Por lo tanto, se podría considerar omitir Regionsoutheast para simplificar el modelo y enfocarse en las variables más significativas.

  • Modelos con Regionnorthwest

  • Modelos sin Regionnorthwest

  • Test de verosimilitud

## Analysis of Deviance Table
## 
## Model 1: Gastos ~ Edad + IMC + Hijos + Regionnortheast
## Model 2: Gastos ~ Edad + IMC + Hijos + Regionnorthwest + Regionnortheast
##   Resid. Df Resid. Dev Df   Deviance      F Pr(>F)
## 1      1333    0.11183                            
## 2      1332    0.11178  1 5.0808e-05 0.6147 0.4332

La inclusión de la variable Regionnorthwest en el modelo no mejora significativamente el ajuste, ya que el valor p asociado es mayor a 0.05 (p = 0.4332). Esto indica que esta variable no aporta una variabilidad adicional relevante a los gastos. Por lo tanto, se podría considerar omitir Regionsoutheast para simplificar el modelo y enfocarse en las variables más significativas.

  • Modelo seleccionado
## 
##   Wald test 
## 
## Model 1 :  Gastos ~ 1 
## Model 2 :  Gastos ~ Edad 
## Model 3 :  Gastos ~ Edad + IMC 
## Model 4 :  Gastos ~ Edad + IMC + Hijos 
## Model 5 :  Gastos ~ Edad + IMC + Hijos + Regionnortheast 
## 
##          Chi    df  Pr(Chisq>)    
## 1 vs 2 80.1763   1   < 2.2e-16 ***
## 2 vs 3 62.0678   1   3.331e-15 ***
## 3 vs 4  9.8527   1    0.001696 ** 
## 4 vs 5  4.3561   1    0.036877 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El análisis de deviance revela que cada variable contribuye significativamente a la explicación de la varianza en la variable dependiente, destacándose Edad e IMC por su fuerte impacto sobre los gastos, evidenciado p-valores extremadamente bajos. La variable Hijos también muestra significancia estadística, aunque en menor medida, mientras que Regionnortheast, si bien tiene una contribución más modesta, mantiene relevancia estadística en el modelo. Estos hallazgos indican que las variables Edad, IMC, Hijos y Regionnortheast deben ser priorizadas como predictores clave en el modelamiento de los gastos médicos, proporcionando una base sólida para interpretaciones más profundas de los factores que influyen en los costos.

  • Comparacion de modelo inicial vs modelo final
##                 df      AIC
## model            6 27767.66
## modelo_identity  9 27768.29
## Modelo final :
## [1] 0.1118297
## Modelo inicial :
## [1] 0.111382

La deviance entre los dos modelos es muy similar (0.1118297 vs 0.111382), indicando que la reducción de variables no sacrificó significativamente la calidad del ajuste.

El AIC también es muy parecido, pero el modelo inicial tiene un valor ligeramente más bajo (27767.66 frente a 27768.29), lo que sugiere que, aunque ambos modelos son comparables, el inicial podría ser marginalmente mejor en términos de ajuste estadístico.

  • Bondad de ajuste
##   |                                                          |                                                  |   0%  |                                                          |                                                  |   1%  |                                                          |+                                                 |   1%  |                                                          |+                                                 |   2%  |                                                          |+                                                 |   3%  |                                                          |++                                                |   3%  |                                                          |++                                                |   4%  |                                                          |++                                                |   5%  |                                                          |+++                                               |   5%  |                                                          |+++                                               |   6%  |                                                          |+++                                               |   7%  |                                                          |++++                                              |   7%  |                                                          |++++                                              |   8%  |                                                          |++++                                              |   9%  |                                                          |+++++                                             |   9%  |                                                          |+++++                                             |  10%  |                                                          |+++++                                             |  11%  |                                                          |++++++                                            |  11%  |                                                          |++++++                                            |  12%  |                                                          |++++++                                            |  13%  |                                                          |+++++++                                           |  13%  |                                                          |+++++++                                           |  14%  |                                                          |+++++++                                           |  15%  |                                                          |++++++++                                          |  15%  |                                                          |++++++++                                          |  16%  |                                                          |++++++++                                          |  17%  |                                                          |+++++++++                                         |  17%  |                                                          |+++++++++                                         |  18%  |                                                          |+++++++++                                         |  19%  |                                                          |++++++++++                                        |  19%  |                                                          |++++++++++                                        |  20%  |                                                          |++++++++++                                        |  21%  |                                                          |+++++++++++                                       |  21%  |                                                          |+++++++++++                                       |  22%  |                                                          |+++++++++++                                       |  23%  |                                                          |++++++++++++                                      |  23%  |                                                          |++++++++++++                                      |  24%  |                                                          |++++++++++++                                      |  25%  |                                                          |+++++++++++++                                     |  25%  |                                                          |+++++++++++++                                     |  26%  |                                                          |+++++++++++++                                     |  27%  |                                                          |++++++++++++++                                    |  27%  |                                                          |++++++++++++++                                    |  28%  |                                                          |++++++++++++++                                    |  29%  |                                                          |+++++++++++++++                                   |  29%  |                                                          |+++++++++++++++                                   |  30%  |                                                          |+++++++++++++++                                   |  31%  |                                                          |++++++++++++++++                                  |  31%  |                                                          |++++++++++++++++                                  |  32%  |                                                          |++++++++++++++++                                  |  33%  |                                                          |+++++++++++++++++                                 |  33%  |                                                          |+++++++++++++++++                                 |  34%  |                                                          |+++++++++++++++++                                 |  35%  |                                                          |++++++++++++++++++                                |  35%  |                                                          |++++++++++++++++++                                |  36%  |                                                          |++++++++++++++++++                                |  37%  |                                                          |+++++++++++++++++++                               |  37%  |                                                          |+++++++++++++++++++                               |  38%  |                                                          |+++++++++++++++++++                               |  39%  |                                                          |++++++++++++++++++++                              |  39%  |                                                          |++++++++++++++++++++                              |  40%  |                                                          |++++++++++++++++++++                              |  41%  |                                                          |+++++++++++++++++++++                             |  41%  |                                                          |+++++++++++++++++++++                             |  42%  |                                                          |+++++++++++++++++++++                             |  43%  |                                                          |++++++++++++++++++++++                            |  43%  |                                                          |++++++++++++++++++++++                            |  44%  |                                                          |++++++++++++++++++++++                            |  45%  |                                                          |+++++++++++++++++++++++                           |  45%  |                                                          |+++++++++++++++++++++++                           |  46%  |                                                          |+++++++++++++++++++++++                           |  47%  |                                                          |++++++++++++++++++++++++                          |  47%  |                                                          |++++++++++++++++++++++++                          |  48%  |                                                          |++++++++++++++++++++++++                          |  49%  |                                                          |+++++++++++++++++++++++++                         |  49%  |                                                          |+++++++++++++++++++++++++                         |  50%  |                                                          |+++++++++++++++++++++++++                         |  51%  |                                                          |++++++++++++++++++++++++++                        |  51%  |                                                          |++++++++++++++++++++++++++                        |  52%  |                                                          |++++++++++++++++++++++++++                        |  53%  |                                                          |+++++++++++++++++++++++++++                       |  53%  |                                                          |+++++++++++++++++++++++++++                       |  54%  |                                                          |+++++++++++++++++++++++++++                       |  55%  |                                                          |++++++++++++++++++++++++++++                      |  55%  |                                                          |++++++++++++++++++++++++++++                      |  56%  |                                                          |++++++++++++++++++++++++++++                      |  57%  |                                                          |+++++++++++++++++++++++++++++                     |  57%  |                                                          |+++++++++++++++++++++++++++++                     |  58%  |                                                          |+++++++++++++++++++++++++++++                     |  59%  |                                                          |++++++++++++++++++++++++++++++                    |  59%  |                                                          |++++++++++++++++++++++++++++++                    |  60%  |                                                          |++++++++++++++++++++++++++++++                    |  61%  |                                                          |+++++++++++++++++++++++++++++++                   |  61%  |                                                          |+++++++++++++++++++++++++++++++                   |  62%  |                                                          |+++++++++++++++++++++++++++++++                   |  63%  |                                                          |++++++++++++++++++++++++++++++++                  |  63%  |                                                          |++++++++++++++++++++++++++++++++                  |  64%  |                                                          |++++++++++++++++++++++++++++++++                  |  65%  |                                                          |+++++++++++++++++++++++++++++++++                 |  65%  |                                                          |+++++++++++++++++++++++++++++++++                 |  66%  |                                                          |+++++++++++++++++++++++++++++++++                 |  67%  |                                                          |++++++++++++++++++++++++++++++++++                |  67%  |                                                          |++++++++++++++++++++++++++++++++++                |  68%  |                                                          |++++++++++++++++++++++++++++++++++                |  69%  |                                                          |+++++++++++++++++++++++++++++++++++               |  69%  |                                                          |+++++++++++++++++++++++++++++++++++               |  70%  |                                                          |+++++++++++++++++++++++++++++++++++               |  71%  |                                                          |++++++++++++++++++++++++++++++++++++              |  71%  |                                                          |++++++++++++++++++++++++++++++++++++              |  72%  |                                                          |++++++++++++++++++++++++++++++++++++              |  73%  |                                                          |+++++++++++++++++++++++++++++++++++++             |  73%  |                                                          |+++++++++++++++++++++++++++++++++++++             |  74%  |                                                          |+++++++++++++++++++++++++++++++++++++             |  75%  |                                                          |++++++++++++++++++++++++++++++++++++++            |  75%  |                                                          |++++++++++++++++++++++++++++++++++++++            |  76%  |                                                          |++++++++++++++++++++++++++++++++++++++            |  77%  |                                                          |+++++++++++++++++++++++++++++++++++++++           |  77%  |                                                          |+++++++++++++++++++++++++++++++++++++++           |  78%  |                                                          |+++++++++++++++++++++++++++++++++++++++           |  79%  |                                                          |++++++++++++++++++++++++++++++++++++++++          |  79%  |                                                          |++++++++++++++++++++++++++++++++++++++++          |  80%  |                                                          |++++++++++++++++++++++++++++++++++++++++          |  81%  |                                                          |+++++++++++++++++++++++++++++++++++++++++         |  81%  |                                                          |+++++++++++++++++++++++++++++++++++++++++         |  82%  |                                                          |+++++++++++++++++++++++++++++++++++++++++         |  83%  |                                                          |++++++++++++++++++++++++++++++++++++++++++        |  83%  |                                                          |++++++++++++++++++++++++++++++++++++++++++        |  84%  |                                                          |++++++++++++++++++++++++++++++++++++++++++        |  85%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++       |  85%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++       |  86%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++       |  87%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++      |  87%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++      |  88%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++      |  89%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++     |  89%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++     |  90%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++     |  91%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++    |  91%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++    |  92%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++    |  93%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++   |  93%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++   |  94%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++   |  95%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++++  |  95%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++++  |  96%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++++  |  97%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++++ |  97%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++++ |  98%  |                                                          |+++++++++++++++++++++++++++++++++++++++++++++++++ |  99%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++++++|  99%  |                                                          |++++++++++++++++++++++++++++++++++++++++++++++++++| 100%

La bondad de ajuste evalúa qué tan bien un modelo estadístico representa los datos observados. En tu caso, los valores de deviance y AIC indican que ambos modelos (inicial y final) se ajustan bien, con diferencias mínimas que sugieren que la simplificación del modelo no compromete significativamente el ajuste. Además, los criterios como AIC favorecen ligeramente al modelo inicial (más complejo), pero su ventaja es marginal. Por lo tanto, el modelo final simplificado resulta válido y más interpretable, manteniendo un balance razonable entre precisión y simplicidad. Esto implica que las variables eliminadas tenían un aporte estadísticamente limitado al modelo.

  • Residuales

Los residuales analizados en el gráfico muestran los residuos estandarizados tipo deviance frente a los valores ajustados del modelo. Los puntos parecen dispersos de manera bastante aleatoria alrededor de la línea cero, lo que indica una buena adecuación general del modelo. Sin embargo, no se observan valores más allá de las líneas punteadas horizontales en 𝑦=−3 y 𝑦=3, lo que significa que no se detectan outliers significativos ni problemas graves de ajuste.