Trabajo individual

Row

Variables dento del análisis

 [1] "DEPARTAMENTO"   "PROVINCIA"      "UBIGEO"         "Esperanza_vida"
 [5] "Población"      "Urbano"         "P_agua_luz"     "Año_estud"     
 [9] "P_alfabeta"     "P_asegurada"    "P_presu_usado"  "Nivel_pobreza" 
[13] "Indice_corr"    "Ing_fam"       

Tipo de variables

[1] "character"
[1] "character"
[1] "integer"
[1] "numeric"
[1] "integer"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "integer"
[1] "numeric"

Row

Descripción del tema

Factores socioeconómicos que pueden afectar la esperanza de vida de los pobladores de las 196 provincias de Perú. En este análisis se usan variables como acceso a servicios básicos (agua y luz), nivel de pobreza, analfabetismo, afiliación a seguros de salud, corrupción, ingreso mensual familiar y ejecución presupuestal para entender cómo influyen en la esperanza de vida al nacer.

Variable Dependiente

Row

Variable Dependiente

La esperanza de vida al nacer es una medida estadística que estima el número promedio de años que viviría una persona si se mantuvieran constantes las tasas de mortalidad por edad observadas en un determinado año. Es un indicador fundamental de salud pública y calidad de vida, utilizado para evaluar el desarrollo social y económico de un país o región

Estadísticos de la VD

Resumen Estadístico de la Esperanza de Vida
Media Mediana Desviación Variación Mínimo Máximo
73.91 74.78 7.63 58.21 46.54 93.11

Row

Box plot

Histograma

Regresión Gauss

Column {data-width=500}

Modelo sin escalar


Call:
lm(formula = Esperanza_vida ~ Población + Urbano + P_agua_luz + 
    Año_estud + P_alfabeta + P_asegurada + Nivel_pobreza + P_presu_usado + 
    Ing_fam + Indice_corr, data = data)

Residuals:
     Min       1Q   Median       3Q      Max 
-23.4738  -3.8893   0.7445   5.0143  20.1750 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)    6.940e+01  1.913e+01   3.628 0.000369 ***
Población     -9.401e-09  8.484e-07  -0.011 0.991171    
Urbano        -1.281e-02  2.170e-02  -0.591 0.555561    
P_agua_luz     4.536e-02  3.642e-02   1.246 0.214486    
Año_estud     -1.513e+00  6.941e-01  -2.180 0.030530 *  
P_alfabeta     1.312e-01  2.117e-01   0.620 0.536342    
P_asegurada   -4.003e-02  7.620e-02  -0.525 0.600000    
Nivel_pobreza -4.175e-01  7.345e-01  -0.568 0.570457    
P_presu_usado -8.708e-02  5.345e-02  -1.629 0.104944    
Ing_fam        1.341e-02  3.492e-03   3.841 0.000168 ***
Indice_corr    7.581e-02  5.475e-02   1.385 0.167816    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 6.863 on 185 degrees of freedom
Multiple R-squared:  0.2325,    Adjusted R-squared:  0.191 
F-statistic: 5.604 on 10 and 185 DF,  p-value: 2.688e-07

Modelo escalado


Call:
lm(formula = scale(Esperanza_vida) ~ scale(Población) + scale(Urbano) + 
    scale(P_agua_luz) + scale(Año_estud) + scale(P_alfabeta) + 
    scale(P_asegurada) + scale(Nivel_pobreza) + scale(P_presu_usado) + 
    scale(Ing_fam) + scale(Indice_corr), data = data)

Residuals:
     Min       1Q   Median       3Q      Max 
-3.07658 -0.50975  0.09758  0.65719  2.64422 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)           2.292e-16  6.425e-02   0.000 1.000000    
scale(Población)     -7.721e-04  6.968e-02  -0.011 0.991171    
scale(Urbano)        -3.943e-02  6.677e-02  -0.591 0.555561    
scale(P_agua_luz)     9.136e-02  7.335e-02   1.246 0.214486    
scale(Año_estud)     -3.448e-01  1.582e-01  -2.180 0.030530 *  
scale(P_alfabeta)     8.854e-02  1.429e-01   0.620 0.536342    
scale(P_asegurada)   -4.907e-02  9.342e-02  -0.525 0.600000    
scale(Nivel_pobreza) -7.212e-02  1.269e-01  -0.568 0.570457    
scale(P_presu_usado) -1.107e-01  6.797e-02  -1.629 0.104944    
scale(Ing_fam)        4.774e-01  1.243e-01   3.841 0.000168 ***
scale(Indice_corr)    1.042e-01  7.522e-02   1.385 0.167816    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8994 on 185 degrees of freedom
Multiple R-squared:  0.2325,    Adjusted R-squared:  0.191 
F-statistic: 5.604 on 10 and 185 DF,  p-value: 2.688e-07

No hay mucha diferencia, pero es importante para ver el verdadero impacto de cada variable

Análisis Factorial

Column {data-width=500}

Cuadro de correlaciones

Matriz de Correlaciones
Esperanza_vida Población Urbano P_agua_luz Año_estud P_alfabeta P_asegurada P_presu_usado Nivel_pobreza Indice_corr Ing_fam
Esperanza_vida 1.00 0.12 -0.04 0.24 0.30 0.32 -0.25 -0.16 -0.34 0.21 0.43
Población 0.12 1.00 0.00 0.17 0.28 0.23 -0.15 0.08 -0.20 0.24 0.31
Urbano -0.04 0.00 1.00 -0.05 -0.11 -0.07 0.13 -0.04 0.13 0.07 -0.05
P_agua_luz 0.24 0.17 -0.05 1.00 0.28 0.31 -0.06 -0.17 -0.33 0.11 0.34
Año_estud 0.30 0.28 -0.11 0.28 1.00 0.85 -0.62 -0.06 -0.82 0.48 0.82
P_alfabeta 0.32 0.23 -0.07 0.31 0.85 1.00 -0.68 0.00 -0.79 0.37 0.76
P_asegurada -0.25 -0.15 0.13 -0.06 -0.62 -0.68 1.00 0.08 0.61 -0.28 -0.55
P_presu_usado -0.16 0.08 -0.04 -0.17 -0.06 0.00 0.08 1.00 0.08 0.04 -0.11
Nivel_pobreza -0.34 -0.20 0.13 -0.33 -0.82 -0.79 0.61 0.08 1.00 -0.37 -0.78
Indice_corr 0.21 0.24 0.07 0.11 0.48 0.37 -0.28 0.04 -0.37 1.00 0.41
Ing_fam 0.43 0.31 -0.05 0.34 0.82 0.76 -0.55 -0.11 -0.78 0.41 1.00

KMO test

Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data_filtrada)
Overall MSA =  0.85
MSA for each item = 
Esperanza_vida      Población         Urbano     P_agua_luz      Año_estud 
          0.84           0.82           0.40           0.73           0.84 
    P_alfabeta    P_asegurada  P_presu_usado  Nivel_pobreza    Indice_corr 
          0.85           0.86           0.38           0.92           0.86 
       Ing_fam 
          0.90 
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = dataKMO)
Overall MSA =  0.89
MSA for each item = 
Esperanza_vida      Población      Año_estud     P_alfabeta    P_asegurada 
          0.83           0.87           0.84           0.88           0.93 
 Nivel_pobreza    Indice_corr        Ing_fam 
          0.92           0.90           0.89 

Para que tenga significacia en el segundo cuadro solo están las variables que obtuvieron un valor mayor a 0.8

Matriz adecuada

Identidad
[1] FALSE
Singular
[1] FALSE

Redimensionar

Parallel analysis suggests that the number of factors =  1  and the number of components =  NA 

Sugiere 1 división

Redimensión

Cargas Factoriales del Análisis Factorial
x
Esperanza_vida 0.403
Población 0.293
Urbano -0.098
P_agua_luz 0.338
Año_estud 0.932
P_alfabeta 0.893
P_asegurada -0.662
P_presu_usado -0.088
Nivel_pobreza -0.929
Indice_corr 0.450
Ing_fam 0.889

Resultados EFA

Row

Figura Corplot

> Solo se trabaja con las variables que tengan un mayor impacto

Conclusiones

Row

Conclusión

Las variables no se consideran significativas para explicar la variable dependiente. En el análisis múltivariado se ve como solo dos del total de variables tienen significancia, esto puede indicar que existen otros factores que no han sido considerados en este trabajo que tienen mayor inportancia.

En la parte de ánalisis del modelo presentado se puede ver que el p-valor global es bajo (2.688e-07), pero indica significancia. Como bien se ha mencionado, solo un par de variables son las responsables de que el modelo tenga significancia, estas variables son: Años de estudio (Año_estud) e Ingreso familiar (Ing_fam).

La primera variable muestra una tendencia negativa. Esto es algo curioso debido a que se esperaría encontrar una relación positiva entre la cantidad de años de estudio y la esperanza de vida de una persona, y ayuda a pensar en otros factores que podrían estar afectando más la esperanza de vida que los años de educación.

La segunda variable tiene un coeficiente positivo. Esto confirma la idea de que a mayor ingreso familiar se espera una mayor esperanza de vida, lo cual es intuitivo, ya que mayores ingresos permiten mejor acceso a servicios de salud, alimentación y condiciones de vida.

Por parte de las variables no significativas que se esperaba cuenten con significancia están las siguientes: población, nivel de pobreza, corrupción, y acceso a agua y luz. Esto se puede atribuir a un mal uso de las variables o a una mala estructura dentro de los datos estadísticos. Una variable considerbale es la Población urbana (Urbano) ya que se esperaría que el hecho de vivir en zonas urbanas tendría un efecto positivo en la cantidad de años de esperanza de vida debido al alcance y facilidaddes que ello implica en la población, pero esta suposición no es perceptible en este caso.