[1] "DEPARTAMENTO" "PROVINCIA" "UBIGEO" "Esperanza_vida"
[5] "Población" "Urbano" "P_agua_luz" "Año_estud"
[9] "P_alfabeta" "P_asegurada" "P_presu_usado" "Nivel_pobreza"
[13] "Indice_corr" "Ing_fam"
[1] "character"
[1] "character"
[1] "integer"
[1] "numeric"
[1] "integer"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "numeric"
[1] "integer"
[1] "numeric"
Factores socioeconómicos que pueden afectar la esperanza de vida de los pobladores de las 196 provincias de Perú. En este análisis se usan variables como acceso a servicios básicos (agua y luz), nivel de pobreza, analfabetismo, afiliación a seguros de salud, corrupción, ingreso mensual familiar y ejecución presupuestal para entender cómo influyen en la esperanza de vida al nacer.
La esperanza de vida al nacer es una medida estadística que estima el número promedio de años que viviría una persona si se mantuvieran constantes las tasas de mortalidad por edad observadas en un determinado año. Es un indicador fundamental de salud pública y calidad de vida, utilizado para evaluar el desarrollo social y económico de un país o región
| Media | Mediana | Desviación | Variación | Mínimo | Máximo |
|---|---|---|---|---|---|
| 73.91 | 74.78 | 7.63 | 58.21 | 46.54 | 93.11 |
Call:
lm(formula = Esperanza_vida ~ Población + Urbano + P_agua_luz +
Año_estud + P_alfabeta + P_asegurada + Nivel_pobreza + P_presu_usado +
Ing_fam + Indice_corr, data = data)
Residuals:
Min 1Q Median 3Q Max
-23.4738 -3.8893 0.7445 5.0143 20.1750
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.940e+01 1.913e+01 3.628 0.000369 ***
Población -9.401e-09 8.484e-07 -0.011 0.991171
Urbano -1.281e-02 2.170e-02 -0.591 0.555561
P_agua_luz 4.536e-02 3.642e-02 1.246 0.214486
Año_estud -1.513e+00 6.941e-01 -2.180 0.030530 *
P_alfabeta 1.312e-01 2.117e-01 0.620 0.536342
P_asegurada -4.003e-02 7.620e-02 -0.525 0.600000
Nivel_pobreza -4.175e-01 7.345e-01 -0.568 0.570457
P_presu_usado -8.708e-02 5.345e-02 -1.629 0.104944
Ing_fam 1.341e-02 3.492e-03 3.841 0.000168 ***
Indice_corr 7.581e-02 5.475e-02 1.385 0.167816
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 6.863 on 185 degrees of freedom
Multiple R-squared: 0.2325, Adjusted R-squared: 0.191
F-statistic: 5.604 on 10 and 185 DF, p-value: 2.688e-07
Call:
lm(formula = scale(Esperanza_vida) ~ scale(Población) + scale(Urbano) +
scale(P_agua_luz) + scale(Año_estud) + scale(P_alfabeta) +
scale(P_asegurada) + scale(Nivel_pobreza) + scale(P_presu_usado) +
scale(Ing_fam) + scale(Indice_corr), data = data)
Residuals:
Min 1Q Median 3Q Max
-3.07658 -0.50975 0.09758 0.65719 2.64422
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.292e-16 6.425e-02 0.000 1.000000
scale(Población) -7.721e-04 6.968e-02 -0.011 0.991171
scale(Urbano) -3.943e-02 6.677e-02 -0.591 0.555561
scale(P_agua_luz) 9.136e-02 7.335e-02 1.246 0.214486
scale(Año_estud) -3.448e-01 1.582e-01 -2.180 0.030530 *
scale(P_alfabeta) 8.854e-02 1.429e-01 0.620 0.536342
scale(P_asegurada) -4.907e-02 9.342e-02 -0.525 0.600000
scale(Nivel_pobreza) -7.212e-02 1.269e-01 -0.568 0.570457
scale(P_presu_usado) -1.107e-01 6.797e-02 -1.629 0.104944
scale(Ing_fam) 4.774e-01 1.243e-01 3.841 0.000168 ***
scale(Indice_corr) 1.042e-01 7.522e-02 1.385 0.167816
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8994 on 185 degrees of freedom
Multiple R-squared: 0.2325, Adjusted R-squared: 0.191
F-statistic: 5.604 on 10 and 185 DF, p-value: 2.688e-07
No hay mucha diferencia, pero es importante para ver el verdadero impacto de cada variable
| Esperanza_vida | Población | Urbano | P_agua_luz | Año_estud | P_alfabeta | P_asegurada | P_presu_usado | Nivel_pobreza | Indice_corr | Ing_fam | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Esperanza_vida | 1.00 | 0.12 | -0.04 | 0.24 | 0.30 | 0.32 | -0.25 | -0.16 | -0.34 | 0.21 | 0.43 |
| Población | 0.12 | 1.00 | 0.00 | 0.17 | 0.28 | 0.23 | -0.15 | 0.08 | -0.20 | 0.24 | 0.31 |
| Urbano | -0.04 | 0.00 | 1.00 | -0.05 | -0.11 | -0.07 | 0.13 | -0.04 | 0.13 | 0.07 | -0.05 |
| P_agua_luz | 0.24 | 0.17 | -0.05 | 1.00 | 0.28 | 0.31 | -0.06 | -0.17 | -0.33 | 0.11 | 0.34 |
| Año_estud | 0.30 | 0.28 | -0.11 | 0.28 | 1.00 | 0.85 | -0.62 | -0.06 | -0.82 | 0.48 | 0.82 |
| P_alfabeta | 0.32 | 0.23 | -0.07 | 0.31 | 0.85 | 1.00 | -0.68 | 0.00 | -0.79 | 0.37 | 0.76 |
| P_asegurada | -0.25 | -0.15 | 0.13 | -0.06 | -0.62 | -0.68 | 1.00 | 0.08 | 0.61 | -0.28 | -0.55 |
| P_presu_usado | -0.16 | 0.08 | -0.04 | -0.17 | -0.06 | 0.00 | 0.08 | 1.00 | 0.08 | 0.04 | -0.11 |
| Nivel_pobreza | -0.34 | -0.20 | 0.13 | -0.33 | -0.82 | -0.79 | 0.61 | 0.08 | 1.00 | -0.37 | -0.78 |
| Indice_corr | 0.21 | 0.24 | 0.07 | 0.11 | 0.48 | 0.37 | -0.28 | 0.04 | -0.37 | 1.00 | 0.41 |
| Ing_fam | 0.43 | 0.31 | -0.05 | 0.34 | 0.82 | 0.76 | -0.55 | -0.11 | -0.78 | 0.41 | 1.00 |
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data_filtrada)
Overall MSA = 0.85
MSA for each item =
Esperanza_vida Población Urbano P_agua_luz Año_estud
0.84 0.82 0.40 0.73 0.84
P_alfabeta P_asegurada P_presu_usado Nivel_pobreza Indice_corr
0.85 0.86 0.38 0.92 0.86
Ing_fam
0.90
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = dataKMO)
Overall MSA = 0.89
MSA for each item =
Esperanza_vida Población Año_estud P_alfabeta P_asegurada
0.83 0.87 0.84 0.88 0.93
Nivel_pobreza Indice_corr Ing_fam
0.92 0.90 0.89
Para que tenga significacia en el segundo cuadro solo están las variables que obtuvieron un valor mayor a 0.8
[1] FALSE
Singular
[1] FALSE
Parallel analysis suggests that the number of factors = 1 and the number of components = NA
Sugiere 1 división
| x | |
|---|---|
| Esperanza_vida | 0.403 |
| Población | 0.293 |
| Urbano | -0.098 |
| P_agua_luz | 0.338 |
| Año_estud | 0.932 |
| P_alfabeta | 0.893 |
| P_asegurada | -0.662 |
| P_presu_usado | -0.088 |
| Nivel_pobreza | -0.929 |
| Indice_corr | 0.450 |
| Ing_fam | 0.889 |
> Solo se trabaja con las variables que tengan un mayor impacto
Las variables no se consideran significativas para explicar la variable dependiente. En el análisis múltivariado se ve como solo dos del total de variables tienen significancia, esto puede indicar que existen otros factores que no han sido considerados en este trabajo que tienen mayor inportancia.
En la parte de ánalisis del modelo presentado se puede ver que el p-valor global es bajo (2.688e-07), pero indica significancia. Como bien se ha mencionado, solo un par de variables son las responsables de que el modelo tenga significancia, estas variables son: Años de estudio (Año_estud) e Ingreso familiar (Ing_fam).
La primera variable muestra una tendencia negativa. Esto es algo curioso debido a que se esperaría encontrar una relación positiva entre la cantidad de años de estudio y la esperanza de vida de una persona, y ayuda a pensar en otros factores que podrían estar afectando más la esperanza de vida que los años de educación.
La segunda variable tiene un coeficiente positivo. Esto confirma la idea de que a mayor ingreso familiar se espera una mayor esperanza de vida, lo cual es intuitivo, ya que mayores ingresos permiten mejor acceso a servicios de salud, alimentación y condiciones de vida.
Por parte de las variables no significativas que se esperaba cuenten con significancia están las siguientes: población, nivel de pobreza, corrupción, y acceso a agua y luz. Esto se puede atribuir a un mal uso de las variables o a una mala estructura dentro de los datos estadísticos. Una variable considerbale es la Población urbana (Urbano) ya que se esperaría que el hecho de vivir en zonas urbanas tendría un efecto positivo en la cantidad de años de esperanza de vida debido al alcance y facilidaddes que ello implica en la población, pero esta suposición no es perceptible en este caso.
…