INTRODUCCIÓN
El Índice de desarrollo humano es un indicador, elaborado por el Programa de las Naciones Unidas para el Desarrollo, que se utiliza para clasificar a los países en cuatro niveles de desarrollo humano. El índice está compuesto por la esperanza de vida, la educación e indicadores de ingreso per cápita.
El Índice de Progreso Social (IPS) nace para satisfacer la necesidad de una medida integral de la calidad de vida de lapoblación. El Índice de Progreso Social tiene una escala de 0 a 100 puntos; en la que a mayor puntaje mayor Progreso Social. El puntaje es calculado para cada estado a través del promedio simple de las tres dimensiones (Necesidades Humanas Básicas, Fundamentos de Bienestar y Oportunidades).
Necesidades Humanas básicas:
- NUTRICIÓN Y CUIDADOS MÉDICOS
Define si las personas tienen sufcientes alimentos y acceso a cuidados médicos básicos, tomando en cuenta indicadores de mortalidad y alimentación.
- AGUA Y SANEAMIENTO
Define si las personas pueden beber agua y mantenerse limpias sin enfermarse, tomando en cuenta indicadores de servicio sanitario y servicios de agua.
- VIVIENDA
Considera si la población tiene viviendas adecuadas con servicios básicos como energía eléctrica y construidas con materiales robustos.
- SEGURIDAD PERSONAL
Usa indicadores mostrando el nivel y la percepción de crimen en cada estado para evaluar si sus habitantes se pueden sentir seguros.
Fundamentos del bienestar
- ACCESO A CONOCIMIENTOS BÁSICOS
Evalúa matriculación en educación básica, así como paridad de género en las escuelas, y defne si las personas tienen bases educativas para mejorar sus vidas.
- ACCESO A INFORMACIÓN Y COMUNICACIONES
Define si las personas tienen acceso libre a ideas e información de cualquier parte del mundo, tomando en cuenta indicadores de telefonía, internet y más.
- SALUD Y BIENESTAR
Define si las personas viven vidas largas y saludables, usando esperanza de vida, tasas de suicidios y otras variables de salud.
- CALIDAD MEDIOAMBIENTAL
Evalúa si el estado está usando sus recursos de manera sustentable, tomando en cuenta variables de estrés hídrico, deforestación y otras.
Oportunidades
- DERECHOS PERSONALES
Evalúa si las personas viven libres de restricciones y con derechos, usando variables de participación ciudadana y propiedad.
- LIBERTAD PERSONAL Y DE ELECCIÓN
Considera si las personas son libres para tomar sus decisiones sin restricciones, tomando en cuenta diversos indicadores.
- INCLUSIÓN
Define si hay personas excluidas de la sociedad por diversos motivos como orientación sexual, raza o sexo.
- ACCESO A EDUCACIÓN SUPERIOR
Usa indicadores de cobertura y calidad de la educación superior para evaluar las oportunidades de la población para alcanzar altos niveles de educación.
OBJETIVO
Se pretende genear un modelo que permita conocer el IDH de los estados de México en el año 2020, analizando variables de índice de Progeso Social (IPS) y PIB per cápita.
TEORÍA
REGRESION LINEAL MULTIPLE
La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y ) se determina a partir de un conjunto de variables independientes llamadas predictores (X1 , X2 , X3 …). Es una extensión de la regresión lineal simple, por lo que es fundamental comprender esta última. Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe que analizar con cautela para no malinterpretar causa-efecto).
Los modelos lineales múltiples siguen la siguiente ecuación:
\[ Y_{i}=(\beta_{0}+\beta_{1}X_{1i}+\beta_{2}X_{2i}+\cdots+\beta_{n}X_{ni})+e_{i} \]
β0 es la ordenada en el origen, el valor de la variable dependiente Y cuando todos los predictores son cero.
βi : es el efecto promedio que tiene el incremento en una unidad de la variable predictora Xi sobre la variable dependiente Y , manteniéndose constantes el resto de variables. Se conocen como coeficientes parciales de regresión.
ei: es el residuo o error, la diferencia entre el valor observado y el estimado por el modelo.
Es importante tener en cuenta que la magnitud de cada coeficiente parcial de regresión depende de las unidades en las que se mida la variable predictora a la que corresponde, por lo que su magnitud no está asociada con la importancia de cada predictor. Para poder determinar qué impacto tienen en el modelo cada una de las variables, se emplean los coeficientes parciales estandarizados, que se obtienen al estandarizar (sustraer la media y dividir entre la desviación estándar) las variables predictoras previo ajuste del modelo.
Condiciones para la regresion lineal multiple
En si, mismas condiciones que los modelos lineales simples, mas algunas adicionales
ANÁLISIS
IMPORTAR DATOS Y PAQUETES
library(pacman)
p_load("MASS", "ggplot2","readr", "prettydoc")
datos <- read_csv("IPS2.csv", col_types = cols(PIB = col_number(),
Nutricion.y.Cuidados.Medicos.Basicos = col_number(),
Agua.y.Saneamiento = col_number(), Vivienda = col_number(),
Seguridad.Personal = col_number(), Acceso.a.Conocimientos.Basicos = col_number(),
Acceso.a.Informacion.y.Comunicaciones = col_number(),
Salud.y.Bienestar = col_number(), Calidad.Medioambiental = col_number(),
Derechos.Personales = col_number(), Libertas.Personal.y.de.Eleccion = col_number(),
Inclusion = col_number(), Acceso.a.Educacion.Superior = col_number()))EXPLORAR RELACIÓN ENTRE LAS VARIABLES
- Matriz de Coeficientes de correlacion
round( cor( x = datos, method = "pearson"), 3)## Nutricion.y.Cuidados.Medicos.Basicos
## Nutricion.y.Cuidados.Medicos.Basicos 1.000
## Agua.y.Saneamiento 0.579
## Vivienda 0.759
## Seguridad.Personal -0.128
## Acceso.a.Conocimientos.Basicos 0.391
## Acceso.a.Informacion.y.Comunicaciones 0.604
## Salud.y.Bienestar 0.058
## Calidad.Medioambiental -0.472
## Derechos.Personales -0.175
## Libertas.Personal.y.de.Eleccion 0.578
## Inclusion -0.015
## Acceso.a.Educacion.Superior 0.495
## PIB 0.197
## Agua.y.Saneamiento Vivienda
## Nutricion.y.Cuidados.Medicos.Basicos 0.579 0.759
## Agua.y.Saneamiento 1.000 0.760
## Vivienda 0.760 1.000
## Seguridad.Personal -0.317 -0.340
## Acceso.a.Conocimientos.Basicos 0.280 0.506
## Acceso.a.Informacion.y.Comunicaciones 0.844 0.765
## Salud.y.Bienestar -0.324 -0.121
## Calidad.Medioambiental -0.180 -0.556
## Derechos.Personales 0.117 0.009
## Libertas.Personal.y.de.Eleccion 0.770 0.619
## Inclusion -0.118 -0.052
## Acceso.a.Educacion.Superior 0.727 0.619
## PIB 0.440 0.256
## Seguridad.Personal
## Nutricion.y.Cuidados.Medicos.Basicos -0.128
## Agua.y.Saneamiento -0.317
## Vivienda -0.340
## Seguridad.Personal 1.000
## Acceso.a.Conocimientos.Basicos -0.446
## Acceso.a.Informacion.y.Comunicaciones -0.444
## Salud.y.Bienestar -0.033
## Calidad.Medioambiental 0.344
## Derechos.Personales 0.244
## Libertas.Personal.y.de.Eleccion -0.423
## Inclusion -0.188
## Acceso.a.Educacion.Superior -0.292
## PIB -0.160
## Acceso.a.Conocimientos.Basicos
## Nutricion.y.Cuidados.Medicos.Basicos 0.391
## Agua.y.Saneamiento 0.280
## Vivienda 0.506
## Seguridad.Personal -0.446
## Acceso.a.Conocimientos.Basicos 1.000
## Acceso.a.Informacion.y.Comunicaciones 0.424
## Salud.y.Bienestar -0.220
## Calidad.Medioambiental -0.467
## Derechos.Personales -0.246
## Libertas.Personal.y.de.Eleccion 0.263
## Inclusion -0.089
## Acceso.a.Educacion.Superior 0.594
## PIB 0.220
## Acceso.a.Informacion.y.Comunicaciones
## Nutricion.y.Cuidados.Medicos.Basicos 0.604
## Agua.y.Saneamiento 0.844
## Vivienda 0.765
## Seguridad.Personal -0.444
## Acceso.a.Conocimientos.Basicos 0.424
## Acceso.a.Informacion.y.Comunicaciones 1.000
## Salud.y.Bienestar -0.235
## Calidad.Medioambiental -0.351
## Derechos.Personales -0.128
## Libertas.Personal.y.de.Eleccion 0.793
## Inclusion 0.137
## Acceso.a.Educacion.Superior 0.828
## PIB 0.525
## Salud.y.Bienestar Calidad.Medioambiental
## Nutricion.y.Cuidados.Medicos.Basicos 0.058 -0.472
## Agua.y.Saneamiento -0.324 -0.180
## Vivienda -0.121 -0.556
## Seguridad.Personal -0.033 0.344
## Acceso.a.Conocimientos.Basicos -0.220 -0.467
## Acceso.a.Informacion.y.Comunicaciones -0.235 -0.351
## Salud.y.Bienestar 1.000 -0.113
## Calidad.Medioambiental -0.113 1.000
## Derechos.Personales -0.143 0.097
## Libertas.Personal.y.de.Eleccion -0.166 -0.260
## Inclusion 0.207 0.079
## Acceso.a.Educacion.Superior -0.508 -0.279
## PIB -0.379 0.084
## Derechos.Personales
## Nutricion.y.Cuidados.Medicos.Basicos -0.175
## Agua.y.Saneamiento 0.117
## Vivienda 0.009
## Seguridad.Personal 0.244
## Acceso.a.Conocimientos.Basicos -0.246
## Acceso.a.Informacion.y.Comunicaciones -0.128
## Salud.y.Bienestar -0.143
## Calidad.Medioambiental 0.097
## Derechos.Personales 1.000
## Libertas.Personal.y.de.Eleccion -0.177
## Inclusion -0.034
## Acceso.a.Educacion.Superior 0.007
## PIB 0.061
## Libertas.Personal.y.de.Eleccion Inclusion
## Nutricion.y.Cuidados.Medicos.Basicos 0.578 -0.015
## Agua.y.Saneamiento 0.770 -0.118
## Vivienda 0.619 -0.052
## Seguridad.Personal -0.423 -0.188
## Acceso.a.Conocimientos.Basicos 0.263 -0.089
## Acceso.a.Informacion.y.Comunicaciones 0.793 0.137
## Salud.y.Bienestar -0.166 0.207
## Calidad.Medioambiental -0.260 0.079
## Derechos.Personales -0.177 -0.034
## Libertas.Personal.y.de.Eleccion 1.000 0.179
## Inclusion 0.179 1.000
## Acceso.a.Educacion.Superior 0.671 0.064
## PIB 0.446 0.153
## Acceso.a.Educacion.Superior PIB
## Nutricion.y.Cuidados.Medicos.Basicos 0.495 0.197
## Agua.y.Saneamiento 0.727 0.440
## Vivienda 0.619 0.256
## Seguridad.Personal -0.292 -0.160
## Acceso.a.Conocimientos.Basicos 0.594 0.220
## Acceso.a.Informacion.y.Comunicaciones 0.828 0.525
## Salud.y.Bienestar -0.508 -0.379
## Calidad.Medioambiental -0.279 0.084
## Derechos.Personales 0.007 0.061
## Libertas.Personal.y.de.Eleccion 0.671 0.446
## Inclusion 0.064 0.153
## Acceso.a.Educacion.Superior 1.000 0.687
## PIB 0.687 1.000
Una vez calculado el coeficiente de correlación de cada una de las variables, podemos concluir lo siguiente para las variables más importantes:
La variable de nutrición y cuidados medicos básicos tiene una alta correlación con vivienda, acceso a información y comunicación, agua y saneamiento, libertad personal y de elección y acceso a educación superior; esto tiene sentido, debido a que esta variable tienen dependencia o relación, al decir que las personas que tienen acceso a estas áreas de oportunidad como la vivienda, educación y otras, se pudiese pensar que tienen una mejor calidad de vida. Más sin embargo, esta variable tiene una baja correlación con el PIB y salud y bienestar, lo que puede caudar algo de ruido, dado a que estas dos variables pudiesen ser fundamentales para tener una buena calidad de vida. Además, tmabién encontramos una correlación negativa con seguridad personal, calidad medioambiental, derechos personales e inclusión; lo que de igual manera algunas de estas definitivamente no tendrían relación con nuestra variable.
Para la variable de Agua y saneamiento existe una alta correlación con la mayoria de las variables, exceptuando la correlación negativa que existe con seguridad personal e inclusión, que tendría sentido dado a que estas variables no tienen relación con el saneamiento más bien es algo social, sin embargo también se puede encontrar una correlación negativa con calidad medioambiental y salud y bienestar, lo que de igual manera genera ruido, ya que el saneamiento si tuviese relación con estas dos variables.
Para vivienda se muestra una muy alta correlación con nutrición, saneamiento, acceso a conocimientos básicos, acceso a información, educación y PIB; todas estas variables nos muestran que las personas que tienen acceso a una vivienda de igual manera les da la oportunidad a tener acceso a una buena educación, a información y una buena calidad de vida, lo que conlleva obviamente tendría que haber una relación con PIB.
Salud y bienestar solamente tiene una correlación positiva con dos variables que son nutrición e inclusión, con esto podemos notar que esta variable no tiene relación alguna con ninguna otra. Sin emabrgo, con las dos mencionadas podemos ver una relación muy baja.
Para Acceso a Educación Superior sus más altas variables correlacionadas son Acceso a información, lo que totalmemte tienen un sentido lógico, también con PIB, acceso a conocimeintos básicos, libertades de elección, vivienda y saneamiento; con todo lo anterior, podemos concluir que el sentido lógico de esto es más que evidente, dado a que al tener una educación tendría senido a tener acceso a información y así poder ser personas con una buen nivel de conocimiento, lo que conllevaría a elevar el PIB o bien al tener un alto PIB, conlleva a tener un amplio acceso a más servicios de calidad. Dado a esto, es la razón por la que el PIB tiene solamente una correlación negativa con Seguridad y Bienestar.
- Distribucion de los datos
library(psych)##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
multi.hist(x = datos, dcol = c("blue", "red"), dlty = c("dotted", "solid"),main = "")Analizando las gráficas solamente 4 de las 13 de ellas tienen un comportamiento irregular, lo que es altamente favorable, ya que nos permite un mejor análisis promedios de los datos.
- Ahora exploremos este mismo analisis usando GGally
library(GGally)
ggpairs(datos, lower = list(continuous = "smooth"),
diag = list(continuous = "barDiag"), axisLabels = "none")GENERAR EL MODELO
Ahora una vez que entendemos la forma en la cual se relacionan las variables, podemos empezar a experimentar con la generacion del modelo
modelo <- lm(PIB ~ Nutricion.y.Cuidados.Medicos.Basicos + Agua.y.Saneamiento + Vivienda + Seguridad.Personal + Acceso.a.Conocimientos.Basicos + Salud.y.Bienestar + Calidad.Medioambiental + Derechos.Personales + Libertas.Personal.y.de.Eleccion + Inclusion + Acceso.a.Educacion.Superior , data = datos )
summary(modelo)##
## Call:
## lm(formula = PIB ~ Nutricion.y.Cuidados.Medicos.Basicos + Agua.y.Saneamiento +
## Vivienda + Seguridad.Personal + Acceso.a.Conocimientos.Basicos +
## Salud.y.Bienestar + Calidad.Medioambiental + Derechos.Personales +
## Libertas.Personal.y.de.Eleccion + Inclusion + Acceso.a.Educacion.Superior,
## data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -115270 -36986 498 25781 241700
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -312997.4 1047323.3 -0.299 0.76813
## Nutricion.y.Cuidados.Medicos.Basicos 1939.2 12012.6 0.161 0.87337
## Agua.y.Saneamiento -4552.0 3839.2 -1.186 0.24965
## Vivienda 1146.2 2915.2 0.393 0.69835
## Seguridad.Personal -1735.9 1767.6 -0.982 0.33781
## Acceso.a.Conocimientos.Basicos -6239.7 4485.9 -1.391 0.17952
## Salud.y.Bienestar 2441.8 5994.6 0.407 0.68810
## Calidad.Medioambiental 5214.3 3162.4 1.649 0.11480
## Derechos.Personales 1007.3 2766.3 0.364 0.71959
## Libertas.Personal.y.de.Eleccion 838.6 4359.1 0.192 0.84939
## Inclusion -1519.0 2869.6 -0.529 0.60241
## Acceso.a.Educacion.Superior 12777.8 3613.1 3.537 0.00207 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 80040 on 20 degrees of freedom
## Multiple R-squared: 0.6181, Adjusted R-squared: 0.408
## F-statistic: 2.942 on 11 and 20 DF, p-value: 0.01742