El concepto de calidad de vida proviene de la rama de la sociología, que se ha adoptado en la política, que se entiende como el nivel de ingresos y las comodidades de una persona, familia o sociedad. La calidad de vida se puede medir y analizar por medio de una serie de datos estadísticos que permiten dar conclusiones de la forma de vida de los hogares.
Si se quiere recoger información con el motivo de dar una visualización de cómo está la calidad de vida, se realiza una encuesta con el fin de recoger información sobre aspectos objetivos y medibles. Los resultados que arroje la información recopilada en estas encuestas de calidad de vida, sirven como base para tomar decisiones sobre las condiciones de vida de los hogares, y así mismo desde una visión política y económica de como aumentar la calidad de vida de las personas.
Desde la perspectiva sociológica es un análisis un poco más complejo, dado que las encuestas de calidad de vida dan una visualización de cómo viven las personas en una sociedad, pero en muchas ocasiones las personas tienen condiciones de calidad de vida con indicadores altos y ser una familia infeliz Los interés políticos y económicos de una sociedad se centran en la información que les ayude a los ciudadanos a tener unas condiciones de vida más óptimos, analizando los datos obtenidos como estudio, salud, recreación, entre otros.
En el análisis de los datos es esencial saber que variables se van a medir para la encuesta de calidad de vida, establecer unas circunstancias que posiblemente sirva para validar si un hogar goza de buena o mala calidad de vida. Acceso a la educación generalizada por la población, acceso a un sistema sanitario para afrontar problemas de salud, nivel de seguridad para no sentirse amenazado, acceso a los servicios básicos, libertad.
Está dirigido a los miembros del DANE, que en sus trabajos reciben información con datos faltantes con respecto a los departamentos de donde provienen los registros y por medio de esta aplicación a partir de otra información de los registros se pueden acceder a estos datos faltantes.
Esta encuesta está conformada por diferentes ámbitos que sean medibles para poder ver la calidad de vida de los hogares colombianos. Las temáticas más importantes son: tipo de vivienda y las características, servicios del hogar, variables demográficas, salud, cuidado de la infancia, educación, trabajo infantil, condiciones de vida del hogar, tecnología e información.
La realización de esta encuesta se realiza en diez grandes dominios en el territorio nacional que son: Bogotá, Antioquia, valle del cauca, región caribe, región pacifica, región oriental, región central, san Andrés, buenaventura, Orinoquia-amazonia.
Los datos son descargados de la página del DANE. Según el enfoque al que está dirigido el objetivo se tomaron dos componentes principales de la encuesta que son los datos de la vivienda y la composición del hogar, con un total de 65 y 37 variables respectivamente, por medio de estos dos componentes se hace el análisis de las variables que nos van a aportar más por medio de la selección con la función regsubsets de la librería leaps. Se seleccionan las variables: sexo, edad, parentesco con el jefe de hogar, vive con cónyuge, estado civil, años viviendo en este municipio, padre vive en el hogar, nivel educativo padre, madre vive en hogar, nivel educativo madre, etnia, departamento, numero hogar.
Luego de elegir las variables se van a mirar los datos faltantes.
En la variable años viviendo en el municipio por la cantidad de datos faltantes se decide sacarla para poder ajustar el modelo. Las demás variables que tengan N/A, se va a reemplazar por “sin registro”.
## Warning: package 'ggplot2' was built under R version 3.4.3
##
## hombre mujer
## 36139 38210
Se observa que la cantidad de encuestados son 74349 personas de las cuales el 51.3% son mujeres.
La mayor cantidad de encuestados tanto para hombres como mujeres son menores de 50 años con una mayor concentración en la edad de los 26 años, en los dos sexos existen un dato atípico de personas mayores de 100 años.
En mayor cantidad de los encuestados las personas eran hijos del jefe cabeza de hogar, la segunda persona que más participo en las encuestas era el encargado del hogar, la menor cantidad de encuestados que respondieron eran los empleados domésticos del hogar.
Las personas solteras fueron los que más participaron en la encuesta de calidad de vida representando el 32.1% de la población participante, seguido por los casados, algo que toca resaltar es que la cantidad de datos faltantes siempre es significativo lo que puede producir un sesgo en las muestras.
##
## fallecido no si
## 23320 31879 19150
##
## fallecido no si
## 16381 27213 30755
Acá se puede ver un factor social en el cual se representa la falta de alguno de los padres en los hogares colombianos, por un lado, se ve que el padre es más ausente en las viviendas que la madres. un caso muy resaltante es que la cantidad de padres fallecidos es mucho mayor que los presentes en el hogar de los encuestados.
Vemos que, aunque la cantidad de datos faltantes tanto para padres como para madres es muy alta no se desprecia ya que este es un factor fundamental para la especificación de la composición de los hogares colombianos y de las condiciones de vida de la población. un factor preocupante es que la mayor cantidad de personas ni siquiera acabaron su nivel académico de primaria. Pero los padres presentan unos índices más altos en avances académicos como étnicos y profesionales a comparación de las madres.
Se observa que la mayor cantidad de la población a encuestar no se consideran de ningún tipo de etnia. los negros son la segunda población que más respondió la encuesta pero siguen siendo números muy inferiores con los de la gente de ninguna raza.
La mayor cantidad de gente encuestada está en el valle del cauca, representando el 19.33% de la población, seguido por Antioquia y Bogotá. La menor cantidad de gente se encuentra en el putumayo y en la amazonia que no representan ni el 4% de la muestra de la encuesta.
Modelo
Se uso un modelo lineal generalizado, donde su variable respuesta proviene de la familia multinomial, esto debido a que el problema planteaba la variable respuesta como el departamento de residencia, la cual contaba con diferentes categorías. Se obtuvieron las variables regresoras a partir de la función regsubset de la librería leaps, esto con el fin de conocer cuales aportaban a la construcción del modelo con la variable respuesta definida.