Planteamiento del problema

El nivel de satisfacción de vida ha estado relacionado con factores de salud, económicos, de relaciones personales, educativos y de uso del tiempo libre. Generalmente esta satisfacción suele ser medida utilizando la escala desarrollada en 1995 por Larsen, Emmons, Diener y Griffin. En esta escala los individuos responden a cinco preguntas relacionadas al bienestar con un puntaje del uno al siete. Una vez completada la encuesta, se suman todas las respuestas y se clasifica al individuo según el puntaje obtenido. [1]

No siempre se tiene información de test como el de Larsen, Emmons, Diener y Griffin para responder a la pregunta sobre la satisfacción de vida. Además, se sabe que la satisfacción de vida puede variar para personas con diferentes edades [2] y según la calidad de la salud y estilos de vida de una persona [3], por lo que acudir a otros métodos para intentar dar una correcta clasificación del nivel de satisfacción de vida de niños, adultos y personas mayores, es una opción interesante.

Es por estos motivos que, en la búsqueda de métodos alternativos para aproximarse al problema de la clasificación de la satisfacción de vida, se explora el desarrollo de modelos de inteligencia artificial que, con información suministrada por miles de personas acerca de sus condiciones socioeconómicas y su nivel de satisfacción vital, permitan predecir la satisfacción de vida de nuevos individuos que brinden respuestas básicas similares a les dé un censo nacional.

Datos

Se utilizará información de la Encuesta Nacional de Calidad de Vida - ECV de Colombia para el año 2020 [4], en la que se encuentran detalles de viviendas, servicios públicos, bienes del hogar, educación, salud y otras características socioeconómicas.

Como el nivel de satisfacción de vida puede variar para diferentes edades, se crearán dos subgrupos. Uno de ellos contendrá a los niños, que se definen como aquellas personas que tengan una edad menor o igual a doce años cumplidos. El otro será el de los abuelos, que en nuestro caso corresponde al de personas mayores de 60 años o abuelos. Estas clasificaciones se hacen basándose en la ley Colombiana.

Resultados

Como se observa en la Figura 1, las respuestas otorgadas para la satisfacción de vida no son dadas por los niños, por lo que se debe averiguar cuál es su nivel de satisfacción con la vida. Para esto, se calcula el promedio de las respuestas de las personas que comparten la vivienda con el niño y se le asigna este valor.


FIGURA 1
Categoria de edades y respuestas de satisfacción de vida


Tanto para abuelos como para niños se construyeron nueve modelos, tres de K-Vecinos más cercanos, tres de regresión lineal y tres de árboles de decisión. Estos modelos fueron entrenados con diferentes características o variables para observar cual de todos era el modelo más óptimo para ser utilizado. Las características utilizadas para entrenar los modelos se pueden ver en la Tabla 1. Algunas características utilizadas como la calidad del sector, el estado de salud, los ingresos, el sexo y si actualmente la persona trabaja o no, han sido utilizadas en otros estudios para predicción de la satisfación de vida, por lo que se decidieron incluir en las caracteristicas de interes [5],[6].Algunas variables del conjunto de datos como satisfacción laboral, satisfacción de salud y satisfacción de seguridad, no se decidieron incluir como caracteristicas predictoras puesto que se pretende predecir la satisfacción de vida con variables socioeconomicas.


TABLA 1
Variables utilizadas en los modelos predictivos


Para los abuelos, se construyeron los nueve modelos iterando sobre las siguientes características:

Caracteristicas uno abuelos: (V1,V2,V3,V4,V5,V6,V7)
Características dos abuelos: (V1,V2,V3,V4,V5,V6,V7,V8,V9,10)
Características tres abuelos: (V1,V2,V3,V4,V5,V6,V7,V8,V9,V10,V11,V12)

Es decir, se entrenó un modelo de K vecinos más cercanos, uno de regresión lineal y uno de árboles de decisión con las características uno. Luego se entrenaron otros tres con las características dos y por último otros tres modelos con las características tres. De igual manera, se entrenaron los modelos para los niños con las siguientes características:

Caracteristicas uno niños: (V1,V2,V3,V4,V5)
Características dos niños: (V1,V2,V3,V4,V5,V8,V15,V16)
Características tres niños: (V1,V2,V3,V4,V5,V8,V12,V13,V14,V15,V16)

Los mejores modelos, según su MSE, para cada grupo de características y para abuelos y niños se presentan en las Tablas 2 y 3 respectivamente.


TABLA 2
Mejores modelos por conjunto de caracteristicas para abuelos



TABLA 3
Mejores modelos por conjunto de caracteristicas para niños


De la Tabla 2 se observa que hay un empate entre el modelo 2 y el modelo 3 en cuanto a errores de MSE se refiere. Debido a que ambos son modelos de regresión lineal y el modelo 2 requiere menos características para obtener los mismos resultados, se decide tomar el modelo 2 como el mejor para los abuelos. De igual manera sucede con los niños, en donde hay un empate entre el modelo 2 y el modelo 3, pero se elige el modelo 2 como el mejor debido a que utiliza un menor número de características para obtener los mismos resultados.

Los modelos seleccionados sirven para predecir el nivel de satisfacción con un MSE de 2.34 y 2.56 para abuelos y niños respectivamente. Estos errores corresponden al MSE en testeo, es decir, en datos no vistos por el modelo en su fase de entrenamiento, por lo que se puede decir que en promedio, los modelos tienden a predecir la satisfacción de vida para un individuo de nunca antes visto de una manera adecuada y con un rango no tan elevado de error.

Conclusiones y recomendaciones

Referencias

[1] E. Diener, R. Emmons, R. Larsen, and S. Griffin, “The satisfaction with life scale,” ResearchGate. [Online]. Available: https://www.researchgate.net/publication/7404119_The_Satisfaction_With_Life_Scale. [Accessed: 01-May-2022].

[2] B. M. Baird, R. E. Lucas, and M. B. Donnellan, “Life satisfaction across the lifespan: Findings from two Nationally Representative Panel Studies,” Social indicators research, Nov-2010. [Online]. Available: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2990956/#:~:text=Among%20all%20cohorts%20examined%2C%20the,decline%20slightly%20until%20late%20life. [Accessed: 01-May-2022].

[3] N. Grant, J. Wardle, and A. Steptoe, “The relationship between Life Satisfaction and Health Behavior: A cross-cultural analysis of young adults,” International journal of behavioral medicine. [Online]. Available: https://pubmed.ncbi.nlm.nih.gov/19319695/. [Accessed: 01-May-2022].

[4] Fuente: Departamento Administrativo Nacional de Estadística: www.dane.gov.co

[5] M. Kaiser, S. Otterbach, and A. Sousa-Poza, “Using machine learning to uncover the relation between age and life satisfaction,” Nature News, 28-Mar-2022. [Online]. Available: https://www.nature.com/articles/s41598-022-09018-x. [Accessed: 01-May-2022].

[6] M. Kaur, M. Dhalaria, P. K. Sharma, and J. H. Park, “Supervised machine-learning predictive analytics for national quality of life scoring,” MDPI, 18-Apr-2019. [Online]. Available: https://www.mdpi.com/2076-3417/9/8/1613. [Accessed: 01-May-2022].