Casen: centralización de los análisis
Abstract
Éste artículo corresponde a un índice con las direcciones a todas las investigaciones que DataIntelligence ha realizado sobre la Casen, incluyendo códigos para obtener información, tablas descriptivas de variables a lo largo de sus 6 versiones entre el 2006 y el 2017, gráficos, breves análisis estadísticos y una revisión de algunas técnicas de Machine Learning que le serán aplicadas a futuro.
1 Machine Learning: Clasificacion
Se exponen una serie de algoritmos de ML para ser aplicados a la Casen. Son de particular interés los métodos de Bosques aleatorios, Máquinas de soporte vectorial y Redes neuronales.
Se revisan algunos conceptos sobre el ingreso, las variables que lo miden, el procedimiento de cálculo de promedios sobre frecuencias y su revisión y un pequeño análisis de regresión de un ingreso sobre la probabilidad de ser pobre.
Calcularemos nuestro propio porcentaje de pobreza para Chile el 2015 y veremos que un resultado difiere en dos décimas de los resultados oficiales y el otro en una. Revisaremos una definición conceptual de qué es la pobreza y cómo intenta medirla la Casen en sus seis versiones desde el 2006, concluyendo con gráficos que relacionan algunas variables relevantes con el decil de ingreso autónomo.
4 Análisis de la vivienda -en preparación-
Se examina la situación de tenencia de los sitios y de las viviendas en las que habitan los hogares de la RMS. También los indicadores relacionados con la materialidad, estado de conservación, acceso a servicios básicos y calidad global de las viviendas, distinguiendo -en cada caso- por quintil de ingreso autónomo regional.
5 Código para calcular promedios dentro de tablas de contingencia
El código de éste trabajo fue construído para que la generación de promedios comunales sobre tablas de contingencia de las Casen corregidas sea un acto trivial.
6 Código para generar tablas de contingencia
El código de éste trabajo fue construído para que la generación de tablas de contingencia sobre las Casen corregidas sea un acto trivial.
Se realizan ejercicios para corroborar que los datos que obtenemos sean los mismos de la información oficial. Necesitamos que nuestras estimaciones de pobreza obtenidas con cálculos propios desde la Casen coincidan con la información ya publicada.
Se construyen algunas tablas de contingencia y se les da formato gráfico para realizar análisis sociales.
En éste documento comenzamos un despliegue masivo de gráficos a modo exploratorio y descriptivo, por lo que se priorizó la cantidad que el análisis.
Se hace revisión a las variables más importantes de la Casen y se despliegan sus nombres y categorías de respuesta por año.