Nota: Siempre priorizamos el formato de nuestros datos como xlsx para su directo consumo en PowerBi, pero ésto no es siempre posible ni lo más eficiente. A veces sólo podemos generar archivos txt. Al ser mucho más estables y pequeños, nuestro formato preferido es el rds, lo que no genera problemas, pues su transformación a txt o csv es trivial.


Parte I: Trabajo sobre los datos electorales (1989-hoy) y las encuestas Casen (2006-2017)


Parte I: Trabajo sobre los datos electorales (1989-hoy) y las encuestas Casen (2006-2017)

22-Febrero

  1. Iniciamos el análisis de la relación entre los ingresos, pobreza y educación en la Casen, con un interés en la movilidad intergeneracional de los ingresos (ver el análisis) . Se propone la construcción de un set de tablas considerando las preguntas que establecen los niveles educativos de las personas y la de sus padres.

  2. Continuamos el proceso de orden y unificación de los ingresos y gastos electorales de los candidatos (ir a las tablas para concejales) (ir a las tablas para diputados y senadores)

  3. Proponemos un análisis de regresión que vincule el resultado electoral con los montos gastados en las campañas, junto con variables económicas y sociales y publicamos un código sencillo con el que se realizó (ver el análisis) .

23-Febrero

  1. Se retoma el trabajo sobre la plataforma Shiny-elecciones integrando las tablas de gastos e ingresos construídas ayer (ir a Shiny-elecciones) .

  2. Se corrige un error en la tabla gastos e ingresos de las elecciones para presidentes (ir a las tablas)

  3. Se revisan las tablas unificadas de resultados electorales chilenos, corrigiéndose un error en la tabla unificada de la elección de senadores. (ir a las tablas de senadores) (ir a las tablas de alcaldes y concejales 2012-2016) (ir a las tablas de diputados)

24-Febrero

  1. Unificamos las tablas de gastos e ingresos para alcaldes. (ir a las tablas)

  2. Unificamos las tablas de gastos e ingresos de los partidos. Todo lo que no esté dentro de éstas tablas debe considerarse como de los candidatos. (ir a las tablas) Construímos un trozo de código útil para automatizar lecturas y creaciones de xlsx. (ir al código)

  3. Se revisan las ttcc de las categorías ocupacionales y rubros productivos de las empresas en las que las personas trabajan en relación al ingreso de las personas.

  4. Se retoman los análisis gráficos (boxplots y ACP) para aplicarlos al estudio de la relación entre educación, ingresos y pobreza (ir al análisis) .

Concluímos el análisis de las elecciones para Chile

25-Febrero

  1. Se revisan tablas de contingencia ya construídas de las categorías ocupacionales y rubros productivos de las empresas en las que las personas trabajan en relación a sus ingresos (ver índice de las tablas) (ir a las tablas…en construcción) .

  2. Estudiamos la correlación entre el estatus socioeconómico del padre, nivel educativo, tipo ocupación y nivel de ingresos con el estatus de sus hijos.

  3. Evaluamos la viabilidad de aplicar el índice de movilidad propuesto por Shorrocks (1978).

26-Febrero

Pobreza y vivienda: el programa Chile barrio.

Integramos las preguntas referidas a la participación en el programa Chile Barrio a ttcc vinculadas a la pobreza y la calidad de la vivienda, retomando un trabajo que quedó pendiente.



15-Febrero

Se revisan las tablas de contingencia generadas en torno a las 4 variables de ingreso fundamentales para comuna-sexo-alfabetismo-etnia, verificando su coincidencia con las desigualdades deducidas en un trabajo previo (ver el análisis) y se homologan las categorías de respuesta de los campos referidos al alfabetismo y etnia (ver el análisis) (ir a las tablas) . Llegamos a un resultado estadístico extraño: los promedios que se obtienen en las ttcc no responden exactamente a las desigualdades deducidas, pero creemos que es una anomalía estadística que no implica error, pues no pudimos encontrar el yerro.

Se diseña un índice para la construcción de tablas de contingencia y se comienzan a generar para el análisis de las categorías ocupacionales y rubros productivos de las empresas en las que las personas trabajan en relación a sus ingresos (ver índice de las tablas).


16-Febrero

Se generan ttcc sobre los promedios de los ingresos de las personas en las categorías: comuna-sexo-alfabetismo-migra, esto es, para la población inmigrante. Se construye una lógica para homologar las categorías de respuesta a la pregunta sobre el alfabetismo (ver análisis) (ir a las tablas) .

Generamos graficas de líneas de Ingresos por año sobre categorías agrupadas.


17-Febrero

Se construyen ttcc sobre los ingresos de las personas considerando a los jefes de hogar, en el conjunto de categorías: comuna-sexo-alfabetismo-jefe_de_hogar, tanto para las etnias, como para la población inmigrante, generando así 8 tablas en total. Se estudia la relación: jefe de hogar’sexo’pobreza. Se contrasta el resultado con la evidencia empírica que sostiene una “feminización de la pobreza” y se señala la dificultad de identificar con precisión el criterio para definir a una persona como jefe de hogar. Se afirma que la proporción de mujeres jefas de hogar es mucho más alta que las oficialmente declaradas (ver análisis) (ir a las tablas de etnias) (ir a las tablas de poblacion inmigrante)

Evaluamos la necesidad de incorporar el coeficiente de Gini para las categorías con las que generamos las tablas de contingencia. Éstas categorías generan clusters muy homogéneos entre sí, por lo que la teoría nos hace pensar que los coeficientes de Gini son muy bajos y heterogéneos entre ellas.


18-Febrero

Se unifican tablas de resultados electorales de las elecciones a Alcaldes y concejales del 2012 recibidas hoy (ir a las tablas) .

Se unifican las últimas la tablas de elecciones de (ver documento de referencia relativo a las elecciones presidenciales) (ver código padre utilizado para la manipulación de las tablas de los resultados electorales) de Alcaldes y Concejales y se determina la pertinencia de una nueva id identificatoria de los registros para ambos.

Se revisa la correcta unificación de las tablas de elecciones de diputados (dipu_tot_dist_h.rds) (ir a la tabla), presidentes (presidentes_unidos.rds), (ir a la tabla) y senadores (senadores.rds) (ir a la tabla)

Se evalúa la necesidad de construir una id única para la tabla unificada para las elecciones de diputados (ver análisis). Y sí, fue necesario.

Comenzamos el diseño de la base de datos general que contenga tablas padres y las generadas por medio de tablas de contingencia.


19-Febrero

Unificamos las tablas de ingresos y gastos electorales para las elecciones de presidentes (ir a las tablas) y los demás cargos.

Comenzamos la construcción de tablas de contingencia para la VIVIENDA sobre las cuatro variables fundamentales de la calidad de la vivienda:

  1. indice de allegamiento
  2. indice de materialidad
  3. indice de hacinamiento
  4. estado del sitio

No tiene sentido hacer la relación con los promedios de ingreso, la correlación es evidente, por lo que construiremos 4 tablas con el grupo de categorías: comuna-sexo-alfabetismo-etnia-variable_de_la_calidad_de_la_vivienda, y otra 4 con el grupo: comuna-sexo-alfabetismo-migra-variable_de_la_calidad_de_la_vivienda. (pendiente)

Continuamos la construcción de la base de datos general.