Descripción

Un aspecto importante que deben tomar en cuenta los gobiernos de turno para la toma de decisiones en materia de política económica y social, es el relacionado a la información de condiciones de vida de los hogares. Estudios estadísticos de este tipo de información permiten obtener índices y descripciones sobre múltiples aspectos que ayudarían a determinar el bienestar de la población. En este sentido, se selecciona una base de datos proveniente de las Bases de Datos Abiertos de la página web del INEC del año 2014, mismo que trata información sobre las condiciones de vida de los hogares ecuatorianos.
De esta base de datos, se selecciona una nueva población determinada por hogares que cuentan con servicios básicos proporcionados por sus municipalidades y de los que se cuente con información sobre los rubros que pagan por este tipo de servicios, así, se excluye viviendas con situaciones económicas extremas y similares.


Objetivos


Análisis Descriptivo

Como se explicó en la descripción, delimitaremos la población al grupo de interés para nuestro estudio. El código para seleccionar esta población se encuentra en ANEXOS1.

Trataremos la base y la organizaremos como una lista que contará con \(3\) entradas, en cada una de éstas entradas están repartidas \(23\) variables de interés, seleccionadas de la base de datos, que nos ayudarán a resolver el objetivo planteado. Así, las entradas en las que agruparemos las características son Vivienda, Servicios y Ambiente, obteniendo la siguiente base:

## List of 3
##  $ Vivienda :'data.frame':   4219 obs. of  10 variables:
##   ..$ Acceso       : Factor w/ 6 levels "Otro, cual","Río / Mar / Lago",..: 4 4 4 4 4 4 4 3 4 4 ...
##   ..$ Techo        : Factor w/ 3 levels "Malo","Regular",..: 2 3 3 3 3 3 3 3 2 2 ...
##   ..$ Paredes      : Factor w/ 3 levels "Malo","Regular",..: 2 3 3 3 3 3 3 3 2 2 ...
##   ..$ Piso         : Factor w/ 3 levels "Malo","Regular",..: 2 3 3 3 3 2 3 3 2 2 ...
##   ..$ Tipo_vivienda: Factor w/ 7 levels "Covacha","Choza",..: 7 7 7 7 7 7 7 7 7 7 ...
##   ..$ Cuartos      : num [1:4219] 4 4 4 5 4 4 5 4 4 3 ...
##   ..$ Habitaciones : num [1:4219] 3 3 3 3 3 3 2 3 3 2 ...
##   ..$ Sitio_cocina : Factor w/ 4 levels "En patio, corredor u otro sitio",..: 4 4 4 4 4 3 4 4 4 3 ...
##   ..$ Uso_cocina   : Factor w/ 2 levels "Compartido con otros hogares",..: 2 2 2 2 2 2 2 2 2 2 ...
##   ..$ Cocina_con   : Factor w/ 4 levels "Otro, cual","Leña / carbón",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ Servicios:'data.frame':   4219 obs. of  9 variables:
##   ..$ Servicio_higienico: Factor w/ 5 levels "No tiene","Inodoro y pozo ciego",..: 3 5 5 5 5 3 5 5 3 3 ...
##   ..$ Cuartos_servicioh : num [1:4219] 1 3 4 3 3 1 2 2 1 1 ...
##   ..$ Fuente_agua       : Factor w/ 2 levels "Irregular","Permanente": 2 2 1 2 2 2 2 1 2 2 ...
##   ..$ Pago_agua         : num [1:4219] 2 12 22 8 38 3 8 2 15 5 ...
##   ..$ Pago_electricidad : num [1:4219] 8 19 20 20 35 20 14 32 15 6 ...
##   ..$ Pago_telefono     : num [1:4219] 8 10 15 10 10 10 10 25 7 15 ...
##   ..$ Pago_internet     : num [1:4219] 25 22 20 24 30 25 8 21 18 27 ...
##   ..$ Tratamiento_basura: Factor w/ 5 levels "Otro, cuál","La botan al río, acequia, canal",..: NA NA NA NA NA NA NA NA NA 4 ...
##   ..$ Dim2_hogar        : num [1:4219] 70 160 200 140 192 50 160 180 200 120 ...
##  $ Ambiente :'data.frame':   4219 obs. of  4 variables:
##   ..$ Ruido         : Factor w/ 2 levels "Si","No": 2 2 2 2 2 2 2 2 2 1 ...
##   ..$ Mal_olor      : Factor w/ 2 levels "Si","No": 1 2 2 2 2 1 2 2 2 1 ...
##   ..$ Trata_desechos: Factor w/ 2 levels "Si","No": 1 2 1 1 1 1 1 1 1 1 ...
##   ..$ N_focos       : num [1:4219] 6 6 8 14 15 6 10 13 7 5 ...

Las operaciones y resultados obtenidos se harán a través de esta nueva base llamada condiciones. Es importante recordar que de esta base se han excluido las viviendas que no cuentan con los servicios básicos, por lo que se descartan hogares en condiciones de extrema pobreza o similares, es decir, en general nuestra población puede considerarse en las 3 clases sociales usuales, clase baja, media y alta.
Analizaremos las variables cuantitativas por medio de un análisis descriptivo. Las variales con las que contamos son:

Claramente los cuartos y las habitaciones de una vivienda son diferentes, en general el número de cuartos es mayor, esto se puede evidenciar en la gráfica. Dado que nuestra población de estudio no desagrega clases sociales, la variabilidad en el número de cuartos es considerable, además se nota un sesgo hacia arriba, es decir, en nuestra población hay un mayor número de viviendas con muchos cuartos, que se podría interpretar como casas grandes, que viviendas con menos cuartos que la media, que se podría interpretar como casas pequeñas. Vemos que en el número de habitaciones la variabilidad es menor y que el 75% de las viviendas cuentan con máximo 3 habitaciones, este número puede interpretarse de varias formas dependiendo el estrato social en el que se ubique el hogar y el número de miembros. Para el número de cuartos y habitaciones existen pocos datos atípicos (menos del 10%), por lo que se aceptan. Notemos que para estas dos variables los datos atípicos se encuentran sobre 5, es decir que podrían tratarse de familias de estratos sociales altos, a excepción de una vivienda que no cuenta con habitaciones.

+ Histograma para Cuartos.

Notamos que el histograma está descentrado, con un sesgo hacia la derecha, como se concluyó en el gráfico de caja y bigotes. La mayoría de la población cuenta con 4 cuartos e igual a la conclusión anterior, se observa una dispersión considerable.

+ Histograma para habitaciones.

En este caso e histograma está ligeramente descentrado, se nota menor viariabilidad.

Notamos una gran cantidad de datos atípicos en los pagos de servicios básicos, para un mejor análisis estratificaremos nuestra población en clases sociales. Dado que se trata de pagos, considero prudente este tipo de estratificación, considerando que el servicio de agua es uno de los más básicos, me basaré en este índice para separar las tres nuevas poblaciones, el código de este proceso se encuentra en ANEXOS2

+ Para clase baja

El gráfico nos muestra que en la clase baja los pagos de agua y teléfono, así como su variabilidad, son similares, mientras que la de electricidad es mayor. En cuanto al pago de agua, notamos que existe un sesgo hacia arriba, pero aun seguimos en pagos bajos, teniendo un máximo de $27, recordando que excluimos hogares en condiciones de pobreza extrema y similares. En cuanto al pago de electricidad, notamos que existe una gran variabilidad, el 75% de los hogares en esta clase paga máximo $25.6, no se evidencia la presencia de sesgos. En el pago de teléfono, el 75% de los hogares paga menos de $23.5, existe un ligro sesgo hacia arriba. Existen pocos datos atípicos.

+ Para clase media

Aquí se puede apreciar una gran diferencia entre los pagos de agua y electricidad frente a los de teléfono, considerando que este servicio ha decaído por las nuevas tecnologías, podríamos aceptarlo, pero podría deberse a distintos factores. Con respeto al pago de agua notamos que existe poca variabilidad y no hay presencia de sesgos, en esta población se paga máximo $50 por este servicio. En cuanto al pago de electricidad, podemos ver que es más alto, precisamente por lo necesario que se ha vuelto este servicio, pero aun así el 75% en este estrato paga como máximo $70, existe un ligero sesgo hacia arriba. Los datos atípicos son pocos (menos del 10%), por lo que se aceptan.

+ Para clase alta

En este estrato notamos que el pago del teléfono es demasiado bajo, comparándolo con el primer gráfico de caja y bigotes, sabemos que existen viviendas con pagos muy altos y que no se evidencian. Analicemos estos casos:

##   Pago_agua Pago_electricidad Pago_telefono
## 1       5.0              28.0            80
## 2       5.0              18.5           160
## 3      10.0              20.0            94
## 4       4.9              25.0           114

Vemos grandes irregularidades con respecto a los pagos, el pago de agua es de máximo $10, mientras que el pago del teléfono llega a $114, estos casos se deben analizar, pues no es un comportamiento normal dentro de nuestra población.
Por lo tanto, el pago del servicio telefónico no se ajusta a la realidad de nuestros datos y lo excluiremos del análisis descriptivo.
Con respecto al pago del agua notamos poca variabilidad y un ligero sesgo hacia abajo, el 75% de las viviendas en esta clase social paga como máximo $90 por este servicio. En el pago de electricidad se aprecia una mayor variabilidad y un sesgo hacia arriba, la distancia entre la mediana y el tercer cuartil es grande, la brecha entre estas dos aglomeraciones es de $19.765.

Notamos que igualmente en el número de focos de una vivienda existen demasiado datos atípicos, por lo tanto, se estratifica por la dimension del hogar, dado que si existen más de 40 focos, podría considerarse una casa grande. Seccionamos siguiendo este razonamiento. El código se adjunta en ANEXOS3

+ Diagrama de Caja y bigotes estratificado

La diferencia de focos entre los tres tipos de casas es grande, lo que tiene sentido, pues mientras más grande es la estructura de la vivienda, implica mayor nivel económico y mejores posibilidades (como en iluminación). Notamos que la variabilidad entre las tres es similar, con presencia de pocos datos atípicos. En casas pequeñas, el 75% de los hogares tienen como máximo 10 focos, en las casas medianas 28 focos y en las casas grandes 70 focos. En las casas pequeñas no existe sesgo, en las casas medianas existe un sesgo hacia arriba, es decir, la mayoría de casas medianas tienen más de 23 focos y en las grandes de igual manera el sesgo es hacia arriba con más de 48 focos.

Análisis de Componentes Principales Mixto

ACP de Servicios

  • Valores propios
##       Eigenvalue Proportion Cumulative
## dim 1       1.48      37.09      37.09
## dim 2       1.03      25.85      62.94
## dim 3       0.87      21.63      84.57
## dim 4       0.62      15.43     100.00

En las tres primeras dimensiones se explica el 84.57% de la información de los datos, por lo que podríamos realizar el estudio en estas dimensiones. Para un mejor análisis, graficaremos las dos primeras dimensiones:

La Figura (a) muestra el mapa de componentes principales donde se encuentran las viviendas (número de vivienda en la base y la provincia a la que pertenece) coloreadas por qué tan regular es su fuente de agua (Irregular, Permanente), donde el primer y segundo cuadrante se ven caracterizados por una fuente de agua irregular, concentrándose en el primer cuadrante, en contraste con el tercer y cuarto cuadrante que se explica por tener una fuente de agua permanente, concentrándose en el cuarto.

El mapa de niveles en la Figura (b) confirma esta interpretación y sugiere que las viviendas con una fuente irregular de agua se concentra en el primer cuadrante, el segundo cuadrante es explicado por fuentes de agua permanente.

El círculo de correlación en (c) indica que los tres pagos de servicios básicos están correlacionados positivamente, en la mayoría de casos, es decir si una vivienda paga más por agua, entonces también pagará más por los servicios de electricidad y teléfono, de igual forma si paga menos.

La Figura (d) traza las variables (categóricas y numéricas) usando cargas cuadradas como coordenadas. Para las variables numéricas, las cargas cuadradas son correlaciones cuadradas y para las variables categóricas las cargas cuadradas son relaciones de correlación. En ambos casos, miden el vínculo entre las variables y los componentes principales. Se observa que las tres variables numéricas Pago de agua, Pago de electricidad y Pago de teléfono están vinculadas al primer componente. Por el contrario, la variable categórica Fuente de agua, es claramente ortogonal a estas variables y está asociada al segundo componente, es decir, no existe correlación entre la regularidad en las fuentes de agua con el monto que se pague por los servicios básicos, los rubros cobrados por la municipalidad no considera si las viviendas cuentan con servicio de agua permanente o no.

ACP de Ambiente

  • Valores propios
##       Eigenvalue Proportion Cumulative
## dim 1       1.24      30.99      30.99
## dim 2       1.06      26.61      57.59
## dim 3       0.91      22.84      80.43
## dim 4       0.78      19.57     100.00
La información sobre el ambiente de las viviendas se puede explicar en un 80.43% en las primeras tres dimensiones.
Para analizar ciertos rasgos de esta base, graficaremos las primeras dos dimensiones:

La Figura (a.1) muestra el mapa de componentes principales donde se encuentran las viviendas coloreadas por ruido, es decir, si su vivienda es afectada o no por esto (Si, No), donde el cuadrante izquierdo se ve caracterizado por viviendas en las que el ruido no les afecta, en contraste con el derecho que se explica por viviendas afectadas por una fuente de ruido permanente. Para el gráfico que representa el mal olor (a.2) es similar, de izquierda a derecha nos dice si la vivienda no es afectada o si por este agente, mientras que para el tratamiento de desechos (a.3), notamos que las viviendas que se encuentran en el cuadrante principal si tratan los desechos, mientras que en el cuadrante inferior no lo hacen.

El mapa de niveles en la Figura (b) confirma la interpretación de las variables cualitativas de Ambiente, por lo que una vivienda ubicada en el primer cuadrante podrá ser caracterizada por tratar sus desechos y posiblemente ser afectada por agentes contaminantes como mal olor y ruido.

La Figura (c) en la que podemos apreciar todas las variables (categóricas y numéricas), se observa que las variables Número de focos y tratamiento de desechos está vinculada al segundo componente. Por el contrario, las variables categóricas Ruido y Mal olor, son ortogonales (especialmente con número de focos) a estas variables y está asociada al primer componente, es decir, no existe correlación entre el número de focos y los agentes contaminantes por los que se pueda ver afectado el hogar, de igual manera con el tratamiento de los desechos, lo que resulta lógico. Por lo tanto, como ya se había mencionado, hogares con un gran número de focos se pueden interpretar como estructuras grandes habitadas por hogares de mayores recursos económicos, pero al ser ortogonales a las variables ruido y mal olor, se nota que la condición económica no ayuda en gran escala para evitar este tipo de contaminantes.

ACP de Vivienda

  • Valores propios
##       Eigenvalue Proportion Cumulative
## dim 1       2.33      38.84      38.84
## dim 2       1.86      31.01      69.85
## dim 3       0.66      10.93      80.78
## dim 4       0.48       8.08      88.86
## dim 5       0.37       6.09      94.94
## dim 6       0.30       5.06     100.00

En el caso de vivienda, el ACP no nos ayuda de gran manera, pues la información de esta base se explica en un 88.86% en las primeras 4 dimensiones, aun así nos ayuda a graficar e interpretar ciertos comportamientos en las primeras dos:

La Figura (a.1) muestra el mapa de componentes principales donde se encuentran las viviendas coloreadas por el estado de la vivienda (Malo, Regular, Bueno), donde el primer cuadrante se caracteriza por viviendas con un techo en mal estado, que pasa a ser regular en el cuarto cuadrante y bueno en el segundo cuadrante. Con respecto a las paredes (a.2), en el primer cuadrante visualizaremos viviendas con paredes en mal estado, que mejora en el cuarto cuadrante con paredes regulares y en el segundo cuadrante contamos con paredes en buen estado. En la figura (a.3) para el estado del piso se repite el comportamiento de las dos caracterísitcas pasadas.

En el mapa de niveles en la Figura (b) no se puede apreciar los niveles claramente, por lo tanto, mostramos la tabla.

##                          dim 1 dim 2
## Vivienda.Techo=Bueno     -0.69  0.09
## Vivienda.Techo=Malo       1.51  2.25
## Vivienda.Techo=Regular    0.98 -0.71
## Vivienda.Paredes=Bueno   -0.63  0.08
## Vivienda.Paredes=Malo     1.89  4.06
## Vivienda.Paredes=Regular  1.18 -0.62
## Vivienda.Piso=Bueno      -0.62  0.08
## Vivienda.Piso=Malo        1.78  3.52
## Vivienda.Piso=Regular     1.14 -0.67

Con estos valores podemos aseverar la información en los gráficos (a), por lo tanto, una vivienda que se encuentre en el primer cuadrante podrá interpretarse como una estructura de paredes, piso y techo categorizadas como malas, es decir, es una estructura en malas condiciones. Una estructura de condiciones regulares se graficará en el cuarto cuadrante y las viviendas con una estructura en buenas condiciones se graficarán en el segundo cuadrante.

La Figura (c) en la que podemos apreciar las variables categóricas, se observa que las variables Estado de paredes, Estado de piso y Estado de techo ayudan a la formación de los dos cuadrantes en proporciones similares, además de guardar una correlación positiva, es decir, si las condiciones de las paredes de una vivienda es malo, se espera que el piso y el techo se encuentren en condiciones similares, de igual forma para estructuras con pisos, paredes o techo regulares y buenas.

ACP multitablas

Para este ACP utilizaremos las tres tablas analizadas anteriormente, vivienda, servicios y ambiente - Valores propios

##        Eigenvalue Proportion Cumulative
## dim 1        1.36      16.01      16.01
## dim 2        1.03      12.15      28.16
## dim 3        0.87      10.24      38.40
## dim 4        0.80       9.40      47.79
## dim 5        0.78       9.22      57.01
## dim 6        0.67       7.89      64.90
## dim 7        0.63       7.42      72.32
## dim 8        0.59       6.98      79.30
## dim 9        0.58       6.78      86.08
## dim 10       0.41       4.80      90.89
## dim 11       0.28       3.30      94.19
## dim 12       0.21       2.45      96.63
## dim 13       0.16       1.84      98.47
## dim 14       0.13       1.53     100.00
Las primeras nueve dimensiones explican el 86.08% de la información de nuestra población, con lo que perderíamos menos del 20% de la información para nuestro análisis. Para mostrar gráficamente estos resultados se utiliza las dos primeras dimensiones:

La figura (a) representa el círculo de correlación de las variables numéricas, coloreadas de acuerdo a la tabla a la que pertenecen (Servicio o Ambiente). Dado que no se distingue los títulos en las gráficas, se presenta los valores:

coord.var <- res.mfamix$quanti$coord[,1:2]
coord.var
##                                 dim 1      dim 2
## Servicios.Pago_agua         0.4744102 0.31909479
## Servicios.Pago_electricidad 0.5266969 0.33340948
## Servicios.Pago_telefono     0.3625146 0.26580895
## N_focos                     0.6682048 0.09725856
Por lo tanto, las variables numéricas en nuestra población ayudan a la formación de la primera dimension, estando todas correlacionadas positivamente. Así, un hogar con mayor número de focos se espera que también pague mayores rubros en los servicios básicos como agua electricidad y teléfono, al contrario de estructuras pequeñas con menos número de focos en las que se espera que sus pagos por estos servicios básicos sean menores.
En la figura (b) se selecciona la vivienda en la posición 1477 en nuestra base de datos que se ubica en la provincia del Guayas, por su posición podemos concluir qie esta vivienda es de estructura grande, con un número de focos aproximado a 48 y que por lo tanto los pagos que realiza por servicios básicos son elevados, además es muy probable que se vea afectado por algún agente contaminante como malos olores o ruido.
El gráfico (d) de grupos, apoya las conclusiones a las que hemos llegado con respecto al ambiente, servicios y las condiciones de las viviendas. El gráfico (c) nos ayudará a crear grupos según las variables que disponemos, la proporción en la que éstas aportan a las dimensiones y su correlación, estos grupos se detallarán en las conclusiones. También nos ayudará un gráfico de las variables categóricas que se presenta a continuación:

Que como se observa, reune las características y las posiciones de las variables que mencionamos en los análisis por separado. Por lo tanto, si una vivienda se encuentra en el cuarto cuadrante, podemos determinar que, su estructura en cuanto a paredes, piso y techo es buena, no es afectada por agentes contaminantes como mal olor o ruido, el agua que se consume es de fuente permanente y no tratan sus desechos.


Conclusiones

Se indica los grupos que se han formado mediante el Análisis de componentes principales, añadiéndole características del análisis descriptivo.


Recomendaciones


Bibliografía



Anexos


Condiciones_vida <- read_excel("01_ecv6r_vivienda.xlsx")
Condiciones_vida<-filter(Condiciones_vida,Condiciones_vida$VI11!="No cocinan",
                         Condiciones_vida$VI14!="No tiene",
                         (Condiciones_vida$VI17=="Red pública"  | 
                         Condiciones_vida$VI17=="Otra fuente por tubería"),
                         Condiciones_vida$VI22=="Si",#pago agua
                         Condiciones_vida$VI26=="Empresa eléctrica pública",
                         Condiciones_vida$VI28=="Si",#pago electricidad
                         Condiciones_vida$VI30=="Si",#pago telefono
                         Condiciones_vida$VI32=="Si")#pago internet
Servicios_clasebaja <- filter(Servicios, Servicios$Pago_agua<=30,
                              Servicios$Pago_electricidad<=40,
                              Servicios$Pago_telefono<30)

Servicios_clasemedia <- filter(Servicios, (Servicios$Pago_agua>30 & Servicios$Pago_agua<=60),
(Servicios$Pago_electricidad>40 & Servicios$Pago_electricidad<=70))

Servicios_clasealta <- filter(Servicios, Servicios$Pago_agua>60,
                              Servicios$Pago_electricidad>70)
casa_pequenia <- Ambiente %>% select(N_focos) %>%  filter(Ambiente$N_focos<=18)

casa_mediana <- Ambiente %>% select(N_focos) %>% filter(Ambiente$N_focos>18 & Ambiente$N_focos<=40)

casa_grande <- Ambiente %>% select(N_focos) %>% filter(Ambiente$N_focos>40)