Distribución de mujeres de 15 años y más por disponibilidad de ingresos según estado conyugal

Fuente:ENCUESTA NACIONAL SOBRE LA DINÁMICA DE LAS RELACIONES EN LOS HOGARES (ENDIREH) 20161

Información en http://www.beta.inegi.org.mx/proyectos/enchogares/especiales/endireh/2016/.

Población objetivo Las mujeres de 15 años o más residentes habituales de las viviendas seleccionadas en la muestra en

Se cubrieron los iguientes temas

  1. Características de la Vivienda y Hogares en la Vivienda.
  2. Características Sociodemográficas de las Personas Residentes de la Vivienda.
  3. Elegibilidad y Verificación de Estado Conyugal de la Mujer Elegida de 15 años o más.
  4. Situación de la Relación de Pareja / Ingresos y Recursos.
  5. Consentimiento y Privacidad.
  6. Ámbito Escolar.
  7. Ámbito Laboral.
  8. Ámbito Comunitario.
  9. Atención Obstétrica.
  10. Ámbito Familiar.
  11. Familia de Origen.
  12. Vida en Pareja.
  13. Tensiones y Conflictos.
  14. Relación Actual o última.
  15. Decisiones y Libertad Personal.
  16. Opinión sobre los Roles Masculinos y Femeninos.
  17. Recursos Sociales.
  18. División del Trabajo en el Hogar.
  19. Mujeres de 60 años o más.

El ejemplo to tomaremos de la sección # 4 que trata de la Situación de la Relación de Pareja, de sus ingresos y recursos De los tabulados básicos

http://www.beta.inegi.org.mx/contenidos/proyectos/enchogares/especiales/endireh/2016/tabulados/IV_Ingresos_y_recursos_estimaciones_endireh2016.xlsx

Tabla básica 4.1

Tabla básica 4.1

Se trata de una tabla combinada de la variable del estado conyugal y de los ingresos de acuerdo a la siguiente característica

La variable relacionada con los ingresos está en considerada en el marco conceptual de acuerdo a la siguiente tabla http://www.beta.inegi.org.mx/app/biblioteca/ficha.html?upc=702825095055

Ingresos Y corresponde a las siguientes preguntas del cuestionario

Ingresos propios

Ingresos propios

otros ingresos

otros ingresos

Creación de nuevas variables

Es necesario desde cada pregunta la variable compuesta, para determinar si solo dispone de ingresos propios (salario y pensiones), si no tiene ingresos de ningún tipo y la combinación de si tiene ingreso proveniente de ayudas familiares o del gobierno.

Para tal efecto se consideró el siguiente espacio de probabilidades de ingreso

Variables creada desde los reactivos puntuales Así Sin ingresos propios o de otras fuentes, responde que no a 4.1,4.8.1: 4.8.2;4.8.3; 4.8.4; 4.8.5;4.8.6;4.8.7:4.8.8

Datos originales 1 es Si, 2 es No
ID_MUJ edociv P4_1 P4_8_1 P4_8_2 P4_8_3 P4_8_4 P4_8_5 P4_8_6 P4_8_7 P4_8_8
0100090.04.01.02 Cas o uni 1 2 2 2 2 2 2 2 2
0100097.01.01.02 Cas o uni 2 2 2 2 2 2 2 2 2
0100097.05.01.01 Sep,div,viuda 2 2 2 1 2 2 2 1 2
0100097.03.01.02 Cas o uni 1 2 1 2 2 2 2 2 2
0100101.03.01.01 Sep,div,viuda 2 2 2 2 2 2 2 1 1
0100101.04.01.03 Sep,div,viuda 1 2 2 2 2 2 2 2 2
Ingresos propios, recibe salario, o jubilaciones y pensiones 4.1 o P48.1 o P48.8
1 2
Cas o uni 27924 44931
Sep,div,viuda 12352 7238
Soltera 9283 9528
Ayuda familiar P48.2 o P48.3
1 2
Cas o uni 3427 69428
Sep,div,viuda 2732 16858
Soltera 1886 16925
Ayuda gobierno P48.4 o P48.5 o P48.6 o P48.7
1 2
Cas o uni 18077 54778
Sep,div,viuda 5826 13764
Soltera 2827 15984
Situación de ingresos
ingayudasfamgob ingpropyayudasfamgob siningpropniotrafuente soloayudagob soloingprop
Cas o uni 2652 4788 29550 12729 23136
Sep,div,viuda 1764 3031 2798 2676 9321
Soltera 1391 1098 6266 1871 8185
Situación de ingresos transpuesta
Cas o uni Sep,div,viuda Soltera
ingayudasfamgob 2652 1764 1391
ingpropyayudasfamgob 4788 3031 1098
siningpropniotrafuente 29550 2798 6266
soloayudagob 12729 2676 1871
soloingprop 23136 9321 8185

Análisis estadísticos renglones, columnas, chi cuadrado, gtest, correspondencia

Interpretación de la tabla de contingencia, el tamaño de los puntos refleja la magnitud de los valores de la tabla

Cálculo de los totales de margen distribución marginal

Variables en renglones

Total de renglón
ingayudasfamgob 5807
ingpropyayudasfamgob 8917
siningpropniotrafuente 38614
soloayudagob 17276
soloingprop 40642
Distribución marginal por renglón
Cas o uni Sep,div,viuda Soltera
ingayudasfamgob 0.4566902 0.3037713 0.2395385
ingpropyayudasfamgob 0.5369519 0.3399125 0.1231356
siningpropniotrafuente 0.7652665 0.0724608 0.1622728
soloayudagob 0.7368025 0.1548970 0.1083005
soloingprop 0.5692633 0.2293440 0.2013926
##     Cas o uni Sep,div,viuda       Soltera 
##     0.6548411     0.1760804     0.1690785

Distancia entre renglones

Si se quiere comparar entre dos renglones, por ejemplo la distancia entre quienes reciben ayuda de familiares y gobierno y quienes no recien ayuda de ningún tipo

Distancia entre quienes sólo tienen ingresos propios y los que no tienen y de ninguna otra fuente 0.2074968

Distancia entre quienes sólo tienen ingresos propios y solo ayuda de gobierno 0.1255959

Distancia entre quienes sólo ayuda de gobierno y quienes no tienen ninguna ayuda 0.0570604

Distancia de cada renglón con el promedio de renglón

ingayudasfamgob 0.182
ingpropyayudasfamgob 0.186
siningpropniotrafuente 0.080
soloayudagob 0.035
soloingprop 0.033

Distancia de cada renglón con cada uno de ellos, en la tabla de contingencia

El resultado es una matriz que indica la diferencia o la correlación entre renglones El tamaño del círculo es proporcional a la distancia entre ellos

Peso de cada renglón Row mass

Es el total de cada renglón dividida entre el total de la población

##       ingayudasfamgob    ingpropyayudasfamgob siningpropniotrafuente 
##             0.05219494             0.08014849             0.34707342 
##           soloayudagob            soloingprop 
##             0.15528151             0.36530165

Inercia

La inercia de cada renglón se calcula como el peso de cada renglón multiplicado por la distancia entre el renglón y el promedio de renglones

Corresponde al total de la información contenida en la tabla

##       ingayudasfamgob    ingpropyayudasfamgob siningpropniotrafuente 
##            0.009495384            0.014919080            0.027721755 
##           soloayudagob            soloingprop 
##            0.005381216            0.012227231

El total de la inercia corresponde a la cantidad de información que tiene 0.0697447

En resumen la información de cada renglón, distancia, peso e inercia puede concentrarse en esta tabla

##                           d2  mass inertia
## ingayudasfamgob        0.182 0.052   0.009
## ingpropyayudasfamgob   0.186 0.080   0.015
## siningpropniotrafuente 0.080 0.347   0.028
## soloayudagob           0.035 0.155   0.005
## soloingprop            0.033 0.365   0.012

Variables en columnas

Distribución marginal por columna
Cas o uni Sep,div,viuda Soltera
ingayudasfamgob 0.0364011 0.0900459 0.0739461
ingpropyayudasfamgob 0.0657196 0.1547218 0.0583701
siningpropniotrafuente 0.4056002 0.1428280 0.3331030
soloayudagob 0.1747169 0.1366003 0.0994631
soloingprop 0.3175623 0.4758040 0.4351178
##     Cas o uni Sep,div,viuda       Soltera 
##     0.6548411     0.1760804     0.1690785

Distancia entre columnas

Si se quiere comparar entre dos columnas, por ejemplo la distancia entre quienes solteras y separadas, divorciadas o viudas

##     Cas o uni Sep,div,viuda       Soltera 
##     0.6548411     0.1760804     0.1690785

Distancia entre separadas, divorciadas o viudas y solteras 0.2787558

Distancia entre separadas, divorciadas o viudas y casadas o unidas 0.6021964

Distancia entre casadas o unidas y solteras 0.1206756

Distancia de cada columna con el promedio de columna

Cas o uni 1.450
Sep,div,viuda 1.414
Soltera 1.605

Distancia de cada columna con cada una de ellos, en la tabla de contingencia

El resultado es una matriz que indica la diferencia o la correlación entre columnas El tamaño del círculo es proporcional a la distancia entre ellos

##               Cas o uni Sep,div,viuda Soltera
## Cas o uni          0.00          0.60    0.12
## Sep,div,viuda      0.60          0.00    0.28
## Soltera            0.12          0.28    0.00

Peso de cada columna Col mass

Es el total de cada renglón dividida entre el total de la población

##     Cas o uni Sep,div,viuda       Soltera 
##     0.6548411     0.1760804     0.1690785

Inercia

La inercia de cada columna se calcula como el peso de cada columna multiplicado por la distancia entre la columna y el promedio de columnas

Corresponde al total de la información contenida en la tabla

##     Cas o uni Sep,div,viuda       Soltera 
##     0.9493915     0.2489991     0.2714066

El total de la inercia corresponde a la cantidad de información que tiene 1.4697972

En resumen la información de cada renglón, distancia, peso e inercia puede concentrarse en esta tabla

##                  d2  mass inertia
## Cas o uni     1.450 0.655   0.949
## Sep,div,viuda 1.414 0.176   0.249
## Soltera       1.605 0.169   0.271

Relación y asociación entre las variables de renglón y columna

Cuando las tablas de contingencia no son muy grandes o no es fácil visualizar e interpretar la relación entre las columnas y renglones se utilizan otros métodos estadísticos.

Uno de ellos es la pruba de independencia de Xi cuadrado Es una prueba de hipótesis utilizada en tablas de contingencia para probar la independencia entre variables, esto es si están significativamente asociadas.

La hipótesis nula dice que ambas variables, la de las columnas o de los renglones son independientes La hipótesis alternativa es que son dependientes o están asociados.

Para cada cruce o celda de la tabla se calcula el valore esperado en el supuesto de la independencia esto el total del renglón por el total de columna entre el total.

El estadístico de prueba o Xi cuadrada es la suma del cuadrado de las diferencias de valores observados menos valores esperados.

El valor crítico con el que se compara se obtiene de tablas de distribución o de tablas con grados de libertad (renglón-1)*(columnas-1) con un nivel de significancia .05 Error típico tipo 1. Rechazar siendo cierto. (Pruebas de hipótesis)

Si el valor calculado es mayor que el valor crítico, las variables no son independientes, esto implica que están asociadas significativamente

Si se calcula el pvalue.

*• Si el nivel de significancia (0.5) es mayor que el p-value rechazar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es incorrecta la hipótesis nula y que la alternativa podría ser la correcta.

*• Si el nivel de significancia (0.5) es menor que el p-value aceptar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es correcta la hipótesis nula y que la alternativa podría sería la incorrecta.

Cuando no se rechaza la Ho, no significa que se crea que es cierta sino que no hay suficiente evidencia para dudar de ella.

Sólo se apolica cuando la frecuencia esperada de cualquier celda es al menos cinco.

Esta prueba establece la asociación, aunque se desconoce la naturaleza de la misma

## 
##  Pearson's Chi-squared test
## 
## data:  tablasitdineroT
## X-squared = 7759.5, df = 8, p-value < 2.2e-16

Valores esperados, Valores observados

##                        Cas o uni Sep,div,viuda Soltera
## ingayudasfamgob          3802.66       1022.50  981.84
## ingpropyayudasfamgob     5839.22       1570.11 1507.67
## siningpropniotrafuente  25286.03       6799.17 6528.80
## soloayudagob            11313.03       3041.96 2921.00
## soloingprop             26614.05       7156.26 6871.69
##                        Cas o uni Sep,div,viuda Soltera
## ingayudasfamgob             2652          1764    1391
## ingpropyayudasfamgob        4788          3031    1098
## siningpropniotrafuente     29550          2798    6266
## soloayudagob               12729          2676    1871
## soloingprop                23136          9321    8185

Residuales

Para saber cuál es el cruce o la celda que más contibuye al resultado de la Chii cuadrada se utilzan los residuales, esto es la Chi cuadrada de cada celda

##                        Cas o uni Sep,div,viuda Soltera
## ingayudasfamgob          -18.660        23.189  13.058
## ingpropyayudasfamgob     -13.757        36.868 -10.551
## siningpropniotrafuente    26.815       -48.524  -3.252
## soloayudagob              13.313        -6.635 -19.428
## soloingprop              -21.320        25.590  15.843

El tamaño del círculo en cada celda es proporcional a la cantidad de contribución El signo de cada valor residual también es importante para interpretar la asociación entre las columnas y los renglones de acuerdo a lo siguiente

Los resultados positivos son azules, especifican una asociación positiva (atracción) entre las columnas y los renglones correspondientes

Los resultados negativos son rojos, implican una asociación negativa(repulsión) entre las columnas y renglones correspondientes

En el análisis de correspondencia se descomponen los residuales estandarizados. (una nueva distribución)

Contribución

La conttribución en términos de porcentajes es la relación entre cada residual al cuadrado y la xi cuadrada total. Se calcula como contribuye en %

##                        Cas o uni Sep,div,viuda Soltera
## ingayudasfamgob            4.487         6.930   2.197
## ingpropyayudasfamgob       2.439        17.517   1.435
## siningpropniotrafuente     9.266        30.345   0.136
## soloayudagob               2.284         0.567   4.864
## soloingprop                5.858         8.439   3.235

Es una indicación de la naturaleza de la dependencia entre renglones y columnas de la tabla de contingencia Esta interpretación es complicada cuando la tabla es muy grande, la contribución es una forma útil de establecer la naturaleza de la dependencia

Inercia total

Es como se dijo anteriormente la información contenida en la tabla

Inercia Total 0.0697447

Trace 0.2640922

La raíz cuadrada de esta inercia es llmada “trace” y puede ser interpretada como coeficiente de correlación (Bendixen, 2003). Cualquier valor mayor de 0.2 indica una dependencia significativa entre renglones y columnas (Bendixen M., 2003)

Gráfico de mozaico, utilizado en las tablas de contingencia para examinar la asociación entre variables categóricas

Para cada celda la altura de las barras es proporcional a la frecuencia relativa de los observado El gráfico azul es el de los valores observados, el gris es el de los esperados siendo cierta la hypotesis nula que dice que son independientes, la diferencia es la que marca la distancia entres lo esperado y lo observado

Entre estos dos gráficos, está el de los residuales que calcula la diferencia entre ambos.

G-test: Likelihood ratio test

La prueba de independencia G-Test o prueba likelihood radio es una prueba alternativa a la prueba de chi-cuadrada y que da aproximadamente los mismos resultados

EStá basada en el radio likelihood que compara lo observado con lo espeado.

## 
##  G-test
## 
## data:  as.matrix(tablasitdineroT)
## G = 8056.6, df = 8, p-value < 2.2e-16

Interpretación del radio likehood como asociación entre renglones y columnas

Para una celda dada Si el radio es >1 hay una atracción (asociación) entre las columnas y renglones correspondientes Si el radio es <1 hay una repulsón entre las columnas y renglones correspondientes

##                        Cas o uni Sep,div,viuda Soltera
## ingayudasfamgob            0.697         1.725   1.417
## ingpropyayudasfamgob       0.820         1.930   0.728
## siningpropniotrafuente     1.169         0.412   0.960
## soloayudagob               1.125         0.880   0.641
## soloingprop                0.869         1.302   1.191

Se utilizará el logaritmo del radio o relación para ver la atracción o repulsión en colores diferentes Si el radio es <1 o negativo estará en rojo (repulsión) Si el radio es >1 o positivo estará en azul (asociación)

Análisis de correspondencias

Se requiere cuando las tablas de contingencia son muy grandes

Es utilizada para visualizar puntos de los renglones y puntos de las columnas en un espacio de dos dimensiones

Es un método de reducción de dimenciones, la información que se retiene para cada dimensión es llamada eigenvalor

Se utiliza el valor Phi2, o total de inercia calculado anteriormente.

Los eigenvalores se calula para las columnas y para los renglones

Las coordenadas de los renglones y de las columnas son los eigenvalores

Se calcula un índice de asociación

Si hay una atracción (asociación) las coordenadas de las renglones y de las columnas tienen el mismo signo de los ejes, Si hay repulsión (no asociación) las coordenadas correspondientes tienen signos diferentes Un alto valor indica una fuerte atracción o repulsión

## $d
## [1] 2.476095e-01 9.183783e-02 1.442567e-17
## 
## $u
##            [,1]       [,2]
## [1,] -0.3775921 -0.2989936
## [2,] -0.4422726  0.5890449
## [3,]  0.6686165 -0.1926509
## [4,]  0.1872569  0.6189716
## [5,] -0.4239175 -0.3786671
## 
## $v
##            [,1]       [,2]
## [1,]  0.5156707  0.2815007
## [2,] -0.8426688  0.3373853
## [3,] -0.1548966 -0.8982920
##           eig variance cumvariance
## 1 0.061310478 87.90705    87.90705
## 2 0.008434188 12.09295   100.00000

¿Cuantas dimensiones (ejes) se pueden retener?:

El número máximo de ejes son el el valor mínimo entre (los renglones menos uno, las columnas menos uno, en este ejercicio hay 5 renglones y 3 columnas, es el valor menor entre 3 y 2, es decir dos ejes dos dimensiones

Coordenadas de las variables de renglón

##                         Dim.1  Dim.2
## ingayudasfamgob        -0.409 -0.120
## ingpropyayudasfamgob   -0.387  0.191
## siningpropniotrafuente  0.281 -0.030
## soloayudagob            0.118  0.144
## soloingprop            -0.174 -0.058

Coordenadas de las variables de columnas

##                      Dim1        Dim2
## Cas o uni      0.15778723  0.03194723
## Sep,div,viuda -0.49724313  0.07384010
## Soltera       -0.09327497 -0.20062957

Gráfico con las variables de renglón y columna para ver la asociación

Se puede interpretar la distancia entre los puntos de los renglones o entre los puntos de las columnas pero la distancia entre ellas no tiene mucho significado.

Es necesario hacer un diagnótico Tomando en cuenta la inercia total.

Para saber cuánta información hay en el gráfico

Se calcula la contribución de renglones y columnas

Contribución de renglones en %

##                        Dim.1 Dim.2
## ingayudasfamgob        14.26  8.94
## ingpropyayudasfamgob   19.56 34.70
## siningpropniotrafuente 44.70  3.71
## soloayudagob            3.51 38.31
## soloingprop            17.97 14.34

Contribución de columnas en %

##                Dim1  Dim2
## Cas o uni     26.59  7.92
## Sep,div,viuda 71.01 11.38
## Soltera        2.40 80.69

Calidad de la representación .. La variables estudiadas, son los principales componentes de lo observado.

Renglones

Es llamada también COS2

Se calcula con la relación entre las coordenadas de los renglones y la distancia del promedio Muestra la importancia de los componentes principales de lo que se observa

Note como se explica cada variable, el total por rengón es 1 o 100%

La calidad de la representación de los renglones en el mapa de factores es:

##                        Dim.1 Dim.2
## ingayudasfamgob        0.921 0.079
## ingpropyayudasfamgob   0.804 0.196
## siningpropniotrafuente 0.989 0.011
## soloayudagob           0.400 0.600
## soloingprop            0.901 0.099

Columnas

##                Dim1  Dim2
## Cas o uni     0.961 0.039
## Sep,div,viuda 0.978 0.022
## Soltera       0.178 0.822

Uso de paquete FactoMineR

## **Results of the Correspondence Analysis (CA)**
## The row variable has  5  categories; the column variable has 3 categories
## The chi square of independence between the two variables is equal to 7759.513 (p-value =  0 ).
## *The results are available in the following objects:
## 
##    name              description                   
## 1  "$eig"            "eigenvalues"                 
## 2  "$col"            "results for the columns"     
## 3  "$col$coord"      "coord. for the columns"      
## 4  "$col$cos2"       "cos2 for the columns"        
## 5  "$col$contrib"    "contributions of the columns"
## 6  "$row"            "results for the rows"        
## 7  "$row$coord"      "coord. for the rows"         
## 8  "$row$cos2"       "cos2 for the rows"           
## 9  "$row$contrib"    "contributions of the rows"   
## 10 "$call"           "summary called parameters"   
## 11 "$call$marge.col" "weights of the columns"      
## 12 "$call$marge.row" "weights of the rows"
##        eigenvalue percentage of variance
## dim 1 0.061310478               87.90705
## dim 2 0.008434188               12.09295