En el presente documento se muestra un análisis a partir de los datos abiertos del Gobierno de la Ciudad de México, en particular, el estudio se enfoca en lo siguiente:
- Identificar las características de las mujeres que son más propensas a interrumpir su embarazo.
- Revisar y clasificar si los apoyos económicos fueron destinados a las personas y delegaciones que más lo necesitan.
- Generar un índice de movilidad ponderado a partir de los ingresos de las líneas del metro.
- Detectar los determinantes del Índice de Desarrollo Social (IDS), así como del estrato social.
- Determinar si los datos presentan anomalías a partir de la Ley de Benford.
Interrupciones de embarazos
La figura 1 presenta el número de interrupciones de embarazos por alcaldía. De acuerdo con la información, la alcaldía en donde hay una mayor propensión a la interrupción del embarazo es en Iztapalapa (más de 6mil casos registrados), seguido de la GAM (más de 5mil casos). Entre la alcaldía Cuauhtémoc y Miguel Hidalgo los casos oscilan entre 4mil y 2mil en tanto que se registran menos de 2mil de Coyoacán a Milpa Alta.
Cabe resaltar que esto está en línea con el numero de habitantes que se puede encontrar por cada alcaldía.
Figura 1. Número de interrupciones de embarazos por cada alcaldía

En la figura 2 se observa el estado civil asociado al mayor número de interrupciones de embarazos, en este caso, las mujeres solteras registran un mayor número de interrupciones (más de 18mil casos), seguido por las mujeres que están en unión libre (9486 casos), en menor proporción, las mujeres casadas (3053) y en su minoría, mujeres divorciadas, separadas y viudas.
Figura 2. Interrupciones de acuerdo al estado civil
En la figura 3 se observa el el nivel de estudios que tenían las mujeres al momento de realizar la interrupción de su embarazo. En ese sentido, la mayoría de las mujeres que tienen que acudir a este acto son las que estaban estudiando el nivel preparatoria (más de 14mil), seguido por secundaria (más de 9mil) y licenciatura con más de 5mil casos. Es de llamar la atención los casos registrados en nivel primaria de interrupción de embarazos (más de 1400 casos).
Finalmente, las mujeres con niveles educativos más altos (maestría y doctorado) presentan menores registros de interrupción de embarazos.
Figura 3. Nivel de estudios durante la interrupción
En la figura 4 presentamos la ocupación o relación laboral en el que se encontraban las mujeres al momento de la interrupción. En su mayoría, las mujeres son empleadas (más de 12mil casos), seguido por estudiantes (si se relaciona con la figura 3, se concentraría más en jóvenes de bachillerato).
Asimismo, las mujeres que son trabajadoras del hogar sin remuneración están en tercer lugar con más de 8mil casos y en menor proporción las mujeres desempleadas.
Figura 4. Relación laboral durante la interrupción
La figura 5 muestra la religión a la que pertenecen las mujeres durante la interrupción de su embarazo. Destaca la religión católica como la más practicada (más de 20mil), seguido por mujeres que no están asociadas o practican alguna religión (más de 8mil) y en menor proporción las mujeres que práctican otras religiones como cristiana, mormona, budista, por mencionar algunas.
Figura 5. Religión que practicaban al momento de la interrupción
La figura 6 muestra los anticonceptivos más utilizados al momento de la interrupción.Destaca, que la mayoría de las mujeres no utilizan protección durante sus relaciones.
En ese sentido, el anticonceptivo más utilizado es el condón, seguido por DIU y la pastilla de emergencia. Lejos de estigmatizar a las mujeres, los datos revelan que entre menor preparación y el uso inadecuado o el simple hecho de no utilizar un método anticonceptivo, se ve reflejado en una mayor propensión a la interrupción del embarazo.
Figura 6. Anticonceptivos utilizados al momento de la interrupción
Finalmente, la figura 7 muestra los histogramas de las edades en las que las muejeres realizan la interrupción, concentrándose entre los 18 y 20 años. Asimismo, las mujeres comienzan su vida sexual entre los 16 y 18 años.
Figura 7. Histogramas de edad en la que se realizan la interrucpción y edad en la que comienzan a tener relaciones sexuales

Determinantes del índice de Desarrollo Social y el estrato social
El índice de desarrollo social (IDS) permite identificar contrastes y marcadas desigualdades regionales, poniendo de manifiesto la coexistencia de distintas realidades dentro de nuestro país en cuanto al disfrute del bienestar y al pleno desempeño de las capacidades de los individuos. En esta sección se busca detectar aquellas variables que más inciden en el IDS.
Para determinar dichas relaciones se corrió una serie de modelos de regresión que permite observar la importancia de cada variable en la determinación del IDS. En la tabla 1 se muestra el error de los modelos junto con sus coeficientes de determinación.
Tabla 1. Resultados del modelo
| Huber |
0.008508 |
72.83 |
| Linear |
0.009258 |
71.94 |
| Ridge |
0.009281 |
71.95 |
| Lasso |
0.009299 |
71.38 |
| Elastic |
0.009604 |
69.91 |
| Ransac |
0.019994 |
33.29 |
El lector podrá apreciar que el modelo con mejor desempeño según el error cuadrático medio (MSE) fue el modelo Huber que presenta la particularidad de ser robusto ante outliers. De ese modo, se puede apreciar en la figura 8 el valor de los coeficientes en la determinación del IDS.
Figura 8. Coeficientes de determinación del IDS

Se puede apreciar que, en el caso de la Ciudad de México, la variable de vivienda junto con la educación son las variables que mayor impacto positivo generan sobre el IDS, mientras que la variable de bienes duraderos sugiere que un incremento de estos genera una disminución del IDS. Por otra parte, la delegación, el género y el estrato social parecen no ser relevante en la determinación del IDS.
En el caso del estrato social, se utilizó una serie de modelos de clasificación (Estrato alto, Pobreza moderada, satisfacción mínima, Pobreza muy alta, Pobreza alta) que tiene por objetivo detectar las variables más importantes en la determinación de los estratos.
La tabla 2 muestra la precisión de cada uno de los modelos de clasificación junto con la deviación estándar de los mismos en validación cruzada.
Tabla 2. Validación cruzada de los modelos
| Random Forest |
90.4 |
3.8 |
| Gradient Boosting |
86.7 |
7.6 |
| Support Vector Machines |
71.9 |
6.9 |
| Regresión Logística |
51.9 |
8.1 |
Se puede apreciar que el mejor modelo fue el Random Forest. En el la figura 9 se puede apreciar la importancia que optimiza el coeficiente de Gini, utilizado para la optimización del modelo.
Figura 9. Relevancia de las variables

De acuerdo con los resultados del modelo, la variable más importante en la determinación del estrato social es el IDS, seguido de la educación y los bienes duraderos. Se destaca que, de acuerdo con la relación de los datos, ni el genero ni la delegación son variables relevantes en la determinación del estrato social.
Finalmente se evalúa si los datos presentan anomalías en su distribución mediante la ley de Benford. De acuerdo con esta prueba de hipótesis, las series tienden a presentar una mayor presencia de números cercanos a cero por la naturaleza de estos, de modo que si la distribución del primer digito de las cantidades no se asemeja a una distribución de Benford, entonces podría haber indicios de manipulación en os mismos.
Los conjuntos de datos que obedecen a la ley de Benford, el número 1 aparece como el primer dígito significativo alrededor del 30% del tiempo, mientras que el 9 aparece como el primer dígito significativo menos del 5% del tiempo. Si los dígitos se distribuyeran uniformemente, cada uno de ellos aparecería aproximadamente el 11,1% del tiempo.
En las siguientes figuras se puede apreciar la distribución Benford vs la distribución empírica de las variables de los modelos antes mencionados. Los puntos rojos siguen la distribución de Benford, mientras que las barras y líneas siguen la distribución empírica.
Figura 10. Bienes duraderos

Figura 11.Eduacación

Figura 12. Índice de Desarrollo Social

Figura 13. Vivienda

En la tabla 3 se muestra la prueba de hipótesis con Chi cuadrada, si el p-value es menor al 5% se rechaza la hipótesis nula y por ende se asume que la serie presenta anomalías.
Tabla 3. Prueba de hipótesis
| Bienes duraderos |
0.1474 |
12.0865 |
No |
| Vivienda |
0.2238 |
10.625 |
No |
| Índice de Desarrollo Social |
0.017 |
18.6133 |
Sí |
| Educación |
0.2816 |
9.7681 |
No |
Según los datos presentados, el IDS es la única variable que presenta anomalías en la distribución de sus datos.
Distribución de apoyos sociales
Durante la pandemia por COVID-19 la CDMX otorgó apoyos sociales en las distintas delegaciones, tal como seguros de desempleo que tienen como finalidad ser un aliciente a los repentinos cierres de empresas y comercios durante la aplicación de medidas ante la pandemia, de la cual fueron aprobadas el 68.3% de las solicitudes.
Tabla 4. Solicitudes de seguro de desempleo
|
Estatus
|
Solicitudes
|
Porcentaje
|
|
APROBADO
|
14,196
|
68.3
|
|
NO APROBADO
|
6,592
|
31.7
|
Analizando las solicitudes aprobadas encontramos que los principales beneficiarios fueron personas con niveles de educación secundaria (23.0%), Bachillerato (26.4%) y Licenciatura (24.3).
Tabla 5. Solicitudes desagregadas por escolaridad
|
Escolaridad
|
Solicitudes
|
Porcentaje
|
|
BACHILLERATO
|
3,743
|
26.4
|
|
LICENCIATURA
|
3,448
|
24.3
|
|
NINGUNO
|
237
|
1.7
|
|
POSGRADO
|
289
|
2.0
|
|
PRIMARIA
|
1,387
|
9.8
|
|
SECUNDARIA
|
3,261
|
23.0
|
|
SIN DATO
|
527
|
3.7
|
|
TECNICA/COMERCIAL
|
1,304
|
9.2
|
Tabla 6. Solicitudes desagregadas por delegación
|
Delegación
|
Solicitudes
|
Porcentaje
|
|
ALVARO OBREGON
|
779
|
5.5
|
|
AZCAPOTZALCO
|
674
|
4.7
|
|
BENITO JUAREZ
|
434
|
3.1
|
|
COYOACAN
|
678
|
4.8
|
|
CUAJIMALPA DE MORELOS
|
166
|
1.2
|
|
CUAUHTEMOC
|
1,240
|
8.7
|
|
GUSTAVO A MADERO
|
1,252
|
8.8
|
|
IZTACALCO
|
541
|
3.8
|
|
IZTAPALAPA
|
1,980
|
13.9
|
|
LA MAGDALENA CONTRERAS
|
240
|
1.7
|
|
MIGUEL HIDALGO
|
445
|
3.1
|
|
MILPA ALTA
|
998
|
7.0
|
|
SIN DATO
|
2
|
0.0
|
|
TLAHUAC
|
898
|
6.3
|
|
TLALPAN
|
818
|
5.8
|
|
VENUSTIANO CARRANZA
|
1,265
|
8.9
|
|
XOCHIMILCO
|
1,786
|
12.6
|
Mientras que las alcaldías mas beneficiadas fueron Iztapalapa (13.9%), Xochimilco (12.6) y Venustiano Carranza (8.9), las cuales concuerdan con ser las delegaciones con mayor rezago social y carencias en la CDMX por lo que se intuye que el programa resulto beneficiar a las alcaldías más necesitadas.
También se analizan las raciones de comida otorgadas en las distintas alcaldias, cuyos resultados son los siguientes:
Tabla 7. Reciones de comida desagregadas por delegación
|
Alcaldia
|
Raciones
|
Porcentaje
|
|
ÃLVARO OBREGÓN
|
4,600
|
6.8
|
|
AZCAPOTZALCO
|
2,410
|
3.6
|
|
BENITO JUÃREZ
|
700
|
1.0
|
|
COYOACÃN
|
1,220
|
1.8
|
|
CUAJIMALPA
|
1,970
|
2.9
|
|
CUAUHTÉMOC
|
2,470
|
3.7
|
|
GUSTAVO A. MADERO
|
7,960
|
11.8
|
|
IZTACALCO
|
3,650
|
5.4
|
|
IZTAPALAPA
|
12,345
|
18.3
|
|
LA MAGDALENA CONTRERAS
|
2,698
|
4.0
|
|
MIGUEL HIDALGO
|
1,080
|
1.6
|
|
MILPA ALTA
|
5,770
|
8.6
|
|
TLÃHUAC
|
6,040
|
9.0
|
|
TLALPAN
|
5,425
|
8.1
|
|
VENUSTIANO CARRANZA
|
2,660
|
3.9
|
|
XOCHIMILCO
|
6,380
|
9.5
|
Analisis de los ingresos de la CDMX
En cuanto al análisis de los ingresos de la CDMX en 2019 el ingreso por aprovechamientos había resultado mayor al estimado en 43.8% lo cual se repite en 2020 con un 111% por encima del estimado, sin embargo al primer trimestre del 2021 esto ya no ocurre y presenta estar por debajo del estimado en un 25.3%, mientras que para el mismo periodo la mayor recaudación se logra a partir de participaciones, aportaciones e incentivos derivados de la colaboración fiscal con una recaudación 7.9% mayor al estimado.
Tabla 8. Ingresos por clasificación
|
|
2019
|
2020
|
2021 1T
|
|
Rubro
|
Estimado
|
Recaudado
|
% Est
|
Estimado
|
Recaudado
|
% Est
|
Estimado
|
Recaudado
|
% Est
|
|
Aprovechamientos
|
6,178,236,643
|
8,886,476,825
|
43.8
|
5,042,778,314
|
10,679,951,414
|
111.8
|
1,480,425,351
|
1,105,177,943
|
-25.3
|
|
Cuotas y Aportaciones de Seguridad Social
|
3,691,438,115
|
3,933,907,040
|
6.6
|
3,816,426,144
|
3,675,317,879
|
-3.7
|
1,096,055,735
|
1,018,018,654
|
-7.1
|
|
Derechos
|
14,403,345,782
|
13,212,886,818
|
-8.3
|
13,866,943,513
|
11,088,473,077
|
-20.0
|
3,992,477,300
|
4,174,313,108
|
4.6
|
|
Impuestos
|
57,390,738,966
|
58,800,054,107
|
2.5
|
60,151,295,266
|
55,966,146,139
|
-7.0
|
28,400,622,539
|
25,658,067,681
|
-9.7
|
|
Ingresos Derivados de Financiamientos
|
5,500,000,000
|
5,500,000,000
|
0.0
|
4,000,000,000
|
3,112,106,673
|
-22.2
|
-1,563,218,883
|
-1,563,218,883
|
0.0
|
|
Ingresos por Venta de Bienes, Prestación de Servicios y Otros Ingresos
|
12,653,260,048
|
20,539,688,436
|
62.3
|
13,115,741,459
|
18,868,324,972
|
43.9
|
2,251,610,887
|
2,313,235,613
|
2.7
|
|
Participaciones, Aportaciones, Convenios, Incentivos Derivados de la Colaboración Fiscal y Fondos Distintos de Aportaciones
|
119,408,677,543
|
123,031,903,625
|
3.0
|
123,212,873,955
|
119,291,074,567
|
-3.2
|
28,595,754,138
|
30,847,515,931
|
7.9
|
|
Productos
|
14,790,628,478
|
15,107,798,356
|
2.1
|
15,769,734,565
|
12,846,545,184
|
-18.5
|
4,280,739,331
|
2,353,383,356
|
-45.0
|
Tabla 9. Ingresos por rubro
|
|
2019
|
2020
|
2021 1T
|
|
Rubro
|
Estimado
|
Recaudado
|
% Est
|
Estimado
|
Recaudado
|
% Est
|
Estimado
|
Recaudado
|
% Est
|
|
Endeudamiento
|
5,500,000,000
|
5,500,000,000
|
0
|
4,000,000,000
|
3,112,106,673
|
-22.2
|
-1,563,218,883
|
-1,563,218,883
|
0.0
|
|
Ingresos del Sector Paraestatal
|
16,344,698,163
|
24,473,595,476
|
0
|
16,932,167,603
|
22,543,642,851
|
33.1
|
3,347,666,622
|
3,331,254,267
|
-0.5
|
|
Ingresos locales
|
92,762,949,869
|
96,007,216,105
|
0
|
94,830,751,658
|
90,581,115,814
|
-4.5
|
38,154,264,521
|
33,290,942,088
|
-12.7
|
|
Recursos federales
|
119,408,677,543
|
123,031,903,625
|
0
|
123,212,873,955
|
119,291,074,567
|
-3.2
|
28,595,754,138
|
30,847,515,931
|
7.9
|
Construcción con índice de movilidad
Con el análisis de los datos de los ingresos en las distintas líneas del metro se construye un índice de movilidad.
Tomando en cuenta las 11 líneas del metro por cada una se obtiene una serie de tiempo que representa los ingresos diarios por tarjeta, ubicando el punto máximo y dividiendo los demás datos entre este para construir el índice como lo indica la formula:
\[Indice_{Ln}= \frac{Dato_n}{Max(x)}\]
\[Indice=Indice_{L1}+Indice_{L2}+Indice_{L3}+...+Indice_{L11}\]
Figura 14. Índice de movilidad
Fuente:
Datos abiertos de la Ciudad de México