Tenemos una muestra de 28 Millones de nacimientos, correspondientes a la información del SINAC, sobre los certificados de nacimientos desde el 2008 hasta el 2021 (51 variables).
Los siguientes cuadros tienen la finalidad de describir los tipos de datos, los valores únicos, las distribuciones de las variables y las tendencias.
Data summary
| Name |
Piped data |
| Number of rows |
28342498 |
| Number of columns |
51 |
| _______________________ |
|
| Column type frequency: |
|
| character |
38 |
| difftime |
1 |
| numeric |
12 |
| ________________________ |
|
| Group variables |
None |
Variable type: character
| entidad_residencia_madre |
20 |
1 |
6 |
31 |
0 |
38 |
0 |
| municipio_residencia_madre |
12950 |
1 |
3 |
76 |
0 |
2363 |
0 |
| el_hijo_anterior_nacio |
0 |
1 |
4 |
28 |
0 |
5 |
0 |
| recibio_atencion_prenatal |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| trimestre_recibio_primera_consulta |
0 |
1 |
9 |
17 |
0 |
6 |
0 |
| madre_sobrevivio_al_parto |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| afiliacion_serv_salud |
0 |
1 |
4 |
23 |
0 |
15 |
0 |
| escolaridad_madre |
0 |
1 |
7 |
44 |
0 |
18 |
0 |
| fecha_nacimiento_nac_vivo |
0 |
1 |
10 |
10 |
0 |
5114 |
0 |
| sexo_nac_vivo |
0 |
1 |
5 |
15 |
0 |
5 |
0 |
| recibio_vacuna_bcg |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| recibio_vacuna_hep_b |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| recibio_vit_a |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| recibio_vit_k |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| se_realizo_tamiz_auditivo |
0 |
1 |
2 |
15 |
0 |
5 |
0 |
| codigo_anomalia |
3764 |
1 |
3 |
4 |
0 |
1165 |
0 |
| anomalia_congenita_nac_vivo |
2621 |
1 |
1 |
133 |
0 |
42442 |
0 |
| procedimiento_utilizado |
0 |
1 |
4 |
15 |
0 |
6 |
0 |
| lugar_de_nacimiento |
0 |
1 |
4 |
21 |
0 |
15 |
0 |
| quien_atendio_parto |
2 |
1 |
3 |
45 |
0 |
13 |
0 |
| entidad_nacimiento |
6 |
1 |
6 |
31 |
0 |
34 |
0 |
| municipio_nacimiento |
1068 |
1 |
3 |
76 |
0 |
2279 |
0 |
| entidad_certifico |
56 |
1 |
6 |
31 |
0 |
34 |
0 |
| municipio_certifico |
1086 |
1 |
3 |
76 |
0 |
2255 |
0 |
| edo_nac_madre |
0 |
1 |
6 |
31 |
0 |
39 |
0 |
| mpo_nac_madre |
61509 |
1 |
3 |
76 |
0 |
2363 |
0 |
| estado_conyugal |
0 |
1 |
4 |
11 |
0 |
9 |
0 |
| vive_aun_hijo_anterior |
0 |
1 |
2 |
4 |
0 |
5 |
0 |
| producto_de_un_embarazo |
2943 |
1 |
4 |
10 |
0 |
4 |
0 |
| clues |
53 |
1 |
4 |
22 |
0 |
13834 |
0 |
| entidad_residencia_madre_cve |
0 |
1 |
2 |
2 |
0 |
38 |
0 |
| entidad_nacimiento_cve |
0 |
1 |
1 |
5 |
0 |
37 |
0 |
| entidad_certifico_cve |
0 |
1 |
1 |
5 |
0 |
37 |
0 |
| edo_nac_madre_cve |
0 |
1 |
2 |
2 |
0 |
39 |
0 |
| municipio_residencia_madre_cve |
207 |
1 |
3 |
3 |
0 |
574 |
0 |
| municipio_nacimiento_cve |
211 |
1 |
2 |
3 |
0 |
551 |
0 |
| municipio_certifico_cve |
211 |
1 |
2 |
3 |
0 |
553 |
0 |
| mpo_nac_madre_cve |
59 |
1 |
2 |
3 |
0 |
575 |
0 |
Variable type: difftime
| hora_nacimiento_nac_vivo |
424 |
1 |
0 secs |
86340 secs |
44460 secs |
1440 |
Variable type: numeric
| edad_madre |
0 |
1.00 |
27.93 |
49.66 |
0 |
20 |
25 |
30 |
999 |
▇▁▁▁▁ |
| orden_nacimiento |
0 |
1.00 |
3.14 |
9.44 |
0 |
1 |
2 |
3 |
99 |
▇▁▁▁▁ |
| hijos_nacidos_vivos |
0 |
1.00 |
2.18 |
3.55 |
0 |
1 |
2 |
3 |
99 |
▇▁▁▁▁ |
| total_consultas_recibidas |
5321 |
1.00 |
9.74 |
15.03 |
0 |
5 |
7 |
9 |
99 |
▇▁▁▁▁ |
| semanas_gestacion_nac_vivo |
0 |
1.00 |
38.93 |
3.91 |
0 |
38 |
39 |
40 |
99 |
▁▇▅▁▁ |
| talla_nac_vivo |
0 |
1.00 |
51.10 |
8.08 |
0 |
49 |
50 |
52 |
99 |
▁▁▇▁▁ |
| peso_nac_vivo |
0 |
1.00 |
3505.33 |
1597.98 |
20 |
2900 |
3190 |
3500 |
9999 |
▁▇▁▁▁ |
| valoracion_apgar_nac_vivo |
0 |
1.00 |
9.77 |
9.02 |
0 |
9 |
9 |
9 |
99 |
▇▁▁▁▁ |
| valoracion_silverman_nac_vivo |
0 |
1.00 |
1.96 |
12.95 |
0 |
0 |
0 |
0 |
99 |
▇▁▁▁▁ |
| anio |
0 |
1.00 |
2014.28 |
3.91 |
2008 |
2011 |
2014 |
2018 |
2021 |
▇▇▅▇▆ |
| peso_nac_vivo_ajust |
146577 |
0.99 |
3510.03 |
1599.51 |
25 |
2900 |
3200 |
3500 |
9999 |
▁▇▁▁▁ |
| talla_nac_vivo_ajust |
285680 |
0.99 |
51.14 |
8.07 |
0 |
49 |
50 |
52 |
99 |
▁▁▇▁▁ |
Según los datos de los certificados, existen aproximadamente 2 millones de nacimientos al año. Se puede observar una tendencia decreciente en los ultimos años.
Scale for x is already present.
Adding another scale for x, which will replace the existing scale.
Divididos en los siguientes estados:
Graficamos las frecuencias de los campos de tipo caracter para descartar algún problema con los datos y además nos ayuda a explorar la base.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
Ahora analizamos las variables tipo numerico, para identificar outliers. En edad de la madre se encuentran algunos atipicos, pero en general las observaciones se ven consistentes, existe un registro de más de 300 años, claramente ese dato debe ser corregido
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
Scale for y is already present.
Adding another scale for y, which will replace the existing scale.
12,950 registros en municipio_residencia_madre son NA, de esos, 10,426 (80%) registros NA provienen de registros que tienen entidad_residencia_madre valores como: NO ESPECIFICADO, SE IGNORA, NO APLICA, OTROS PAISES DE LATINOAMERICA. 1,763 (14%) son de los estados Quintana Roo y Chiapas y el resto 761 (6%) corresponden a los otros 30 estados. Cabe mencionar que los años en los que se tienen registros NA son 2017, 2018, 2019, 2020, 2021. Aunque en 2017 son muy poco y el 97% de los NA están en los demás años.
`summarise()` has grouped output by 'municipio_residencia_na',
'entidad_residencia_madre'. You can override using the `.groups` argument.
`summarise()` has grouped output by 'municipio_residencia_na',
'entidad_residencia_madre'. You can override using the `.groups` argument.
61,509 registros en mpo_nac_madre son NA, de esos, 39,803 (65%) registros NA provienen de registros que tienen entidad_residencia_madre valores como: NO ESPECIFICADO, SE IGNORA, NO APLICA, OTROS PAISES DE LATINOAMERICA. 16,203 (26%) son de los estados Ciudad de México, México, Oaxaca, Guerrero, Veracruz y Chiapas y el resto 5,503 (9%) corresponden a los otros 26 estados. Cabe mencionar que los años en los que se tienen registros NA son 2017, 2018, 2019, 2020, 2021. Aunque en 2020 y 2021 se concentra el 84% de los NA
`summarise()` has grouped output by 'mpo_nac_madre_na', 'edo_nac_madre'. You
can override using the `.groups` argument.
`summarise()` has grouped output by 'mpo_nac_madre_na', 'edo_nac_madre'. You
can override using the `.groups` argument.