Base SINAC 2008 2021

Tenemos una muestra de 28 Millones de nacimientos, correspondientes a la información del SINAC, sobre los certificados de nacimientos desde el 2008 hasta el 2021 (51 variables).

Los siguientes cuadros tienen la finalidad de describir los tipos de datos, los valores únicos, las distribuciones de las variables y las tendencias.

Data summary
Name Piped data
Number of rows 28342498
Number of columns 51
_______________________
Column type frequency:
character 38
difftime 1
numeric 12
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
entidad_residencia_madre 20 1 6 31 0 38 0
municipio_residencia_madre 12950 1 3 76 0 2363 0
el_hijo_anterior_nacio 0 1 4 28 0 5 0
recibio_atencion_prenatal 0 1 2 15 0 5 0
trimestre_recibio_primera_consulta 0 1 9 17 0 6 0
madre_sobrevivio_al_parto 0 1 2 15 0 5 0
afiliacion_serv_salud 0 1 4 23 0 15 0
escolaridad_madre 0 1 7 44 0 18 0
fecha_nacimiento_nac_vivo 0 1 10 10 0 5114 0
sexo_nac_vivo 0 1 5 15 0 5 0
recibio_vacuna_bcg 0 1 2 15 0 5 0
recibio_vacuna_hep_b 0 1 2 15 0 5 0
recibio_vit_a 0 1 2 15 0 5 0
recibio_vit_k 0 1 2 15 0 5 0
se_realizo_tamiz_auditivo 0 1 2 15 0 5 0
codigo_anomalia 3764 1 3 4 0 1165 0
anomalia_congenita_nac_vivo 2621 1 1 133 0 42442 0
procedimiento_utilizado 0 1 4 15 0 6 0
lugar_de_nacimiento 0 1 4 21 0 15 0
quien_atendio_parto 2 1 3 45 0 13 0
entidad_nacimiento 6 1 6 31 0 34 0
municipio_nacimiento 1068 1 3 76 0 2279 0
entidad_certifico 56 1 6 31 0 34 0
municipio_certifico 1086 1 3 76 0 2255 0
edo_nac_madre 0 1 6 31 0 39 0
mpo_nac_madre 61509 1 3 76 0 2363 0
estado_conyugal 0 1 4 11 0 9 0
vive_aun_hijo_anterior 0 1 2 4 0 5 0
producto_de_un_embarazo 2943 1 4 10 0 4 0
clues 53 1 4 22 0 13834 0
entidad_residencia_madre_cve 0 1 2 2 0 38 0
entidad_nacimiento_cve 0 1 1 5 0 37 0
entidad_certifico_cve 0 1 1 5 0 37 0
edo_nac_madre_cve 0 1 2 2 0 39 0
municipio_residencia_madre_cve 207 1 3 3 0 574 0
municipio_nacimiento_cve 211 1 2 3 0 551 0
municipio_certifico_cve 211 1 2 3 0 553 0
mpo_nac_madre_cve 59 1 2 3 0 575 0

Variable type: difftime

skim_variable n_missing complete_rate min max median n_unique
hora_nacimiento_nac_vivo 424 1 0 secs 86340 secs 44460 secs 1440

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
edad_madre 0 1.00 27.93 49.66 0 20 25 30 999 ▇▁▁▁▁
orden_nacimiento 0 1.00 3.14 9.44 0 1 2 3 99 ▇▁▁▁▁
hijos_nacidos_vivos 0 1.00 2.18 3.55 0 1 2 3 99 ▇▁▁▁▁
total_consultas_recibidas 5321 1.00 9.74 15.03 0 5 7 9 99 ▇▁▁▁▁
semanas_gestacion_nac_vivo 0 1.00 38.93 3.91 0 38 39 40 99 ▁▇▅▁▁
talla_nac_vivo 0 1.00 51.10 8.08 0 49 50 52 99 ▁▁▇▁▁
peso_nac_vivo 0 1.00 3505.33 1597.98 20 2900 3190 3500 9999 ▁▇▁▁▁
valoracion_apgar_nac_vivo 0 1.00 9.77 9.02 0 9 9 9 99 ▇▁▁▁▁
valoracion_silverman_nac_vivo 0 1.00 1.96 12.95 0 0 0 0 99 ▇▁▁▁▁
anio 0 1.00 2014.28 3.91 2008 2011 2014 2018 2021 ▇▇▅▇▆
peso_nac_vivo_ajust 146577 0.99 3510.03 1599.51 25 2900 3200 3500 9999 ▁▇▁▁▁
talla_nac_vivo_ajust 285680 0.99 51.14 8.07 0 49 50 52 99 ▁▁▇▁▁

Según los datos de los certificados, existen aproximadamente 2 millones de nacimientos al año. Se puede observar una tendencia decreciente en los ultimos años.

Scale for x is already present.
Adding another scale for x, which will replace the existing scale.

Divididos en los siguientes estados:

Graficamos las frecuencias de los campos de tipo caracter para descartar algún problema con los datos y además nos ayuda a explorar la base.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.
`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

`summarise()` has grouped output by 'anio'. You can override using the
`.groups` argument.

Ahora analizamos las variables tipo numerico, para identificar outliers. En edad de la madre se encuentran algunos atipicos, pero en general las observaciones se ven consistentes, existe un registro de más de 300 años, claramente ese dato debe ser corregido

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

Scale for y is already present.
Adding another scale for y, which will replace the existing scale.

12,950 registros en municipio_residencia_madre son NA, de esos, 10,426 (80%) registros NA provienen de registros que tienen entidad_residencia_madre valores como: NO ESPECIFICADO, SE IGNORA, NO APLICA, OTROS PAISES DE LATINOAMERICA. 1,763 (14%) son de los estados Quintana Roo y Chiapas y el resto 761 (6%) corresponden a los otros 30 estados. Cabe mencionar que los años en los que se tienen registros NA son 2017, 2018, 2019, 2020, 2021. Aunque en 2017 son muy poco y el 97% de los NA están en los demás años.

`summarise()` has grouped output by 'municipio_residencia_na',
'entidad_residencia_madre'. You can override using the `.groups` argument.
`summarise()` has grouped output by 'municipio_residencia_na',
'entidad_residencia_madre'. You can override using the `.groups` argument.

61,509 registros en mpo_nac_madre son NA, de esos, 39,803 (65%) registros NA provienen de registros que tienen entidad_residencia_madre valores como: NO ESPECIFICADO, SE IGNORA, NO APLICA, OTROS PAISES DE LATINOAMERICA. 16,203 (26%) son de los estados Ciudad de México, México, Oaxaca, Guerrero, Veracruz y Chiapas y el resto 5,503 (9%) corresponden a los otros 26 estados. Cabe mencionar que los años en los que se tienen registros NA son 2017, 2018, 2019, 2020, 2021. Aunque en 2020 y 2021 se concentra el 84% de los NA

`summarise()` has grouped output by 'mpo_nac_madre_na', 'edo_nac_madre'. You
can override using the `.groups` argument.
`summarise()` has grouped output by 'mpo_nac_madre_na', 'edo_nac_madre'. You
can override using the `.groups` argument.