CALCULAR TASA DE NATALIDAD (por 1,000 habitantes)
Es importante recordar que se trabajará con una base de datos
externa, por lo tanto será llamada al script y se accederá a ella por
medio del nombre “df”.
# -> CALCULAR TASA DE NATALIDAD
# Obtención de df
df <- read.csv('/Volumes/JESUS SSD/TRABAJOS EPIGENETICA/estadisticas_vitales_mexico_2018_2021.csv')
# Datos
nacimientos <- df$nacimientos_registrados # Número de nacimientos en un año
total_poblacion <- df$poblacion_total # Población total en ese año
# Cálculo de la tasa de natalidad
tasa_natalidad <- (nacimientos / total_poblacion) * 1000
# Resultado
cat("Tasa de natalidad:",
# decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
mean(tasa_natalidad, na.rm = TRUE),
"nacimientos por cada 1,000 habitantes durante el periodo 2018-2021\n")
Tasa de natalidad: 15.49277 nacimientos por cada 1,000 habitantes durante el periodo 2018-2021
df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000
df[, c("año", "tasa_natalidad")]
NA
SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.
# Visualización
library(ggplot2)
# calcular tasas de natalidad
df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000
# Gráfico
ggplot(df, aes(x = año, y = tasa_natalidad, fill = año)) +
geom_bar(stat = "identity") +
geom_text(aes(label = round(tasa_natalidad, 2)), vjust = -0.3, size = 4
) +
labs(title = "Tasa de natalidad por año", x = "Año", y = "Tasa de natalidad (por 1,000 habitantes)"
) +
theme_classic()

CALCULAR TASA DE MORTALIDAD (por 1,000 habitantes)
# Calculo de la tasa de mortalidad
tasa_mortalidad <- (df$defunciones_registradas/df$poblacion_total) * 1000
df$tasa_mortalidad <- (df$defunciones_registradas / df$poblacion_total) * 1000
df[, c("año", "tasa_mortalidad")]
# Resultado
cat("Tasa de mortalidad:",
# decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
mean(tasa_mortalidad, na.rm = TRUE),
"muertes por cada 1,000 habitantes durante el periodo 2018-2021\n")
Tasa de mortalidad: 7.303069 muertes por cada 1,000 habitantes durante el periodo 2018-2021
SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

CALCULAR INCREMENTO NATURAL (por 1,000 habitantes)
La formula para calcular el incremento natural es:
Tasa de natalidad - Tasa de mortalidad = Incremento
natural
incremento_natural <- (tasa_natalidad - tasa_mortalidad)
df$incremento_natural <- df$tasa_natalidad - df$tasa_mortalidad
df[, c("año", "incremento_natural")]
# Resultado
cat("Incremento natural",
# decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
mean(incremento_natural, na.rm = TRUE),
"por cada 1,000 habitantes durante el periodo 2018-2021\n")
Incremento natural 8.189702 por cada 1,000 habitantes durante el periodo 2018-2021
str(df)
'data.frame': 4 obs. of 9 variables:
$ año : int 2018 2019 2020 2021
$ poblacion_total : int 124738000 125930000 126014024 126705138
$ nacimientos_registrados : int 2162535 2092214 1629211 1912178
$ defunciones_registradas : int 722611 747784 1086743 1122249
$ incremento_natural : num 11.54 10.68 4.3 6.23
$ casos_covid_confirmados : int 0 0 1437185 NA
$ defunciones_covid_confirmadas: int 0 0 126507 NA
$ tasa_natalidad : num 17.3 16.6 12.9 15.1
$ tasa_mortalidad : num 5.79 5.94 8.62 8.86
SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.
library(ggplot2)
ggplot(df, aes(x = año, y = incremento_natural)) +
geom_line(linewidth = 1) +
geom_point(size = 3) +
geom_text(
aes(label = round(incremento_natural, 2)),
vjust = -1.5,
size = 4
) +
scale_y_continuous(expand = expansion(mult = c(0.05, 0.2))) +
labs(
title = "Dinámica del incremento natural de la población",
x = "Año",
y = "Incremento natural (por cada 1,000 habitantes)"
) +
theme_minimal()

CALCULAR TASA DE LETALIDAD POR COVID-19 (%) DONDE EXISTAN CASOS
# Resultado
cat("Letalidad por Covid-19 fue de",
# decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
mean(porc_letalidad, na.rm = TRUE),
"% durante 2020.\n ")
Letalidad por Covid-19 fue de 8.802416 % durante 2020.
df$letalidad_covid <- (df$defunciones_covid_confirmadas / df$casos_covid_confirmados) * 100
df[, c("año", "letalidad_covid")]
df_letalidad <- df[df$casos_covid_confirmados > 0, c("año", "letalidad_covid")]
df_letalidad
NA
La letalidad solo se calculó para el año en el que se registraron
casos confirmados, ya que en los otros años no hubo casos, por lo que la
letalidad no es estadísticamente calculable.
SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.
letalidad_valida <- letalidad[!is.na(letalidad) & !is.nan(letalidad)]
valores <- c(
Letalidad = letalidad_valida,
"No letalidad" = 1 - letalidad_valida
)
pie(
valores,
labels = paste0(names(valores), ": ", round(valores * 100, 2), "%"),
main = "Letalidad por Covid-19 en el año 2020",
col = c("firebrick", "blue")
)

USO DE FLEXTABLE
Petición:
Construye una con flextable que incluya: anio, poblacion_total,
nacimientos_registrados, defunciones_registradas, incremento_natural y
las tasas calculadas.
# Crear el conjunto de datos
library(flextable)
datos <- data.frame(
año = c(2018, 2019, 2020, 2021),
poblacion_total = c(124738000, 125930000, 126014024, 126705138),
nacimientos_registrados = c(2162535, 2092214, 1629211, 1912178),
defunciones_registradas = c(722611, 747784, 1086743, 1122249),
casos_covid_confirmados = c(0, 0, 1437185, 0),
defunciones_covid_confirmadas = c(0, 0, 126507, 0)
)
datos$tasa_natalidad <- (datos$nacimientos_registrados /
datos$poblacion_total) * 1000
datos$tasa_mortalidad <- (datos$defunciones_registradas /
datos$poblacion_total) * 1000
datos$incremento_natural <- datos$tasa_natalidad - datos$tasa_mortalidad
datos$tasa_letalidad <- (datos$defunciones_covid_confirmadas / datos$casos_covid_confirmados) * 100
# Redondear solo columnas númericas
datos_redondeados <- datos %>%
mutate_if(is.numeric, round, 2)
# Crear la tabla con flextable
flextable(datos_redondeados) %>%
autofit()
año | poblacion_total | nacimientos_registrados | defunciones_registradas | casos_covid_confirmados | defunciones_covid_confirmadas | tasa_natalidad | tasa_mortalidad | incremento_natural | tasa_letalidad |
|---|
2,018 | 124,738,000 | 2,162,535 | 722,611 | 0 | 0 | 17.34 | 5.79 | 11.54 |
|
2,019 | 125,930,000 | 2,092,214 | 747,784 | 0 | 0 | 16.61 | 5.94 | 10.68 |
|
2,020 | 126,014,024 | 1,629,211 | 1,086,743 | 1,437,185 | 126,507 | 12.93 | 8.62 | 4.30 | 8.8 |
2,021 | 126,705,138 | 1,912,178 | 1,122,249 | 0 | 0 | 15.09 | 8.86 | 6.23 |
|
Preguntas:
¿En qué año se observa la mayor tasa de mortalidad y cómo se
relaciona con la pandemia?
- Se observa un incremento en la mortalidad, se puede entender que la
pandemia incrementó los numeros de muertes en la población.
¿Cómo cambia la tasa de natalidad entre 2018 y 2021?
- Se presentó una reducción de la tasa de natalidad. El año con la
tasa más baja fue en 2020.
¿Qué ocurre con el incremento natural durante ese periodo?
- Cae a pique en 2020 e intenta subir un poco si nivel en 2021, siendo
2018 el año con los números más altos.
¿Qué significa la tasa de letalidad por COVID-19 que obtuviste
para 2020?
- Representa el porcentaje de personas que fallecen entre quienes
padecieron de Covid-19.
---
title: "Análisis de Estadísticas Vitales en México (2018–2021) - TAREA"
author: "LCBM. Jesús Angel Hernández Chávez"
date: "12 de diciembre 2025"
output: html_notebook
---

## CALCULAR TASA DE NATALIDAD (por 1,000 habitantes)

> *Es importante recordar que se trabajará con una base de datos externa, por lo tanto será llamada al script y se accederá a ella por medio del nombre "df".*

```{r}
# -> CALCULAR TASA DE NATALIDAD

# Obtención de df

df <- read.csv('/Volumes/JESUS SSD/TRABAJOS EPIGENETICA/estadisticas_vitales_mexico_2018_2021.csv')

# Datos
nacimientos <- df$nacimientos_registrados # Número de nacimientos en un año 
total_poblacion <- df$poblacion_total # Población total en ese año 


# Cálculo de la tasa de natalidad 
tasa_natalidad <- (nacimientos / total_poblacion) * 1000

# Resultado
cat("Tasa de natalidad:", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(tasa_natalidad, na.rm = TRUE), 
    "nacimientos por cada 1,000 habitantes durante el periodo 2018-2021\n")

df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000

df[, c("año", "tasa_natalidad")]

```

### SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

```{r}
# Visualización 
library(ggplot2)


# calcular tasas de natalidad 
df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000

# Gráfico
ggplot(df, aes(x = año, y = tasa_natalidad, fill = año)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(tasa_natalidad, 2)), vjust = -0.3, size = 4
  ) +
  labs(title = "Tasa de natalidad por año", x = "Año", y = "Tasa de natalidad (por 1,000 habitantes)"
  ) +
  theme_classic()
```

## CALCULAR TASA DE MORTALIDAD (por 1,000 habitantes)

```{r}
# Calculo de la tasa de mortalidad 

tasa_mortalidad <- (df$defunciones_registradas/df$poblacion_total) * 1000

df$tasa_mortalidad <- (df$defunciones_registradas / df$poblacion_total) * 1000

df[, c("año", "tasa_mortalidad")]


# Resultado
cat("Tasa de mortalidad:", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(tasa_mortalidad, na.rm = TRUE), 
    "muertes por cada 1,000 habitantes durante el periodo 2018-2021\n")


```

### SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

```{r}
# Visualización 
library(ggplot2)


# calcular tasas de natalidad 
df$tasa_mortalidad <- (df$defunciones_registradas / df$poblacion_total) * 1000



# Gráfico
ggplot(df, aes(x = año, y = tasa_mortalidad, fill = año)) +
  # geom_col(fill = "steelblue") +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(tasa_mortalidad, 2)), vjust = -0.3, size = 4) +
  labs(title = "Tasa de mortalidad por año", x = "Año", y = "Tasa de mortalidad (por 1,000 habitantes)") +
  theme_classic()
```

## CALCULAR INCREMENTO NATURAL (por 1,000 habitantes)

> La formula para calcular el incremento natural es:
>
> *Tasa de natalidad - Tasa de mortalidad = Incremento natural*

```{r}
incremento_natural <- (tasa_natalidad - tasa_mortalidad)

df$incremento_natural <- df$tasa_natalidad - df$tasa_mortalidad

df[, c("año", "incremento_natural")]

# Resultado
cat("Incremento natural", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(incremento_natural, na.rm = TRUE), 
    "por cada 1,000 habitantes durante el periodo 2018-2021\n")
```

```{r}
str(df)
```


### SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

```{r}
library(ggplot2)

ggplot(df, aes(x = año, y = incremento_natural)) +
  geom_line(linewidth = 1) +
  geom_point(size = 3) +
  geom_text(
    aes(label = round(incremento_natural, 2)),
    vjust = -1.5,
    size = 4
  ) +
  scale_y_continuous(expand = expansion(mult = c(0.05, 0.2))) +
  labs(
    title = "Dinámica del incremento natural de la población",
    x = "Año",
    y = "Incremento natural (por cada 1,000 habitantes)"
  ) +
  theme_minimal()
```

## CALCULAR TASA DE LETALIDAD POR COVID-19 (%) DONDE EXISTAN CASOS

```{r}
# Resultado
cat("Letalidad por Covid-19 fue de", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(porc_letalidad, na.rm = TRUE), 
    "% durante 2020.\n ")

df$letalidad_covid <- (df$defunciones_covid_confirmadas / df$casos_covid_confirmados) * 100

df[, c("año", "letalidad_covid")]

df_letalidad <- df[df$casos_covid_confirmados > 0, c("año", "letalidad_covid")]

df_letalidad

```

> *La letalidad solo se calculó para el año en el que se registraron casos confirmados, ya que en los otros años no hubo casos, por lo que la letalidad no es estadísticamente calculable.*

### SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

```{r}
letalidad_valida <- letalidad[!is.na(letalidad) & !is.nan(letalidad)]
valores <- c(
  Letalidad = letalidad_valida,
  "No letalidad" = 1 - letalidad_valida
)
pie(
  valores,
  labels = paste0(names(valores), ": ", round(valores * 100, 2), "%"),
  main = "Letalidad por Covid-19 en el año 2020",
  col = c("firebrick", "blue")
)
```

### USO DE FLEXTABLE

Petición:

> Construye una con flextable que incluya: anio, poblacion_total, nacimientos_registrados, defunciones_registradas, incremento_natural y las tasas calculadas.

```{r}
# Crear el conjunto de datos 

library(flextable)

datos <- data.frame(
  año = c(2018, 2019, 2020, 2021),
  poblacion_total = c(124738000, 125930000, 126014024, 126705138),
  nacimientos_registrados = c(2162535, 2092214, 1629211, 1912178),
  defunciones_registradas = c(722611, 747784, 1086743, 1122249),
  casos_covid_confirmados = c(0, 0, 1437185, 0),
  defunciones_covid_confirmadas = c(0, 0, 126507, 0)
)

datos$tasa_natalidad <- (datos$nacimientos_registrados /
                         datos$poblacion_total) * 1000

datos$tasa_mortalidad <- (datos$defunciones_registradas /
                          datos$poblacion_total) * 1000

datos$incremento_natural <- datos$tasa_natalidad - datos$tasa_mortalidad

datos$tasa_letalidad <- (datos$defunciones_covid_confirmadas / datos$casos_covid_confirmados) * 100

# Redondear solo columnas númericas
datos_redondeados <- datos %>%
  mutate_if(is.numeric, round, 2)

# Crear la tabla con flextable
flextable(datos_redondeados) %>%
  autofit()
```

### Preguntas:

1.  ¿En qué año se observa la mayor tasa de mortalidad y cómo se relaciona con la pandemia?

    -   Se observa un incremento en la mortalidad, se puede entender que la pandemia incrementó los numeros de muertes en la población.

2.  ¿Cómo cambia la tasa de natalidad entre 2018 y 2021?

    -   Se presentó una reducción de la tasa de natalidad. El año con la tasa más baja fue en 2020.

3.  ¿Qué ocurre con el incremento natural durante ese periodo?

    -   Cae a pique en 2020 e intenta subir un poco si nivel en 2021, siendo 2018 el año con los números más altos.

4.  ¿Qué significa la tasa de letalidad por COVID-19 que obtuviste para 2020?

    -   Representa el porcentaje de personas que fallecen entre quienes padecieron de Covid-19.
