CALCULAR TASA DE NATALIDAD (por 1,000 habitantes)

Es importante recordar que se trabajará con una base de datos externa, por lo tanto será llamada al script y se accederá a ella por medio del nombre “df”.

# -> CALCULAR TASA DE NATALIDAD

# Obtención de df

df <- read.csv('/Volumes/JESUS SSD/TRABAJOS EPIGENETICA/estadisticas_vitales_mexico_2018_2021.csv')

# Datos
nacimientos <- df$nacimientos_registrados # Número de nacimientos en un año 
total_poblacion <- df$poblacion_total # Población total en ese año 


# Cálculo de la tasa de natalidad 
tasa_natalidad <- (nacimientos / total_poblacion) * 1000

# Resultado
cat("Tasa de natalidad:", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(tasa_natalidad, na.rm = TRUE), 
    "nacimientos por cada 1,000 habitantes durante el periodo 2018-2021\n")
Tasa de natalidad: 15.49277 nacimientos por cada 1,000 habitantes durante el periodo 2018-2021
df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000

df[, c("año", "tasa_natalidad")]
NA

SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

# Visualización 
library(ggplot2)


# calcular tasas de natalidad 
df$tasa_natalidad <- (df$nacimientos_registrados / df$poblacion_total) * 1000

# Gráfico
ggplot(df, aes(x = año, y = tasa_natalidad, fill = año)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(tasa_natalidad, 2)), vjust = -0.3, size = 4
  ) +
  labs(title = "Tasa de natalidad por año", x = "Año", y = "Tasa de natalidad (por 1,000 habitantes)"
  ) +
  theme_classic()

CALCULAR TASA DE MORTALIDAD (por 1,000 habitantes)

# Calculo de la tasa de mortalidad 

tasa_mortalidad <- (df$defunciones_registradas/df$poblacion_total) * 1000

df$tasa_mortalidad <- (df$defunciones_registradas / df$poblacion_total) * 1000

df[, c("año", "tasa_mortalidad")]


# Resultado
cat("Tasa de mortalidad:", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(tasa_mortalidad, na.rm = TRUE), 
    "muertes por cada 1,000 habitantes durante el periodo 2018-2021\n")
Tasa de mortalidad: 7.303069 muertes por cada 1,000 habitantes durante el periodo 2018-2021

SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

CALCULAR INCREMENTO NATURAL (por 1,000 habitantes)

La formula para calcular el incremento natural es:

Tasa de natalidad - Tasa de mortalidad = Incremento natural

incremento_natural <- (tasa_natalidad - tasa_mortalidad)

df$incremento_natural <- df$tasa_natalidad - df$tasa_mortalidad

df[, c("año", "incremento_natural")]

# Resultado
cat("Incremento natural", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(incremento_natural, na.rm = TRUE), 
    "por cada 1,000 habitantes durante el periodo 2018-2021\n")
Incremento natural 8.189702 por cada 1,000 habitantes durante el periodo 2018-2021
str(df)
'data.frame':   4 obs. of  9 variables:
 $ año                          : int  2018 2019 2020 2021
 $ poblacion_total              : int  124738000 125930000 126014024 126705138
 $ nacimientos_registrados      : int  2162535 2092214 1629211 1912178
 $ defunciones_registradas      : int  722611 747784 1086743 1122249
 $ incremento_natural           : num  11.54 10.68 4.3 6.23
 $ casos_covid_confirmados      : int  0 0 1437185 NA
 $ defunciones_covid_confirmadas: int  0 0 126507 NA
 $ tasa_natalidad               : num  17.3 16.6 12.9 15.1
 $ tasa_mortalidad              : num  5.79 5.94 8.62 8.86

SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

library(ggplot2)

ggplot(df, aes(x = año, y = incremento_natural)) +
  geom_line(linewidth = 1) +
  geom_point(size = 3) +
  geom_text(
    aes(label = round(incremento_natural, 2)),
    vjust = -1.5,
    size = 4
  ) +
  scale_y_continuous(expand = expansion(mult = c(0.05, 0.2))) +
  labs(
    title = "Dinámica del incremento natural de la población",
    x = "Año",
    y = "Incremento natural (por cada 1,000 habitantes)"
  ) +
  theme_minimal()

CALCULAR TASA DE LETALIDAD POR COVID-19 (%) DONDE EXISTAN CASOS

# Resultado
cat("Letalidad por Covid-19 fue de", 
    # decidí sacar el promedio porque de la forma básica me arroja 3 vectores.
    mean(porc_letalidad, na.rm = TRUE), 
    "% durante 2020.\n ")
Letalidad por Covid-19 fue de 8.802416 % durante 2020.
 
df$letalidad_covid <- (df$defunciones_covid_confirmadas / df$casos_covid_confirmados) * 100

df[, c("año", "letalidad_covid")]

df_letalidad <- df[df$casos_covid_confirmados > 0, c("año", "letalidad_covid")]

df_letalidad
NA

La letalidad solo se calculó para el año en el que se registraron casos confirmados, ya que en los otros años no hubo casos, por lo que la letalidad no es estadísticamente calculable.

SE HARÁ USO DE LA LIBRERIA ggplot2 PARA VISUALIZAR LOS DATOS.

letalidad_valida <- letalidad[!is.na(letalidad) & !is.nan(letalidad)]
valores <- c(
  Letalidad = letalidad_valida,
  "No letalidad" = 1 - letalidad_valida
)
pie(
  valores,
  labels = paste0(names(valores), ": ", round(valores * 100, 2), "%"),
  main = "Letalidad por Covid-19 en el año 2020",
  col = c("firebrick", "blue")
)

USO DE FLEXTABLE

Petición:

Construye una con flextable que incluya: anio, poblacion_total, nacimientos_registrados, defunciones_registradas, incremento_natural y las tasas calculadas.

# Crear el conjunto de datos 

library(flextable)

datos <- data.frame(
  año = c(2018, 2019, 2020, 2021),
  poblacion_total = c(124738000, 125930000, 126014024, 126705138),
  nacimientos_registrados = c(2162535, 2092214, 1629211, 1912178),
  defunciones_registradas = c(722611, 747784, 1086743, 1122249),
  casos_covid_confirmados = c(0, 0, 1437185, 0),
  defunciones_covid_confirmadas = c(0, 0, 126507, 0)
)

datos$tasa_natalidad <- (datos$nacimientos_registrados /
                         datos$poblacion_total) * 1000

datos$tasa_mortalidad <- (datos$defunciones_registradas /
                          datos$poblacion_total) * 1000

datos$incremento_natural <- datos$tasa_natalidad - datos$tasa_mortalidad

datos$tasa_letalidad <- (datos$defunciones_covid_confirmadas / datos$casos_covid_confirmados) * 100

# Redondear solo columnas númericas
datos_redondeados <- datos %>%
  mutate_if(is.numeric, round, 2)

# Crear la tabla con flextable
flextable(datos_redondeados) %>%
  autofit()

año

poblacion_total

nacimientos_registrados

defunciones_registradas

casos_covid_confirmados

defunciones_covid_confirmadas

tasa_natalidad

tasa_mortalidad

incremento_natural

tasa_letalidad

2,018

124,738,000

2,162,535

722,611

0

0

17.34

5.79

11.54

2,019

125,930,000

2,092,214

747,784

0

0

16.61

5.94

10.68

2,020

126,014,024

1,629,211

1,086,743

1,437,185

126,507

12.93

8.62

4.30

8.8

2,021

126,705,138

1,912,178

1,122,249

0

0

15.09

8.86

6.23

Preguntas:

  1. ¿En qué año se observa la mayor tasa de mortalidad y cómo se relaciona con la pandemia?

    • Se observa un incremento en la mortalidad, se puede entender que la pandemia incrementó los numeros de muertes en la población.
  2. ¿Cómo cambia la tasa de natalidad entre 2018 y 2021?

    • Se presentó una reducción de la tasa de natalidad. El año con la tasa más baja fue en 2020.
  3. ¿Qué ocurre con el incremento natural durante ese periodo?

    • Cae a pique en 2020 e intenta subir un poco si nivel en 2021, siendo 2018 el año con los números más altos.
  4. ¿Qué significa la tasa de letalidad por COVID-19 que obtuviste para 2020?

    • Representa el porcentaje de personas que fallecen entre quienes padecieron de Covid-19.
