#Crear un vector de datos

datos <- c(100, 200, 300, 400, 500)

#Calcular el total y promedio

total <- sum(datos)
promedio <- mean(datos)

#Mostrar resultados

cat("Total:", total, "\n")
Total: 1500 
cat("Promedio;", promedio, "\n")
Promedio; 300 

Graficar los datos con ggplot2 library(ggplot2) df <- data.frame (x = 1:5, y = datos) LO antes mencionado es una formula para crear una data.frame donde en “X = 1:5” significa que estoy indicando que serán 1 columna y 5 filas respectivamente.

df <- data.frame (x = 1:5, y = datos) 
df

Paleta de hex color para definir a traves de un codigo el color El simbolo “+” añade una linea de codigo que en ggplot es como una

library("ggplot2")
ggplot(df, aes(x = x, y = y)) +
  geom_bar(stat = "identity", fill = "#a346f0") +
  scale_x_continuous(breaks = 1:5,
                     labels = c("Edad", "Peso", "C", "D", "E")) +
  labs(title = "grafico de barras", x = "Índice", y = "Valores")

PARA RENOMBRAR EN ESCALA: scale_x_continuous(breaks = 1:5, labels = c(“Edad”, “Peso”, “C”, “D”, “E”)) +

PARA RENOMBRAR COMO FACTOR: library(ggplot2)

library(ggplot2)

ggplot(df, aes(x = factor(x, labels = c(“A”, “B”, “C”, “D”, “E”)), y = y)) + geom_bar(stat = “identity”, fill = “#fc03df”) + labs(title = “Gráfico de barras”, x = “Índice”, y = “Valores”)

install.packages("gapminder")
library("gapminder")
#install.packages("tidyverse")
library("tidyverse")

gapdata2007 <- gapminder %>% filter(year == 2007)

gapdata2007$year
  [1] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [10] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [19] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [28] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [37] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [46] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [55] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [64] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [73] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [82] 2007 2007 2007 2007 2007 2007 2007 2007 2007
 [91] 2007 2007 2007 2007 2007 2007 2007 2007 2007
[100] 2007 2007 2007 2007 2007 2007 2007 2007 2007
[109] 2007 2007 2007 2007 2007 2007 2007 2007 2007
[118] 2007 2007 2007 2007 2007 2007 2007 2007 2007
[127] 2007 2007 2007 2007 2007 2007 2007 2007 2007
[136] 2007 2007 2007 2007 2007 2007 2007

Escoger objetos geometricos geom_point() aes()

gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8)

shape es para elegir como quieres la forma en la que se representan los valores en la grafica 0 cuadrado 1 circulo 2 triangulo 4 x 8 * 15 cuadrado relleno 16 circulo relleno 17 triangulo relleno 21 circulo relleno con contorno 22 cuadrado relleno con contorno 23 rombo relleno con contorno

Se puede separar todo en varias graficas agregando una linea extra al codigo

facet_wrap(continent)

gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8) +
  facet_wrap(~continent)

Elegir el fondo: default theme_bw theme_dark theme_classic

gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8) +
  facet_wrap(~continent) +
  theme_bw()

¿Qué son las Estadísticas Vitales? Las estadísticas vitales son métricas clave que permiten analizar el estado de salud de una población. Entre las más comunes se encuentran:

Tasa de mortalidad: Número de muertes por cada 1,000 habitantes.

Tasa de letalidad: Porcentaje de personas fallecidas entre las que padecieron una enfermedad específica.

Crear un Dataset Ficticio Usaremos un conjunto de datos ficticio para realizar los cálculos:

# Crear un conjunto de datos ficticio
datos <- data.frame(
  region = c("Norte", "Sur", "Este", "Oeste"),
  poblacion = c(100000, 75000, 50000, 60000),
  nacimientos = c(1200, 800, 600, 700),
  muertes = c(900, 500, 300, 400),
  casos_enfermedad = c(1500, 1000, 800, 900),
  fallecidos_enfermedad = c(200, 150, 100, 120)
)

# Mostrar los primeros datos
print(datos)

Tasa de Mortalidad ¿Qué es la Tasa de Mortalidad? La Tasa de Mortalidad mide el número de muertes en una población por cada 1,000 habitantes durante un período determinado.

Es una métrica crucial para evaluar el impacto de factores que afectan la salud pública.

Fórmula La fórmula general para calcular la Tasa de Mortalidad es:

Numero de muertes / población total * 1000

Donde:

Población Total: Número total de habitantes en la población.

# Datos
muertes <- 900  # Número de muertes en un año
poblacion_total <- 100000  # Población total en ese año

# Cálculo de la tasa de mortalidad
tasa_mortalidad <- (muertes / poblacion_total) * 1000

# Resultado
cat("Tasa de mortalidad:", tasa_mortalidad, "muertes por cada 1,000 habitantes\n")
Tasa de mortalidad: 9 muertes por cada 1,000 habitantes

Visualización de Tasa de Mortalidad Usamos un gráfico de barras para visualizar las tasas de mortalidad en diferentes regiones:

library(ggplot2)

str(datos)
'data.frame':   4 obs. of  6 variables:
 $ region               : chr  "Norte" "Sur" "Este" "Oeste"
 $ poblacion            : num  100000 75000 50000 60000
 $ nacimientos          : num  1200 800 600 700
 $ muertes              : num  900 500 300 400
 $ casos_enfermedad     : num  1500 1000 800 900
 $ fallecidos_enfermedad: num  200 150 100 120
print(datos)
library(ggplot2)
# Calcular tasas de mortalidad

datos$tasa_mortalidad <- (datos$muertes / datos$poblacion) * 1000

print(datos)

GRAFICOS:

# Gráfico
ggplot(datos, aes(x = region, y = tasa_mortalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Mortalidad por Región", x = "Región", y = "Tasa de Mortalidad (por 1,000 habitantes)") +
  theme_classic()

Conclusión La Tasa de Mortalidad es un indicador fundamental para medir el impacto de condiciones de salud y factores socioeconómicos en una población.

Comparar tasas entre regiones puede ayudar a identificar áreas que necesitan mayor atención.

Tasa de Letalidad ¿Qué es la Tasa de Letalidad? La Tasa de Letalidad mide el porcentaje de personas fallecidas entre las que han padecido una enfermedad específica.

Es una métrica crucial para evaluar la gravedad de una enfermedad y la efectividad de las intervenciones médicas.

Fórmula La fórmula general para calcular la Tasa de Letalidad es:

Tasa de letalidad = numero de fallecidos / numero de casos * 100 =

Donde:

-Número de Casos: Total de personas diagnosticadas con la enfermedad.

Implementación en R Calculemos la Tasa de Letalidad usando un ejemplo práctico:

Datos_fallecidos <- 200 # Número de fallecidos por la enfermedad 
casos <- 1500 # Número total de casos registrados

# Cálculo de la tasa de letalidad

tasa_letalidad <- (Datos_fallecidos / casos) * 100

# Resultado

cat("Tasa de letalidad:", tasa_letalidad, "% de los casos fallecen\n")
Tasa de letalidad: 13.33333 % de los casos fallecen
# Calcular tasas de letalidad
datos$tasa_letalidad <- (datos$fallecidos / datos$casos) * 100                
# Gráfico
ggplot(datos, aes(x = region, y = tasa_letalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Letalidad por Región",
       x = "Región", y = "Tasa de Letalidad (%)") +
  theme_minimal()

Conclusión La Tasa de Letalidad es un indicador clave para evaluar la severidad de una enfermedad y el impacto de las intervenciones médicas. Un análisis detallado puede ayudar a identificar áreas prioritarias para la asignación de recursos.

Tasa de Natalidad ¿Qué es la Tasa de Natalidad? La Tasa de Natalidad mide el número de nacimientos en una población por cada 1,000 habitantes durante un período determinado.

Es una métrica clave para analizar la dinámica poblacional y evaluar tendencias demográficas.

Fórmula La fórmula general para calcular la Tasa de Natalidad es:

Tasa de natalidad = numero de nacimientos / total de la población * 1000 =

Implementación en R Calculemos la Tasa de Natalidad usando un ejemplo práctico:

# Datos

nacimientos <- 1500  # Número de nacimientos en un año
poblacion_total <- 100000  # Población total en ese año

# Cálculo de la tasa de natalidad
tasa_natalidad <- (nacimientos / poblacion_total) * 1000

# Resultado
cat("Tasa de natalidad:", tasa_natalidad, "nacimientos por cada 1,000 habitantes\n")
Tasa de natalidad: 15 nacimientos por cada 1,000 habitantes
datos
# Calcular tasas de natalidad
datos$tasa_natalidad <- (datos$nacimientos / datos$poblacion) * 1000

# Gráfico
ggplot(datos, aes(x = region, y = tasa_natalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Natalidad por Región",
       x = "Región", y = "Tasa de Natalidad (por 1,000 habitantes)") +
  theme_minimal()

Conclusión La Tasa de Natalidad es una herramienta esencial en epidemiología para entender la dinámica poblacional. Usarla en conjunto con otras métricas puede proporcionar una visión completa de las tendencias demográficas y necesidades de salud pública.

Ventajas de flextable: Interactividad: Permite crear tablas fácilmente exportables a Word o PowerPoint.

Estilo Personalizable: Cambia colores, fuentes y bordes sin complicaciones.

Soporte para Reportes: Ideal para informes en formatos reproducibles.

Ambas opciones (kableExtra y flextable) son más simples y versátiles que gtable para este caso de uso.


#install.packages("tidyverse")

library(tidyverse)
install.packages("flextable")
library(flextable)
# Crear el conjunto de datos
datos <- data.frame(
  region = c("Norte", "Sur", "Este", "Oeste"),
  poblacion = c(100000, 75000, 50000, 60000),
  nacimientos = c(1200, 800, 600, 700),
  muertes = c(900, 500, 300, 400),
  casos_enfermedad = c(1500, 1000, 800, 900),
  fallecidos_enfermedad = c(200, 150, 100, 120)
)

# Calcular las tasas
datos$tasa_natalidad <- (datos$nacimientos / datos$poblacion) * 1000
datos$tasa_mortalidad <- (datos$muertes / datos$poblacion) * 1000
datos$tasa_incidencia <- (datos$casos_enfermedad / datos$poblacion) * 1000
datos$tasa_letalidad <- (datos$fallecidos_enfermedad / datos$casos_enfermedad) * 100

# Redondear solo columnas numéricas
datos_redondeados <- datos %>%
  mutate_if(is.numeric, round, 2)

# Crear la tabla con flextable
flextable(datos_redondeados) %>%
  autofit()

region

poblacion

nacimientos

muertes

casos_enfermedad

fallecidos_enfermedad

tasa_natalidad

tasa_mortalidad

tasa_incidencia

tasa_letalidad

Norte

100,000

1,200

900

1,500

200

12.00

9.00

15.00

13.33

Sur

75,000

800

500

1,000

150

10.67

6.67

13.33

15.00

Este

50,000

600

300

800

100

12.00

6.00

16.00

12.50

Oeste

60,000

700

400

900

120

11.67

6.67

15.00

13.33

Cálculo de Frecuencias

El análisis de frecuencias es una técnica básica pero esencial en epidemiología. Permite describir cómo se distribuyen los datos en categorías específicas y es especialmente útil para analizar variables categóricas como sexo, grupo de edad, o estado de enfermedad.

Cargar Librerías Primero, cargamos las librerías necesarias para el análisis:

library(dplyr)    
# Para manipulación de datos %>% %>% %>% %>% %>%  control + shift + m = 
# %>% %>% %>% %>% %>% %>% %>% 
library(ggplot2)   # Para visualización de datos
library(tidyverse)

# control + alt + *+ = ~ 

#install.packages("janitor")
library(janitor)   # Para generar tablas de frecuencias

Crear un Conjunto de Datos de Ejemplo Usaremos un dataset ficticio para calcular las frecuencias:

# Crear un conjunto de datos ficticio
datos <- data.frame(
  sexo = c("F", "M", "F", "F", "M", "F", "M", "M", "F", "M"),
  grupo_edad = c("0-19", "20-39", "20-39", "40-59", "40-59", "60+", "20-39", "60+", "40-59", "0-19")
)

# Mostrar los primeros datos
head(datos)
str(datos)
'data.frame':   10 obs. of  2 variables:
 $ sexo      : chr  "F" "M" "F" "F" ...
 $ grupo_edad: chr  "0-19" "20-39" "20-39" "40-59" ...

Tablas de Frecuencias Tabla de Frecuencias con table Podemos calcular frecuencias simples usando table:

# Calcular frecuencias para la variable "sexo"
tabla_sexo <- table(datos$sexo)
tabla_sexo

F M 
5 5 

Tabla de Frecuencias Cruzadas con table Para analizar dos variables:

# Tabla cruzada entre "sexo" y "grupo_edad"
tabla_cruzada <- table(datos$sexo, datos$grupo_edad)
tabla_cruzada
   
    0-19 20-39 40-59 60+
  F    1     1     2   1
  M    1     2     1   1

Tablas Limpias con janitor El paquete janitor genera tablas de frecuencias ordenadas:

#install.packages("janitor")
library(janitor)
# Tabla de frecuencias con proporciones

tabla_ordenada <- datos %>%
  tabyl(sexo) %>%
  adorn_totals("row") %>%
  adorn_pct_formatting()

tabla_ordenada
  sexo  n percent
     F  5   50.0%
     M  5   50.0%
 Total 10  100.0%
flextable(tabla_ordenada)

sexo

n

percent

F

5

50.0%

M

5

50.0%

Total

10

100.0%

Paquete janitor ¿Qué es janitor? janitor es un paquete diseñado para limpiar datos y realizar análisis exploratorios rápidos. Es particularmente útil para manejar tablas y datos categóricos, como calcular frecuencias y proporciones.

Características Principales de janitor: Limpieza de Nombres de Columnas:

Convierte nombres de columnas en formato limpio y consistente, eliminando espacios o caracteres especiales.

library(janitor)
datos2 <- data.frame("Nombre Columna 1" = c(1, 2), "Otra Columna" = c(3, 4))

datos_clean <- clean_names(datos2) #función clean_names

print(datos_clean)  # nombres: nombre_columna_1, otra_columna

Tablas de Frecuencias:

Genera tablas de frecuencias simples y cruzadas.

Incluye totales y porcentajes para facilitar la interpretación.

library(janitor)
tabla <- datos %>% tabyl(grupo_edad)
print(tabla)
 grupo_edad n percent
       0-19 2     0.2
      20-39 3     0.3
      40-59 3     0.3
        60+ 2     0.2
str(datos)
'data.frame':   10 obs. of  2 variables:
 $ sexo      : chr  "F" "M" "F" "F" ...
 $ grupo_edad: chr  "0-19" "20-39" "20-39" "40-59" ...

Tablas de Frecuencias Tabla de Frecuencias con table Podemos calcular frecuencias simples usando table:

# Calcular frecuencias para la variable "sexo"
tabla_sexo <- table(datos$sexo)
tabla_sexo

F M 
5 5 

Tabla de Frecuencias Cruzadas con table Para analizar dos variables:

# Tabla cruzada entre "sexo" y "grupo_edad"
tabla_cruzada <- table(datos$sexo, datos$grupo_edad)
tabla_cruzada
   
    0-19 20-39 40-59 60+
  F    1     1     2   1
  M    1     2     1   1

Tablas Limpias con janitor El paquete janitor genera tablas de frecuencias ordenadas:

#install.packages("janitor")
library(janitor)
# Tabla de frecuencias con proporciones

tabla_ordenada <- datos %>%
  tabyl(sexo) %>%
  adorn_totals("row") %>%
  adorn_pct_formatting()

tabla_ordenada
  sexo  n percent
     F  5   50.0%
     M  5   50.0%
 Total 10  100.0%
library(flextable)
flextable(tabla_ordenada)

sexo

n

percent

F

5

50.0%

M

5

50.0%

Total

10

100.0%

NA

Paquete janitor ¿Qué es janitor? janitor es un paquete diseñado para limpiar datos y realizar análisis exploratorios rápidos. Es particularmente útil para manejar tablas y datos categóricos, como calcular frecuencias y proporciones.

Características Principales de janitor: Limpieza de Nombres de Columnas:

Convierte nombres de columnas en formato limpio y consistente, eliminando espacios o caracteres especiales.

library(janitor)
datos2 <- data.frame("Nombre Columna 1" = c(1, 2), "Otra Columna" = c(3, 4))

datos_clean <- clean_names(datos2) #función clean_names

print(datos_clean)  # nombres: nombre_columna_1, otra_columna

Tablas de Frecuencias:

Genera tablas de frecuencias simples y cruzadas.

Incluye totales y porcentajes para facilitar la interpretación.

library(janitor)

tabla <- datos %>% tabyl(grupo_edad)

print(tabla)
 grupo_edad n percent
       0-19 2     0.2
      20-39 3     0.3
      40-59 3     0.3
        60+ 2     0.2

Tablas Ordenadas y Proporciones:

Añade totales y porcentajes a tablas de manera automática.

grupoedad<-tabla %>% adorn_totals("row") %>% adorn_pct_formatting()

grupoedad
 grupo_edad  n percent
       0-19  2   20.0%
      20-39  3   30.0%
      40-59  3   30.0%
        60+  2   20.0%
      Total 10  100.0%
flextable(grupoedad)

grupo_edad

n

percent

0-19

2

20.0%

20-39

3

30.0%

40-59

3

30.0%

60+

2

20.0%

Total

10

100.0%

Detección de Duplicados:

Identifica valores duplicados en tus datos.

datos3 <- data.frame(id = c(1, 1, 2, 3), valor = c(10, 10, 20, 30))

datos3
get_dupes(datos3, id)

¿Cuándo usar janitor? Cuando necesitas calcular frecuencias rápidamente.

Para limpiar nombres de columnas automáticamente.

Al trabajar con datos categóricos donde las proporciones y totales son importantes.

Visualización de Frecuencias Gráfico de Barras con ggplot2 Un gráfico de barras es ideal para visualizar frecuencias categóricas:

# Crear un gráfico de barras para "grupo_edad"
ggplot(datos, aes(x = grupo_edad, fill = grupo_edad)) +
  geom_bar() +
  labs(title = "Frecuencia por Grupo de Edad",
       x = "Grupo de Edad",
       y = "Frecuencia") +
  theme_minimal()

datos %>% ggplot(aes(grupo_edad, fill= grupo_edad))+
  geom_bar()

Gráfico de Pastel con ggplot2 Un gráfico de pastel es útil para mostrar proporciones:

# Calcular proporciones
proporciones <- datos %>%
  group_by(sexo) %>%
  summarise(frecuencia = n()) %>%
  mutate(proporcion = frecuencia / sum(frecuencia))

# Crear un gráfico de pastel
ggplot(proporciones, aes(x = "", y = proporcion, fill = sexo)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
   theme_void()+
  labs(title = "Distribución por Sexo") 

sexo

n

percent

F

5

50.0%

M

5

50.0%

Total

10

100.0%

Tablas y Gráficos en un Reporte Combinar Resultados en una Tabla Resumen Podemos combinar frecuencias y proporciones en una tabla clara:

# Tabla resumen de frecuencias y proporciones
tabla_resumen <- datos %>%
  group_by(sexo) %>%
  summarise(
    frecuencia = n(),
    proporcion = n() / nrow(datos)
  )

tabla_resumen

Exportar Gráficos y Tablas Guardar gráficos y tablas para incluirlos en reportes:

# Guardar el gráfico de barras como imagen
ggsave("frecuencia_grupo_edad.png")

Medidas de frecuencia Las medidas de frecuencia son herramientas clave en epidemiología para cuantificar el impacto de enfermedades en una población. Las principales métricas son:

Prevalencia: Proporción de individuos enfermos en un momento concreto. Incidencia acumulada: Probabilidad de que un individuo enferme durante un período. Densidad de incidencia: Velocidad con la que aparecen nuevos casos en una población. Dataset Simulado Crear un Dataset Ficticio Usamos un conjunto de datos simulado para calcular estas métricas.

# Crear un conjunto de datos ficticio
datos <- data.frame(
  id = 1:100,  # Identificación de individuos
  inicio_riesgo = c(rep(0, 80), rep(1, 20)),  # 0 = no enfermo al inicio 1= enfermo 
  casos_nuevos = c(rep(0, 90), rep(1, 10)),  # Casos nuevos al final del período
  tiempo_observacion = c(rep(1, 50), rep(2, 30), rep(3, 20))  # Tiempo observado en años
  )

# Mostrar los primeros datos
head(datos)

Cálculo de Prevalencia ¿Qué es la Prevalencia? La prevalencia mide la proporción de personas afectadas por una enfermedad en un momento dado.

Fórmula: Prevalencia = casos existentes / población total

# Calcular prevalencia al inicio del período
poblacion_total <- nrow(datos)
poblacion_total <- 100

casos_existentes <- 20

casos_existentes <- sum(datos$inicio_riesgo == 1)

casos_existentes <- sum(datos$inicio_riesgo != 0)

prevalencia <- casos_existentes / poblacion_total


cat("Prevalencia:", round(prevalencia * 100, 2), "%\n")
Prevalencia: 20 %
cat("Prevalencia:", prevalencia*100, "%\n")
Prevalencia: 20 %

Interpretación: Este valor indica el porcentaje de la población afectada al inicio del estudio.

Cálculo de Incidencia Acumulada ¿Qué es la Incidencia Acumulada? La incidencia acumulada mide la proporción de nuevos casos en una población en riesgo durante un período.

Fórmula:

Incidencia acumulada = casos nuevos observados / población en riesgo al inicio

# Calcular incidencia acumulada
casos_nuevos <- sum(datos$casos_nuevos)

casos_nuevos <- 10

poblacion_riesgo <- sum(datos$inicio_riesgo == 0)

poblacion_riesgo <- sum(datos$inicio_riesgo != 1)

poblacion_riesgo <- 80

incidencia_acumulada <- casos_nuevos / poblacion_riesgo

cat("Incidencia Acumulada:", round(incidencia_acumulada * 100, 2), "%\n")
Incidencia Acumulada: 12.5 %

Interpretación: Este valor indica el riesgo de desarrollar la enfermedad durante el período de observación.

Cálculo de Densidad de Incidencia ¿Qué es la Densidad de Incidencia? La densidad de incidencia mide la velocidad con la que aparecen nuevos casos en una población durante períodos de tiempo acumulados.

Fórmula: densidad de incidencia = casos nuevos observados / ñsuma de los períodes de riesgo

# Calcular densidad de incidencia
tiempo_total <- sum(datos$tiempo_observacion)

densidad_incidencia <- casos_nuevos / tiempo_total

cat("Densidad de Incidencia:", round(densidad_incidencia, 2), "casos por persona-año\n")
Densidad de Incidencia: 0.06 casos por persona-año

Interpretación: Este valor representa cuántos casos nuevos se generan por persona-año.

Visualización de las Métricas Gráfico Comparativo

library(ggplot2)

# Crear datos para el gráfico
resultados <- data.frame(
  medida = c("Prevalencia", "Incidencia Acumulada", "Densidad de Incidencia"),
  valor = c(prevalencia * 100, incidencia_acumulada * 100, densidad_incidencia)
)

# Gráfico de barras
ggplot(resultados, aes(x = medida, y = valor, fill = medida)) +
  geom_bar(stat = "identity") +
  labs(title = "Medidas de Frecuencia Epidemiológica",
       x = "Medida", y = "Valor (%)") +
  theme_minimal()

Herramientas adicionales Número básico de Reproducción R0 Aalgunas herramientas adicionales y modernas que se usan para analizar el impacto de enfermedades en una población incluyen:

El número básico de reproducción R₀ es una métrica clave en epidemiología para estimar cuántos casos secundarios genera un caso inicial en una población completamente susceptible. Es esencial para evaluar el potencial de propagación de enfermedades infecciosas como el COVID-19.

El número básico de reproducción R₀ indica el promedio de casos secundarios generados por un caso inicial en una población completamente susceptible.

Cómo calcular R₀ El cálculo de R₀ puede realizarse usando varias metodologías. Una de las más comunes se basa en la relación:

R0 = β x D

Donde:

β (tasa de transmisión): Probabilidad de que una persona infectada transmita la enfermedad por unidad de tiempo.

D (duración infecciosa): Tiempo promedio durante el cual una persona infectada puede transmitir la enfermedad.

Para calcularlo usando datos reales del COVID-19, podemos usar un data.frame simulado o datos reales si se dispone de ellos.

Usamos un conjunto de datos que simula la propagación del COVID-19 en una población.

## Dataset Simulado de COVID-19

set.seed(123)

datos <- data.frame(
  id = 1:30,
  fecha = seq(as.Date("2020-03-01"), as.Date("2020-03-30"), by = "days"),
  nuevos_casos = round(runif(30, 50, 150)),  # Nuevos casos diarios
  recuperados = round(runif(30, 30, 100)),  # Recuperaciones diarias
  fallecidos = round(runif(30, 1, 10)))      # Fallecimientos diarios


# Mostrar los primeros datos
head(datos)

Calcular R₀: Método Simplificado Definición Para estimar R₀, necesitamos:

Duración infecciosa promedio (D): Asumimos 10 días para COVID-19.

Crecimiento exponencial (λ): Calculado a partir de la tasa de nuevos casos diarios.

Paso 1: Calcular Crecimiento Diario

# Crecimiento diario de casos
datos$crecimiento <- c(NA, diff(datos$nuevos_casos))

# Calcular el promedio del crecimiento diario
lambda <- mean(datos$crecimiento, na.rm = TRUE)

cat("Crecimiento diario promedio (λ):", round(lambda, 2), "casos por día\n")
Crecimiento diario promedio (λ): -0.48 casos por día

Paso 2: Calcular R₀

# Asumimos una duración infecciosa promedio D = 10 días
D <- 10

# Estimación de R₀
R0 <- lambda * D
cat("Número básico de reproducción (R₀):", round(R0, 2), "\n")
Número básico de reproducción (R₀): -4.83 

Visualización del Número R₀ Gráfico de Nuevos Casos

library(ggplot2)

ggplot(datos, aes(x = fecha, y = nuevos_casos)) +
  geom_line(color = "blue", size = 1) +
  geom_point(color = "red") +
  labs(title = "Nuevos Casos Diarios de COVID-19",
       x = "Fecha", y = "Nuevos Casos") +
  theme_minimal()

Reflexión ¿Cómo influye la duración infecciosa promedio (D) en el cálculo de R₀?

¿Qué intervenciones (como cuarentenas o vacunación) pueden reducir β y, por ende, R₀?

¿Qué significa un R₀ > 1 para la propagación de la enfermedad?

Detalles del Ejemplo Duración Infecciosa Promedio (D): Se puede ajustar con base en evidencia clínica, como estudios que estimen cuánto tiempo los pacientes con COVID-19 son infecciosos. Datos Simulados: En este ejemplo, los datos son generados aleatoriamente. Puedes reemplazarlos con datos reales del COVID-19 de fuentes como Our World in Data o bases gubernamentales. Crecimiento Diario (λ): El crecimiento promedio se calcula con la diferencia diaria de nuevos casos.

Uso de Paquetes Adicionales Si deseas usar herramientas específicas para el cálculo de R₀, puedes explorar paquetes como EpiEstim:

install.packages("EpiEstim")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/SparseM_1.84-2.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/MatrixModels_0.5-4.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/mcmc_0.9-8.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/quantreg_6.1.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/MCMCpack_1.7-1.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/aweek_1.0.3.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/coarseDataTools_0.7.2.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/fitdistrplus_1.2-4.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/coda_0.19-4.1.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/incidence_1.7.6.zip'
probando la URL 'https://cran.rstudio.com/bin/windows/contrib/4.5/EpiEstim_2.2-5.zip'
package ‘SparseM’ successfully unpacked and MD5 sums checked
package ‘MatrixModels’ successfully unpacked and MD5 sums checked
package ‘mcmc’ successfully unpacked and MD5 sums checked
package ‘quantreg’ successfully unpacked and MD5 sums checked
package ‘MCMCpack’ successfully unpacked and MD5 sums checked
package ‘aweek’ successfully unpacked and MD5 sums checked
package ‘coarseDataTools’ successfully unpacked and MD5 sums checked
package ‘fitdistrplus’ successfully unpacked and MD5 sums checked
package ‘coda’ successfully unpacked and MD5 sums checked
package ‘incidence’ successfully unpacked and MD5 sums checked
package ‘EpiEstim’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\Silvi\AppData\Local\Temp\RtmpeidSPm\downloaded_packages
library(EpiEstim)

# Calcular R₀ usando EpiEstim (reemplazar con datos reales)
res <- estimate_R(
  incid = datos$nuevos_casos,
  method = "parametric_si",
  config = make_config(list(mean_si = 4, std_si = 2))
)
print(res$R)

Simulamos el brote epidemico (ficticio):

set.seed(123)
dias <- 30

casos <- round(runif(dias, min = 10, max = 100))

datos <- data.frame(
  fecha = seq(as.Date("2020-01-01"), by = "days", length.out = dias),
  nuevos_casos = casos
)

# Mostrar los primeros datos
head(datos)

Configuración del Intervalo Serial Definir el Intervalo Serial El intervalo serial representa el tiempo promedio entre infecciones primarias y secundarias. En COVID-19, estudios sugieren una distribución gamma con:

Media: 4 días

Desviación estándar: 2 días

# Configurar el intervalo serial
config <- make_config(
  list(mean_si = 4, std_si = 2)) # Normalmente, make_config se utiliza para crear o gestionar configuraciones

Calcular el Número de Reproducción Efectivo (Rₑ) Estimar Rₑ Usamos los datos diarios de nuevos casos para calcular Rₑ.

# Estimar Rₑ usando EpiEstim
resultado <- estimate_R(
  incid = datos$nuevos_casos,
  method = "parametric_si",
  config = config
)
# Mostrar resultados
print(resultado$R)

Visualización de Rₑ Gráfico de la Evolución de Rₑ Creamos un gráfico que muestra cómo Rₑ cambia con el tiempo, lo que puede indicar el impacto de intervenciones.

# Gráfico de Rₑ
plot(
  resultado,
  what = "R",
  legend = FALSE,
  main = "Evolución del Número de Reproducción Efectivo (Rₑ)"
)

Interpretación:

Rₑ > 1: La epidemia está en expansión.

Rₑ < 1: La epidemia está disminuyendo.

La función estimate_R del paquete {EpiEstim} en R se utiliza para estimar el número de reproducción efectivo (Rₑ), es una métrica clave en epidemiología para medir la capacidad de transmisión de una enfermedad infecciosa en una población a lo largo del tiempo.

Practica Introducción En esta práctica calcularemos , Rₑ y R para varias enfermedades infecciosas utilizando parámetros reales. Estos valores son cruciales para comprender la dinámica de transmisión y el impacto de medidas de control.

Valores para las enfermedades Infecciosas COVID-19 (SARS-CoV-2):

Tasa de transmisión: ~99.4% (alta transmisión en entornos cerrados) .

Tasa de mortalidad: 0.185% .

Duración infecciosa: ~10 días .

Distanciamiento social: ~30% puede reducir significativamente la transmisión.

Referencia: Estimation of the reproduction number of SARS-CoV-2.

MERS-CoV (Middle East Respiratory Syndrome):

Tasa de transmisión: ~5% (en contactos domiciliarios).

Tasa de mortalidad: ~35%.

Duración infecciosa: ~14 días.

Referencia: Emerging respiratory viral infections: MERS-CoV and influenza.

Influenza Estacional:

Tasa de transmisión: ~50–75%.

Tasa de mortalidad: ~0.1%.

Duración infecciosa: ~7 días.

Referencia: Influenza and tuberculosis co-infection: A systematic review.

Tuberculosis:

Tasa de transmisión: ~30% (en contactos cercanos).

Tasa de mortalidad: ~15%.

Duración infecciosa: Meses a años sin tratamiento.

Referencia: Tuberculosis and Covid-19 Co-Infection.

Sarampión:

Tasa de transmisión: 90–100% (muy alta).

Tasa de mortalidad: ~0.2% en países desarrollados; más alta en contextos sin vacunación.

Duración infecciosa: ~8 días.

Referencia: Molecular and Cellular Mechanisms of M. tuberculosis and SARS-CoV-2 Infections.

Simularemos la propagación de 5 enfermedades infecciosas con diferentes tasas de transmisión, mortalidad y duración infecciosa. Estas simulaciones se basarán en parámetros obtenidos de la literatura científica.

# Parámetros de las enfermedades
enfermedades <- data.frame(
  Enfermedad = c("COVID-19", "MERS-CoV", "Influenza Estacional", "Tuberculosis", "Sarampión"),
  Tasa_Transmision = c(99.4, 5, 60, 30, 95), # Porcentaje
  Tasa_Mortalidad = c(0.185, 35, 0.1, 15, 0.2), # Porcentaje
  Duracion_Infecciosa = c(10, 14, 7, 180, 8), # Días
  Distanciamiento_Social = c(30, 0, 15, 10, 0), # Porcentaje
  Poblacion = c(1000000, 1000000, 1000000, 1000000, 1000000) # Población para simulación
)

Cálculo de R₀ Fórmula de R₀ R₀ (Número básico de reproducción):

Representa el número promedio de infecciones secundarias causadas por un individuo infectado en una población completamente susceptible.

Fórmula: R0 = Tasa de transmisión x Duración infecciosa

# Calcular R₀ para cada enfermedad
enfermedades$R0 <- (enfermedades$Tasa_Transmision / 100) * enfermedades$Duracion_Infecciosa

# Mostrar resultados
enfermedades[c("Enfermedad", "R0")]

Cálculo de Rₑ Fórmula de Rₑ Calcula Re onsiderando que no toda la población es susceptible (debido a inmunidad o intervenciones).

Fórmula:

Re = Ro * susceptibles / población total

# Considerar 70% de la población inicial como susceptibles
enfermedades$Susceptibles <- enfermedades$Poblacion * 0.7

# Calcular Rₑ
enfermedades$Re <- enfermedades$R0 * (enfermedades$Susceptibles / enfermedades$Poblacion)

# Mostrar resultados
enfermedades[c("Enfermedad", "R0", "Re")]

Cálculo de Rₜ Dinámica Temporal de Rₜ Consideramos intervenciones como distanciamiento social y cambios en los susceptibles a lo largo del tiempo.

# Crear un data frame para simular la dinámica temporal
dias <- 30
resultado_rt <- data.frame()

for (i in 1:nrow(enfermedades)) {
  enfermedad <- enfermedades[i, ]
  susceptibles <- enfermedad$Susceptibles
  rt <- numeric(dias)
  
  for (t in 1:dias) {
    rt[t] <- enfermedad$R0 * (susceptibles / enfermedad$Poblacion) * (1 - enfermedad$Distanciamiento_Social / 100)
    susceptibles <- max(0, susceptibles - (susceptibles * enfermedad$Tasa_Transmision / 100)) # Reducir susceptibles
  }
  
  resultado_rt <- rbind(resultado_rt, data.frame(Dia = 1:dias, R_t = rt, Enfermedad = enfermedad$Enfermedad))
}

# Mostrar resultados para una enfermedad
head(resultado_rt[resultado_rt$Enfermedad == "COVID-19", ])

Visualización de Rₜ Gráfico para Cada Enfermedad

library(ggplot2)

# Gráfico de Rₜ
ggplot(resultado_rt, aes(x = Dia, y = R_t, color = Enfermedad)) +
  geom_line(size = 1) +
  geom_hline(yintercept = 1, linetype = "dashed", color = "red") +
  labs(title = "Evolución de Rt por Enfermedad", 
       x = "Días", y = "Rt") +
  theme_minimal() +
  scale_color_brewer(palette = "Set1")

Bonus track: Podemos crear una función en R para simular la enfermedad En el siguiente bloque de codigo se crea la función simular_enfermedad

# Crear una función de simulación
simular_enfermedad <- function(enfermedad, tasa_transmision, tasa_mortalidad, duracion, dist_social, poblacion = 1000) {
  dias <- 30
  infecciosos <- 1  # Casos iniciales
  recuperados <- 0
  fallecidos <- 0
  susceptibles <- poblacion - infecciosos
  
  resultado <- data.frame(Dia = 1:dias, Infectados = NA, Recuperados = NA, Fallecidos = NA, Susceptibles = NA)
  
  for (dia in 1:dias) {
    nuevas_infecciones <- round((infecciosos * tasa_transmision / 100) * (1 - dist_social / 100))
    nuevas_infecciones <- min(nuevas_infecciones, susceptibles)  # No exceder susceptibles
    
    nuevos_recuperados <- ifelse(dia > duracion, infecciosos / duracion, 0)
    nuevos_fallecidos <- round((tasa_mortalidad / 100) * infecciosos)
    
    infecciosos <- infecciosos + nuevas_infecciones - nuevos_recuperados - nuevos_fallecidos
    recuperados <- recuperados + nuevos_recuperados
    fallecidos <- fallecidos + nuevos_fallecidos
    susceptibles <- poblacion - infecciosos - recuperados - fallecidos
    
    resultado[dia, ] <- c(dia, infecciosos, recuperados, fallecidos, susceptibles)
  }
  return(resultado)
}

Una vez creada la función ahora podemos utilizarla: Vamos a crear un objeto que garde los datos simulados de una enfermedad ( puede ser de los datos que ya revisamos en la literatura)

Simulación de ejemplo para COVID-19

sim_covid <- simular_enfermedad( “COVID-19”, tasa_transmision = 99.4, tasa_mortalidad = 20, duracion = 10, dist_social = 30, poblacion = 1000 )

# Simulación de ejemplo para COVID-19
sim_covid <- simular_enfermedad(
  "COVID-19", tasa_transmision = 99.4, tasa_mortalidad = 20, 
  duracion = 10, dist_social = 30, poblacion = 1000
)
library(ggplot2)

# Gráfico para COVID-19
ggplot(sim_covid, aes(x = Dia)) +
  geom_line(aes(y = Infectados, color = "Infectados")) +
  geom_line(aes(y = Recuperados, color = "Recuperados")) +
  geom_line(aes(y = Fallecidos, color = "Fallecidos")) +
  geom_line(aes(y = Susceptibles, color = "Susceptibles")) +
  labs(title = "Simulación de Covid-19", 
       x = "Días", y = "Número de Personas") +
  scale_color_manual(name = "Estado", values = c("Infectados" = "red", 
                                                 "Recuperados" = "green", 
                                                 "Fallecidos" = "black", 
                                                 "Susceptibles" = "blue")) +
  theme_minimal()

Conclusión La simulación permite visualizar la dinámica de transmisión y el impacto de intervenciones como el distanciamiento social. Los resultados pueden usarse para planificar respuestas ante brotes reales.

Además, permite analizar la dinámica de la propagación de enfermedades bajo diferentes escenarios de intervención y parámetros epidemiológicos.

Siguientes pasos:

Ajustar parámetros para escenarios específicos.

Comparar entre diferentes poblaciones y entornos.

Calculo de tamaño muestral Introducción El cálculo del tamaño de muestra es una etapa crucial en el diseño de estudios. Cuando deseamos estimar una proporción, debemos considerar: 1. Nivel de confianza (Zα): Representa la probabilidad de que el intervalo de confianza contenga el valor verdadero. Ejemplo: 95% (( Z = 1.96 )). 2. Precisión deseada (( e )): Diferencia máxima aceptable entre la proporción estimada y la real. 3. Proporción esperada (( p )): Estimación inicial basada en literatura o estudios previos.

En este ejercicio, utilizaremos el paquete pwr para calcular el tamaño de muestra necesario para conocer la prevalencia de diabetes en una población, suponiendo que: - Nivel de confianza: 95% - Precisión deseada: 5% - Proporción esperada: 50% (0.5).

Instalación y configuración de paquetes Primero, asegurémonos de instalar y cargar los paquetes necesarios.

Paquete pwr

# Ejecutar solo una vez si no está instalado:
# install.packages("pwr")

library(pwr)

Fórmula para estimar el tamaño de muestra El cálculo del tamaño de muestra para estimar una proporción se realiza con la fórmula:

Fórmula tamaño de muestra para proporción Donde:

Z: valor correspondiente al nivel de confianza (por ejemplo, Z = 1.96 para 95 %). p: proporción esperada. e: precisión deseada (error máximo permitido). Aunque el paquete pwr simplifica este cálculo, también podemos hacerlo de forma manual paso a paso en R.

Cálculo del tamaño de muestra Método 1: Cálculo manual Utilizando directamente la fórmula clásica para proporciones en población “infinita”:

# Parámetros
Z <- 1.96   # Nivel de confianza para 95 %
p <- 0.5    # Proporción esperada
e <- 0.05   # Precisión deseada (5 %)

# Cálculo del tamaño de muestra
n_manual <- (Z^2 * p * (1 - p)) / (e^2)

cat("Tamaño de muestra necesario (método manual):",
    ceiling(n_manual), "\n")
Tamaño de muestra necesario (método manual): 385 

Método 2: Uso del paquete pwr El paquete pwr proporciona una forma más general, basada en tamaño de efecto (h) y poder estadístico.

Supongamos que queremos detectar una diferencia entre una proporción nula p0 = 0.5 y una proporción alternativa p1 = 0.6 con α = 0.05 y poder 80 %:

# Parámetros para prueba de una proporción
p0 <- 0.5   # Proporción nula
p1 <- 0.6   # Proporción alternativa

# Tamaño de efecto de Cohen (h) para proporciones
h <- ES.h(p1 = p1, p2 = p0)

# Cálculo del tamaño de muestra con pwr.p.test
res_pwr <- pwr.p.test(h = h,
                      sig.level = 0.05,
                      power = 0.80,
                      alternative = "two.sided")

n_pwr <- ceiling(res_pwr$n)

cat("Tamaño de muestra necesario (pwr.p.test):",
    n_pwr, "\n")
Tamaño de muestra necesario (pwr.p.test): 194 

Tamaño de muestra en poblaciones finitas Cuando se conoce el tamaño total de la población, se ajusta el tamaño de muestra mediante la fórmula para poblaciones finitas:

Fórmula población finita Donde:

N: tamaño de la población. Z: valor correspondiente al nivel de confianza. p: proporción esperada. q = 1 − p. d: precisión deseada. En este ejercicio, calculamos el tamaño de muestra para:

N = 10,000 Nivel de confianza: 95 % (Z = 1.96) Proporción esperada: p = 0.05 (5 %) Precisión deseada: d = 0.03 (3 %)

# Parámetros
N <- 10000   # Tamaño de la población
Z <- 1.96    # Nivel de confianza para 95 %
p <- 0.05    # Proporción esperada (5 %)
q <- 1 - p   # Complemento de la proporción
d <- 0.03    # Precisión deseada (3 %)

# Cálculo del tamaño de muestra para población finita
n_finita <- (N * Z^2 * p * q) /
  ((d^2 * (N - 1)) + (Z^2 * p * q))

cat("Tamaño de muestra necesario (N = 10,000):",
    ceiling(n_finita), "\n")
Tamaño de muestra necesario (N = 10,000): 199 

Paso 2: Variación del tamaño de muestra según la precisión Creamos un gráfico que muestre cómo cambia el tamaño de muestra con distintos valores de d:

library(ggplot2)

# Secuencia de precisiones posibles
precisiones <- seq(0.01, 0.10, by = 0.01)

tam_muestra <- sapply(precisiones, function(d){
  (N * Z^2 * p * q) /
    ((d^2 * (N - 1)) + (Z^2 * p * q))
})

# Data frame para graficar
datos_grafico <- data.frame(
  precision      = precisiones,
  tamano_muestra = ceiling(tam_muestra)
)

ggplot(datos_grafico,
       aes(x = precision, y = tamano_muestra)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Relación entre precisión (d) y tamaño de muestra\n(N = 10,000)",
    x     = "Precisión deseada (d)",
    y     = "Tamaño de muestra"
  ) +
  theme_minimal()

Ejemplo adicional: población de 15,000 habitantes Ahora calculamos el tamaño de muestra para estimar la prevalencia de diabetes en una población finita de 15,000 habitantes, con:

Seguridad: 95 % Precisión: 3 % (d = 0.03) Proporción esperada: p = 0.05 (5 %)

# Parámetros
N <- 15000   # Tamaño de la población
Z <- 1.96    # Nivel de confianza para 95 %
p <- 0.05    # Proporción esperada (5 %)
q <- 1 - p
d <- 0.03    # Precisión deseada (3 %)

# Cálculo para población finita
n_finita_15000 <- (N * Z^2 * p * q) /
  ((d^2 * (N - 1)) + (Z^2 * p * q))

cat("Tamaño de muestra necesario (N = 15,000):",
    ceiling(n_finita_15000), "\n")
Tamaño de muestra necesario (N = 15,000): 201 

Exploración gráfica (N = 15,000)

precisiones <- seq(0.01, 0.10, by = 0.01)

tam_muestra <- sapply(precisiones, function(d){
  (N * Z^2 * p * q) /
    ((d^2 * (N - 1)) + (Z^2 * p * q))
})

datos_grafico <- data.frame(
  precision      = precisiones,
  tamano_muestra = ceiling(tam_muestra)
)

ggplot(datos_grafico,
       aes(x = precision, y = tamano_muestra)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Relación entre precisión (d) y tamaño de muestra\n(N = 15,000)",
    x     = "Precisión deseada (d)",
    y     = "Tamaño de muestra"
  ) +
  theme_minimal()

Tamaño de muestra para estimar una media

# Parámetros
Z  <- 1.96   # Nivel de confianza (95 %)
S2 <- 250    # Varianza (S^2)
d  <- 3      # Precisión deseada

# Cálculo del tamaño de muestra
n_media_manual <- (Z^2 * S2) / (d^2)

cat("Tamaño de muestra (media, método manual):",
    ceiling(n_media_manual), "\n")
Tamaño de muestra (media, método manual): 107 

Tamaño de muestra para media con

# Parámetros
Z  <- 1.96   # Nivel de confianza (95 %)
S2 <- 250    # Varianza (S^2)
d  <- 3      # Precisión deseada

# Cálculo del tamaño de muestra
n_manual <- (Z^2 * S2) / (d^2)

cat("Tamaño de muestra (media, método manual):",
    ceiling(n_manual), "\n")
Tamaño de muestra (media, método manual): 107 

Comparación de dos proporciones

# Parámetros
Z_alpha <- 1.645  # Nivel de confianza ~95 % (una cola)
Z_beta  <- 0.842  # Poder estadístico 80 %
p1 <- 0.7         # Proporción 1
p2 <- 0.9         # Proporción 2
p  <- (p1 + p2) / 2  # Promedio de proporciones

# Cálculo del tamaño de muestra (por grupo)
n_dos_prop_manual <- (
  (Z_alpha * sqrt(2 * p * (1 - p)) +
     Z_beta  * sqrt(p1 * (1 - p1) + p2 * (1 - p2)))^2
) / (p1 - p2)^2

cat("Tamaño de muestra por grupo (dos proporciones, manual):",
    ceiling(n_dos_prop_manual), "\n")
Tamaño de muestra por grupo (dos proporciones, manual): 49 
# Cálculo del tamaño del efecto h para dos proporciones
h <- ES.h(p1 = p1, p2 = p2)

# Tamaño de muestra por grupo con pwr.2p.test
res_2p <- pwr.2p.test(
  h         = h,
  sig.level = 0.05,
  power     = 0.80,
  alternative = "two.sided"
)

cat("Tamaño de muestra por grupo (dos proporciones, pwr):",
    ceiling(res_2p$n), "\n")
Tamaño de muestra por grupo (dos proporciones, pwr): 60 

Comparación de dos medias:

# Parámetros
Z_alpha <- 1.645  # Nivel de confianza ~95 % (una cola)
Z_beta  <- 1.282  # Poder estadístico 90 %
S       <- 16     # Desviación estándar
d_mean  <- 15     # Diferencia esperada entre medias

# Cálculo del tamaño de muestra por grupo
n_dos_medias <- (2 * (Z_alpha + Z_beta)^2 * S^2) / (d_mean^2)

cat("Tamaño de muestra por grupo (dos medias, manual):",
    ceiling(n_dos_medias), "\n")
Tamaño de muestra por grupo (dos medias, manual): 20 
---
title: "Estadísticas Vitales en Epidemiología"
author: "Lic. Silvia Montes"
output: html_notebook
---

#Crear un vector de datos

```{r}
datos <- c(100, 200, 300, 400, 500)
```

#Calcular el total y promedio

```{r}
total <- sum(datos)
promedio <- mean(datos)
```

#Mostrar resultados

```{r}
cat("Total:", total, "\n")
```

```{r}
cat("Promedio;", promedio, "\n")
```

Graficar los datos con ggplot2 library(ggplot2) df \<- data.frame (x = 1:5, y = datos) LO antes mencionado es una formula para crear una data.frame donde en "X = 1:5" significa que estoy indicando que serán 1 columna y 5 filas respectivamente.

```{r}
df <- data.frame (x = 1:5, y = datos) 
df
```

Paleta de hex color para definir a traves de un codigo el color El simbolo "+" añade una linea de codigo que en ggplot es como una

```{r}
library("ggplot2")
ggplot(df, aes(x = x, y = y)) +
  geom_bar(stat = "identity", fill = "#a346f0") +
  scale_x_continuous(breaks = 1:5,
                     labels = c("Edad", "Peso", "C", "D", "E")) +
  labs(title = "grafico de barras", x = "Índice", y = "Valores")
```

PARA RENOMBRAR EN ESCALA: scale_x_continuous(breaks = 1:5, labels = c("Edad", "Peso", "C", "D", "E")) +

PARA RENOMBRAR COMO FACTOR: library(ggplot2)

library(ggplot2)

ggplot(df, aes(x = factor(x, labels = c("A", "B", "C", "D", "E")), y = y)) + geom_bar(stat = "identity", fill = "#fc03df") + labs(title = "Gráfico de barras", x = "Índice", y = "Valores")

```{r}
install.packages("gapminder")
```

```{r}
library("gapminder")
#install.packages("tidyverse")
library("tidyverse")
```

```{r}

gapdata2007 <- gapminder %>% filter(year == 2007)

gapdata2007$year
```

Escoger objetos geometricos geom_point() aes()

```{r}
gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8)
```

shape es para elegir como quieres la forma en la que se representan los valores en la grafica 0 cuadrado 1 circulo 2 triangulo 4 x 8 \* 15 cuadrado relleno 16 circulo relleno 17 triangulo relleno 21 circulo relleno con contorno 22 cuadrado relleno con contorno 23 rombo relleno con contorno

Se puede separar todo en varias graficas agregando una linea extra al codigo

facet_wrap(continent)

```{r}
gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8) +
  facet_wrap(~continent)
```

Elegir el fondo: default theme_bw theme_dark theme_classic

```{r}
gapdata2007 %>% 
  ggplot(aes(x = gdpPercap, y =  lifeExp, colour = continent)) +
  geom_point(shape=8) +
  facet_wrap(~continent) +
  theme_bw()
```

¿Qué son las Estadísticas Vitales? Las estadísticas vitales son métricas clave que permiten analizar el estado de salud de una población. Entre las más comunes se encuentran:

-   Tasa de natalidad: Número de nacimientos por cada 1,000 habitantes.

Tasa de mortalidad: Número de muertes por cada 1,000 habitantes.

Tasa de letalidad: Porcentaje de personas fallecidas entre las que padecieron una enfermedad específica.

Crear un Dataset Ficticio Usaremos un conjunto de datos ficticio para realizar los cálculos:

```{r}
# Crear un conjunto de datos ficticio
datos <- data.frame(
  region = c("Norte", "Sur", "Este", "Oeste"),
  poblacion = c(100000, 75000, 50000, 60000),
  nacimientos = c(1200, 800, 600, 700),
  muertes = c(900, 500, 300, 400),
  casos_enfermedad = c(1500, 1000, 800, 900),
  fallecidos_enfermedad = c(200, 150, 100, 120)
)

# Mostrar los primeros datos
print(datos)
```

Tasa de Mortalidad ¿Qué es la Tasa de Mortalidad? La Tasa de Mortalidad mide el número de muertes en una población por cada 1,000 habitantes durante un período determinado.

Es una métrica crucial para evaluar el impacto de factores que afectan la salud pública.

Fórmula La fórmula general para calcular la Tasa de Mortalidad es:

Numero de muertes / población total \* 1000

Donde:

-   Número de Muertes: Total de personas fallecidas en un año.

Población Total: Número total de habitantes en la población.

```{r}
# Datos
muertes <- 900  # Número de muertes en un año
poblacion_total <- 100000  # Población total en ese año

# Cálculo de la tasa de mortalidad
tasa_mortalidad <- (muertes / poblacion_total) * 1000

# Resultado
cat("Tasa de mortalidad:", tasa_mortalidad, "muertes por cada 1,000 habitantes\n")
```

Visualización de Tasa de Mortalidad Usamos un gráfico de barras para visualizar las tasas de mortalidad en diferentes regiones:

```{r}
library(ggplot2)

str(datos)
```

```{r}
print(datos)
```

```{r}
library(ggplot2)
```

```{r}
# Calcular tasas de mortalidad

datos$tasa_mortalidad <- (datos$muertes / datos$poblacion) * 1000

print(datos)
```

GRAFICOS:

```{r}
# Gráfico
ggplot(datos, aes(x = region, y = tasa_mortalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Mortalidad por Región", x = "Región", y = "Tasa de Mortalidad (por 1,000 habitantes)") +
  theme_classic()
```

Conclusión La Tasa de Mortalidad es un indicador fundamental para medir el impacto de condiciones de salud y factores socioeconómicos en una población.

Comparar tasas entre regiones puede ayudar a identificar áreas que necesitan mayor atención.

Tasa de Letalidad ¿Qué es la Tasa de Letalidad? La Tasa de Letalidad mide el porcentaje de personas fallecidas entre las que han padecido una enfermedad específica.

Es una métrica crucial para evaluar la gravedad de una enfermedad y la efectividad de las intervenciones médicas.

Fórmula La fórmula general para calcular la Tasa de Letalidad es:

Tasa de letalidad = numero de fallecidos / numero de casos \* 100 =

Donde:

-   Número de Fallecidos: Total de personas que han muerto debido a la enfermedad. -

-Número de Casos: Total de personas diagnosticadas con la enfermedad.

Implementación en R Calculemos la Tasa de Letalidad usando un ejemplo práctico:

```{r}
Datos_fallecidos <- 200 # Número de fallecidos por la enfermedad 
casos <- 1500 # Número total de casos registrados

# Cálculo de la tasa de letalidad

tasa_letalidad <- (Datos_fallecidos / casos) * 100

# Resultado

cat("Tasa de letalidad:", tasa_letalidad, "% de los casos fallecen\n")
```

```{r}
# Calcular tasas de letalidad
datos$tasa_letalidad <- (datos$fallecidos / datos$casos) * 100                
```

```{r}
# Gráfico
ggplot(datos, aes(x = region, y = tasa_letalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Letalidad por Región",
       x = "Región", y = "Tasa de Letalidad (%)") +
  theme_minimal()
```

Conclusión La Tasa de Letalidad es un indicador clave para evaluar la severidad de una enfermedad y el impacto de las intervenciones médicas. Un análisis detallado puede ayudar a identificar áreas prioritarias para la asignación de recursos.

Tasa de Natalidad ¿Qué es la Tasa de Natalidad? La Tasa de Natalidad mide el número de nacimientos en una población por cada 1,000 habitantes durante un período determinado.

Es una métrica clave para analizar la dinámica poblacional y evaluar tendencias demográficas.

Fórmula La fórmula general para calcular la Tasa de Natalidad es:

Tasa de natalidad = numero de nacimientos / total de la población \* 1000 =

Implementación en R Calculemos la Tasa de Natalidad usando un ejemplo práctico:

```{r}
# Datos

nacimientos <- 1500  # Número de nacimientos en un año
poblacion_total <- 100000  # Población total en ese año

# Cálculo de la tasa de natalidad
tasa_natalidad <- (nacimientos / poblacion_total) * 1000

# Resultado
cat("Tasa de natalidad:", tasa_natalidad, "nacimientos por cada 1,000 habitantes\n")
```

```{r}
datos
```

```{r}
# Calcular tasas de natalidad
datos$tasa_natalidad <- (datos$nacimientos / datos$poblacion) * 1000

# Gráfico
ggplot(datos, aes(x = region, y = tasa_natalidad, fill = region)) +
  geom_bar(stat = "identity") +
  labs(title = "Tasa de Natalidad por Región",
       x = "Región", y = "Tasa de Natalidad (por 1,000 habitantes)") +
  theme_minimal()
```

Conclusión La Tasa de Natalidad es una herramienta esencial en epidemiología para entender la dinámica poblacional. Usarla en conjunto con otras métricas puede proporcionar una visión completa de las tendencias demográficas y necesidades de salud pública.

Ventajas de flextable: Interactividad: Permite crear tablas fácilmente exportables a Word o PowerPoint.

Estilo Personalizable: Cambia colores, fuentes y bordes sin complicaciones.

Soporte para Reportes: Ideal para informes en formatos reproducibles.

Ambas opciones (kableExtra y flextable) son más simples y versátiles que gtable para este caso de uso.

```{r}

#install.packages("tidyverse")

library(tidyverse)
```

```{r}
install.packages("flextable")
library(flextable)
```

```{r}
# Crear el conjunto de datos
datos <- data.frame(
  region = c("Norte", "Sur", "Este", "Oeste"),
  poblacion = c(100000, 75000, 50000, 60000),
  nacimientos = c(1200, 800, 600, 700),
  muertes = c(900, 500, 300, 400),
  casos_enfermedad = c(1500, 1000, 800, 900),
  fallecidos_enfermedad = c(200, 150, 100, 120)
)

# Calcular las tasas
datos$tasa_natalidad <- (datos$nacimientos / datos$poblacion) * 1000
datos$tasa_mortalidad <- (datos$muertes / datos$poblacion) * 1000
datos$tasa_incidencia <- (datos$casos_enfermedad / datos$poblacion) * 1000
datos$tasa_letalidad <- (datos$fallecidos_enfermedad / datos$casos_enfermedad) * 100

# Redondear solo columnas numéricas
datos_redondeados <- datos %>%
  mutate_if(is.numeric, round, 2)

# Crear la tabla con flextable
flextable(datos_redondeados) %>%
  autofit()
```

Cálculo de Frecuencias

El análisis de frecuencias es una técnica básica pero esencial en epidemiología. Permite describir cómo se distribuyen los datos en categorías específicas y es especialmente útil para analizar variables categóricas como sexo, grupo de edad, o estado de enfermedad.

Cargar Librerías Primero, cargamos las librerías necesarias para el análisis:

```{r}
library(dplyr)    
# Para manipulación de datos %>% %>% %>% %>% %>%  control + shift + m = 
# %>% %>% %>% %>% %>% %>% %>% 
library(ggplot2)   # Para visualización de datos
library(tidyverse)

# control + alt + *+ = ~ 

#install.packages("janitor")
library(janitor)   # Para generar tablas de frecuencias
```

Crear un Conjunto de Datos de Ejemplo Usaremos un dataset ficticio para calcular las frecuencias:

```{r}
# Crear un conjunto de datos ficticio
datos <- data.frame(
  sexo = c("F", "M", "F", "F", "M", "F", "M", "M", "F", "M"),
  grupo_edad = c("0-19", "20-39", "20-39", "40-59", "40-59", "60+", "20-39", "60+", "40-59", "0-19")
)

# Mostrar los primeros datos
head(datos)
```

```{r}
str(datos)
```

Tablas de Frecuencias Tabla de Frecuencias con table Podemos calcular frecuencias simples usando table:

```{r}
# Calcular frecuencias para la variable "sexo"
tabla_sexo <- table(datos$sexo)
tabla_sexo
```

Tabla de Frecuencias Cruzadas con table Para analizar dos variables:

```{r}
# Tabla cruzada entre "sexo" y "grupo_edad"
tabla_cruzada <- table(datos$sexo, datos$grupo_edad)
tabla_cruzada
```

Tablas Limpias con janitor El paquete janitor genera tablas de frecuencias ordenadas:

```{r}
#install.packages("janitor")
library(janitor)
# Tabla de frecuencias con proporciones

tabla_ordenada <- datos %>%
  tabyl(sexo) %>%
  adorn_totals("row") %>%
  adorn_pct_formatting()

tabla_ordenada
```

```{r}
flextable(tabla_ordenada)
```

Paquete janitor ¿Qué es janitor? janitor es un paquete diseñado para limpiar datos y realizar análisis exploratorios rápidos. Es particularmente útil para manejar tablas y datos categóricos, como calcular frecuencias y proporciones.

Características Principales de janitor: Limpieza de Nombres de Columnas:

Convierte nombres de columnas en formato limpio y consistente, eliminando espacios o caracteres especiales.

```{r}
library(janitor)
datos2 <- data.frame("Nombre Columna 1" = c(1, 2), "Otra Columna" = c(3, 4))

datos_clean <- clean_names(datos2) #función clean_names

print(datos_clean)  # nombres: nombre_columna_1, otra_columna
```

Tablas de Frecuencias:

Genera tablas de frecuencias simples y cruzadas.

Incluye totales y porcentajes para facilitar la interpretación.

```{r}
library(janitor)
tabla <- datos %>% tabyl(grupo_edad)
```

```{r}
print(tabla)
```

```{r}
str(datos)
```

Tablas de Frecuencias Tabla de Frecuencias con table Podemos calcular frecuencias simples usando table:

```{r}
# Calcular frecuencias para la variable "sexo"
tabla_sexo <- table(datos$sexo)
tabla_sexo
```

Tabla de Frecuencias Cruzadas con table Para analizar dos variables:

```{r}
# Tabla cruzada entre "sexo" y "grupo_edad"
tabla_cruzada <- table(datos$sexo, datos$grupo_edad)
tabla_cruzada
```

Tablas Limpias con janitor El paquete janitor genera tablas de frecuencias ordenadas:

```{r}
#install.packages("janitor")
library(janitor)
# Tabla de frecuencias con proporciones

tabla_ordenada <- datos %>%
  tabyl(sexo) %>%
  adorn_totals("row") %>%
  adorn_pct_formatting()

tabla_ordenada
```

```{r}
library(flextable)
```

```{r}
flextable(tabla_ordenada)

```

Paquete janitor ¿Qué es janitor? janitor es un paquete diseñado para limpiar datos y realizar análisis exploratorios rápidos. Es particularmente útil para manejar tablas y datos categóricos, como calcular frecuencias y proporciones.

Características Principales de janitor: Limpieza de Nombres de Columnas:

Convierte nombres de columnas en formato limpio y consistente, eliminando espacios o caracteres especiales.

```{r}
library(janitor)
datos2 <- data.frame("Nombre Columna 1" = c(1, 2), "Otra Columna" = c(3, 4))

datos_clean <- clean_names(datos2) #función clean_names

print(datos_clean)  # nombres: nombre_columna_1, otra_columna
```

Tablas de Frecuencias:

Genera tablas de frecuencias simples y cruzadas.

Incluye totales y porcentajes para facilitar la interpretación.

```{r}
library(janitor)

tabla <- datos %>% tabyl(grupo_edad)

print(tabla)
```

Tablas Ordenadas y Proporciones:

Añade totales y porcentajes a tablas de manera automática.

```{r}
grupoedad<-tabla %>% adorn_totals("row") %>% adorn_pct_formatting()

grupoedad
```

```{r}
flextable(grupoedad)
```

Detección de Duplicados:

Identifica valores duplicados en tus datos.

```{r}
datos3 <- data.frame(id = c(1, 1, 2, 3), valor = c(10, 10, 20, 30))

datos3
```

```{r}
get_dupes(datos3, id)
```

¿Cuándo usar janitor? Cuando necesitas calcular frecuencias rápidamente.

Para limpiar nombres de columnas automáticamente.

Al trabajar con datos categóricos donde las proporciones y totales son importantes.

Visualización de Frecuencias Gráfico de Barras con ggplot2 Un gráfico de barras es ideal para visualizar frecuencias categóricas:

```{r}
# Crear un gráfico de barras para "grupo_edad"
ggplot(datos, aes(x = grupo_edad, fill = grupo_edad)) +
  geom_bar() +
  labs(title = "Frecuencia por Grupo de Edad",
       x = "Grupo de Edad",
       y = "Frecuencia") +
  theme_minimal()
```

```{r}
datos %>% ggplot(aes(grupo_edad, fill= grupo_edad))+
  geom_bar()
```

Gráfico de Pastel con ggplot2 Un gráfico de pastel es útil para mostrar proporciones:

```{r}
# Calcular proporciones
proporciones <- datos %>%
  group_by(sexo) %>%
  summarise(frecuencia = n()) %>%
  mutate(proporcion = frecuencia / sum(frecuencia))

# Crear un gráfico de pastel
ggplot(proporciones, aes(x = "", y = proporcion, fill = sexo)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
   theme_void()+
  labs(title = "Distribución por Sexo") 
```


```{r}
flextable(tabla_ordenada)
```

Tablas y Gráficos en un Reporte
Combinar Resultados en una Tabla Resumen
Podemos combinar frecuencias y proporciones en una tabla clara:


```{r}
# Tabla resumen de frecuencias y proporciones
tabla_resumen <- datos %>%
  group_by(sexo) %>%
  summarise(
    frecuencia = n(),
    proporcion = n() / nrow(datos)
  )

tabla_resumen
```

Exportar Gráficos y Tablas
Guardar gráficos y tablas para incluirlos en reportes:

```{r}
# Guardar el gráfico de barras como imagen
ggsave("frecuencia_grupo_edad.png")
```

```{r}
# Exportar la tabla resumen como CSV
write.csv(tabla_resumen, "tabla_resumen.csv")
```


Medidas de frecuencia
Las medidas de frecuencia son herramientas clave en epidemiología para cuantificar el impacto de enfermedades en una población. Las principales métricas son:

Prevalencia: Proporción de individuos enfermos en un momento concreto.
Incidencia acumulada: Probabilidad de que un individuo enferme durante un período.
Densidad de incidencia: Velocidad con la que aparecen nuevos casos en una población.
Dataset Simulado
Crear un Dataset Ficticio
Usamos un conjunto de datos simulado para calcular estas métricas.

```{r}
# Crear un conjunto de datos ficticio
datos <- data.frame(
  id = 1:100,  # Identificación de individuos
  inicio_riesgo = c(rep(0, 80), rep(1, 20)),  # 0 = no enfermo al inicio 1= enfermo 
  casos_nuevos = c(rep(0, 90), rep(1, 10)),  # Casos nuevos al final del período
  tiempo_observacion = c(rep(1, 50), rep(2, 30), rep(3, 20))  # Tiempo observado en años
  )

# Mostrar los primeros datos
head(datos)
```

Cálculo de Prevalencia
¿Qué es la Prevalencia?
La prevalencia mide la proporción de personas afectadas por una enfermedad en un momento dado.

Fórmula:
Prevalencia = casos existentes / población total

```{r}
# Calcular prevalencia al inicio del período
poblacion_total <- nrow(datos)
poblacion_total <- 100

casos_existentes <- 20

casos_existentes <- sum(datos$inicio_riesgo == 1)

casos_existentes <- sum(datos$inicio_riesgo != 0)

prevalencia <- casos_existentes / poblacion_total


cat("Prevalencia:", round(prevalencia * 100, 2), "%\n")
```
```{r}
cat("Prevalencia:", prevalencia*100, "%\n")
```
Interpretación: Este valor indica el porcentaje de la población afectada al inicio del estudio.

Cálculo de Incidencia Acumulada
¿Qué es la Incidencia Acumulada?
La incidencia acumulada mide la proporción de nuevos casos en una población en riesgo durante un período.

Fórmula:

Incidencia acumulada = casos nuevos observados / población en riesgo al inicio

```{r}
# Calcular incidencia acumulada
casos_nuevos <- sum(datos$casos_nuevos)

casos_nuevos <- 10

poblacion_riesgo <- sum(datos$inicio_riesgo == 0)

poblacion_riesgo <- sum(datos$inicio_riesgo != 1)

poblacion_riesgo <- 80

incidencia_acumulada <- casos_nuevos / poblacion_riesgo

cat("Incidencia Acumulada:", round(incidencia_acumulada * 100, 2), "%\n")
```

Interpretación: Este valor indica el riesgo de desarrollar la enfermedad durante el período de observación.

Cálculo de Densidad de Incidencia
¿Qué es la Densidad de Incidencia?
La densidad de incidencia mide la velocidad con la que aparecen nuevos casos en una población durante períodos de tiempo acumulados.

Fórmula:
densidad de incidencia = casos nuevos observados / ñsuma de los períodes de riesgo

```{r}
# Calcular densidad de incidencia
tiempo_total <- sum(datos$tiempo_observacion)

densidad_incidencia <- casos_nuevos / tiempo_total

cat("Densidad de Incidencia:", round(densidad_incidencia, 2), "casos por persona-año\n")
```

Interpretación: Este valor representa cuántos casos nuevos se generan por persona-año.

Visualización de las Métricas
Gráfico Comparativo

```{r}
library(ggplot2)

# Crear datos para el gráfico
resultados <- data.frame(
  medida = c("Prevalencia", "Incidencia Acumulada", "Densidad de Incidencia"),
  valor = c(prevalencia * 100, incidencia_acumulada * 100, densidad_incidencia)
)

# Gráfico de barras
ggplot(resultados, aes(x = medida, y = valor, fill = medida)) +
  geom_bar(stat = "identity") +
  labs(title = "Medidas de Frecuencia Epidemiológica",
       x = "Medida", y = "Valor (%)") +
  theme_minimal()
```


Herramientas adicionales
Número básico de Reproducción R0
Aalgunas herramientas adicionales y modernas que se usan para analizar el impacto de enfermedades en una población incluyen:

El número básico de reproducción R₀ es una métrica clave en epidemiología para estimar cuántos casos secundarios genera un caso inicial en una población completamente susceptible. Es esencial para evaluar el potencial de propagación de enfermedades infecciosas como el COVID-19.

El número básico de reproducción R₀ indica el promedio de casos secundarios generados por un caso inicial en una población completamente susceptible.

Cómo calcular R₀
El cálculo de R₀ puede realizarse usando varias metodologías. Una de las más comunes se basa en la relación:

R0 = β x D

Donde:

β (tasa de transmisión): Probabilidad de que una persona infectada transmita la enfermedad por unidad de tiempo.

D (duración infecciosa): Tiempo promedio durante el cual una persona infectada puede transmitir la enfermedad.

Para calcularlo usando datos reales del COVID-19, podemos usar un data.frame simulado o datos reales si se dispone de ellos.

Usamos un conjunto de datos que simula la propagación del COVID-19 en una población.

```{r}
## Dataset Simulado de COVID-19

set.seed(123)

datos <- data.frame(
  id = 1:30,
  fecha = seq(as.Date("2020-03-01"), as.Date("2020-03-30"), by = "days"),
  nuevos_casos = round(runif(30, 50, 150)),  # Nuevos casos diarios
  recuperados = round(runif(30, 30, 100)),  # Recuperaciones diarias
  fallecidos = round(runif(30, 1, 10)))      # Fallecimientos diarios


# Mostrar los primeros datos
head(datos)
```

```{r}
View(datos)
```

Calcular R₀: Método Simplificado
Definición
Para estimar R₀, necesitamos:

Duración infecciosa promedio (D): Asumimos 10 días para COVID-19.

Crecimiento exponencial (λ): Calculado a partir de la tasa de nuevos casos diarios.

Paso 1: Calcular Crecimiento Diario


```{r}
# Crecimiento diario de casos
datos$crecimiento <- c(NA, diff(datos$nuevos_casos))

# Calcular el promedio del crecimiento diario
lambda <- mean(datos$crecimiento, na.rm = TRUE)

cat("Crecimiento diario promedio (λ):", round(lambda, 2), "casos por día\n")
```

Paso 2: Calcular R₀

```{r}
# Asumimos una duración infecciosa promedio D = 10 días
D <- 10

# Estimación de R₀
R0 <- lambda * D
cat("Número básico de reproducción (R₀):", round(R0, 2), "\n")
```

Visualización del Número R₀
Gráfico de Nuevos Casos

```{r}
library(ggplot2)

ggplot(datos, aes(x = fecha, y = nuevos_casos)) +
  geom_line(color = "blue", size = 1) +
  geom_point(color = "red") +
  labs(title = "Nuevos Casos Diarios de COVID-19",
       x = "Fecha", y = "Nuevos Casos") +
  theme_minimal()
```


Reflexión
¿Cómo influye la duración infecciosa promedio (D) en el cálculo de R₀?

¿Qué intervenciones (como cuarentenas o vacunación) pueden reducir β y, por ende, R₀?

¿Qué significa un R₀ > 1 para la propagación de la enfermedad?

Detalles del Ejemplo
Duración Infecciosa Promedio (D):
Se puede ajustar con base en evidencia clínica, como estudios que estimen cuánto tiempo los pacientes con COVID-19 son infecciosos.
Datos Simulados:
En este ejemplo, los datos son generados aleatoriamente. Puedes reemplazarlos con datos reales del COVID-19 de fuentes como Our World in Data o bases gubernamentales.
Crecimiento Diario (λ):
El crecimiento promedio se calcula con la diferencia diaria de nuevos casos.

Uso de Paquetes Adicionales
Si deseas usar herramientas específicas para el cálculo de R₀, puedes explorar paquetes como EpiEstim:

```{r}
install.packages("EpiEstim")
library(EpiEstim)

# Calcular R₀ usando EpiEstim (reemplazar con datos reales)
res <- estimate_R(
  incid = datos$nuevos_casos,
  method = "parametric_si",
  config = make_config(list(mean_si = 4, std_si = 2))
)
```
```{r}
print(res$R)
```


Simulamos el brote epidemico (ficticio):

```{r}
set.seed(123)
dias <- 30

casos <- round(runif(dias, min = 10, max = 100))

datos <- data.frame(
  fecha = seq(as.Date("2020-01-01"), by = "days", length.out = dias),
  nuevos_casos = casos
)

# Mostrar los primeros datos
head(datos)
```


Configuración del Intervalo Serial
Definir el Intervalo Serial
El intervalo serial representa el tiempo promedio entre infecciones primarias y secundarias. En COVID-19, estudios sugieren una distribución gamma con:

Media: 4 días

Desviación estándar: 2 días

```{r}
# Configurar el intervalo serial
config <- make_config(
  list(mean_si = 4, std_si = 2)) # Normalmente, make_config se utiliza para crear o gestionar configuraciones
```

Calcular el Número de Reproducción Efectivo (Rₑ)
Estimar Rₑ
Usamos los datos diarios de nuevos casos para calcular Rₑ.

```{r}
# Estimar Rₑ usando EpiEstim
resultado <- estimate_R(
  incid = datos$nuevos_casos,
  method = "parametric_si",
  config = config
)
```

```{r}
# Mostrar resultados
print(resultado$R)
```


Visualización de Rₑ
Gráfico de la Evolución de Rₑ
Creamos un gráfico que muestra cómo Rₑ cambia con el tiempo, lo que puede indicar el impacto de intervenciones.

```{r}
# Gráfico de Rₑ
plot(
  resultado,
  what = "R",
  legend = FALSE,
  main = "Evolución del Número de Reproducción Efectivo (Rₑ)"
)
```



Interpretación:

Rₑ > 1: La epidemia está en expansión.

Rₑ < 1: La epidemia está disminuyendo.

La función estimate_R del paquete {EpiEstim} en R se utiliza para estimar el número de reproducción efectivo (Rₑ), es una métrica clave en epidemiología para medir la capacidad de transmisión de una enfermedad infecciosa en una población a lo largo del tiempo.

Practica
Introducción
En esta práctica calcularemos , Rₑ y R para varias enfermedades infecciosas utilizando parámetros reales. Estos valores son cruciales para comprender la dinámica de transmisión y el impacto de medidas de control.

Valores para las enfermedades Infecciosas
COVID-19 (SARS-CoV-2):

Tasa de transmisión: ~99.4% (alta transmisión en entornos cerrados) .

Tasa de mortalidad: 0.185% .

Duración infecciosa: ~10 días .

Distanciamiento social: ~30% puede reducir significativamente la transmisión.

Referencia: Estimation of the reproduction number of SARS-CoV-2.

MERS-CoV (Middle East Respiratory Syndrome):

Tasa de transmisión: ~5% (en contactos domiciliarios).

Tasa de mortalidad: ~35%.

Duración infecciosa: ~14 días.

Referencia: Emerging respiratory viral infections: MERS-CoV and influenza.

Influenza Estacional:

Tasa de transmisión: ~50–75%.

Tasa de mortalidad: ~0.1%.

Duración infecciosa: ~7 días.

Referencia: Influenza and tuberculosis co-infection: A systematic review.

Tuberculosis:

Tasa de transmisión: ~30% (en contactos cercanos).

Tasa de mortalidad: ~15%.

Duración infecciosa: Meses a años sin tratamiento.

Referencia: Tuberculosis and Covid-19 Co-Infection.

Sarampión:

Tasa de transmisión: 90–100% (muy alta).

Tasa de mortalidad: ~0.2% en países desarrollados; más alta en contextos sin vacunación.

Duración infecciosa: ~8 días.

Referencia: Molecular and Cellular Mechanisms of M. tuberculosis and SARS-CoV-2 Infections.

Simularemos la propagación de 5 enfermedades infecciosas con diferentes tasas de transmisión, mortalidad y duración infecciosa. Estas simulaciones se basarán en parámetros obtenidos de la literatura científica.

```{r}
# Parámetros de las enfermedades
enfermedades <- data.frame(
  Enfermedad = c("COVID-19", "MERS-CoV", "Influenza Estacional", "Tuberculosis", "Sarampión"),
  Tasa_Transmision = c(99.4, 5, 60, 30, 95), # Porcentaje
  Tasa_Mortalidad = c(0.185, 35, 0.1, 15, 0.2), # Porcentaje
  Duracion_Infecciosa = c(10, 14, 7, 180, 8), # Días
  Distanciamiento_Social = c(30, 0, 15, 10, 0), # Porcentaje
  Poblacion = c(1000000, 1000000, 1000000, 1000000, 1000000) # Población para simulación
)
```

Cálculo de R₀
Fórmula de R₀
R₀ (Número básico de reproducción):

Representa el número promedio de infecciones secundarias causadas por un individuo infectado en una población completamente susceptible.

Fórmula:
R0 = Tasa de transmisión x Duración infecciosa

```{r}
# Calcular R₀ para cada enfermedad
enfermedades$R0 <- (enfermedades$Tasa_Transmision / 100) * enfermedades$Duracion_Infecciosa

# Mostrar resultados
enfermedades[c("Enfermedad", "R0")]
```

Cálculo de Rₑ
Fórmula de Rₑ
Calcula Re onsiderando que no toda la población es susceptible (debido a inmunidad o intervenciones).

Fórmula:

Re = Ro * susceptibles / población total

```{r}
# Considerar 70% de la población inicial como susceptibles
enfermedades$Susceptibles <- enfermedades$Poblacion * 0.7

# Calcular Rₑ
enfermedades$Re <- enfermedades$R0 * (enfermedades$Susceptibles / enfermedades$Poblacion)

# Mostrar resultados
enfermedades[c("Enfermedad", "R0", "Re")]
```

Cálculo de Rₜ
Dinámica Temporal de Rₜ
Consideramos intervenciones como distanciamiento social y cambios en los susceptibles a lo largo del tiempo.

```{r}
# Crear un data frame para simular la dinámica temporal
dias <- 30
resultado_rt <- data.frame()

for (i in 1:nrow(enfermedades)) {
  enfermedad <- enfermedades[i, ]
  susceptibles <- enfermedad$Susceptibles
  rt <- numeric(dias)
  
  for (t in 1:dias) {
    rt[t] <- enfermedad$R0 * (susceptibles / enfermedad$Poblacion) * (1 - enfermedad$Distanciamiento_Social / 100)
    susceptibles <- max(0, susceptibles - (susceptibles * enfermedad$Tasa_Transmision / 100)) # Reducir susceptibles
  }
  
  resultado_rt <- rbind(resultado_rt, data.frame(Dia = 1:dias, R_t = rt, Enfermedad = enfermedad$Enfermedad))
}

# Mostrar resultados para una enfermedad
head(resultado_rt[resultado_rt$Enfermedad == "COVID-19", ])
```

Visualización de Rₜ
Gráfico para Cada Enfermedad

```{r}
library(ggplot2)

# Gráfico de Rₜ
ggplot(resultado_rt, aes(x = Dia, y = R_t, color = Enfermedad)) +
  geom_line(size = 1) +
  geom_hline(yintercept = 1, linetype = "dashed", color = "red") +
  labs(title = "Evolución de Rt por Enfermedad", 
       x = "Días", y = "Rt") +
  theme_minimal() +
  scale_color_brewer(palette = "Set1")
```


Bonus track:
Podemos crear una función en R para simular la enfermedad
En el siguiente bloque de codigo se crea la función simular_enfermedad

```{r}
# Crear una función de simulación
simular_enfermedad <- function(enfermedad, tasa_transmision, tasa_mortalidad, duracion, dist_social, poblacion = 1000) {
  dias <- 30
  infecciosos <- 1  # Casos iniciales
  recuperados <- 0
  fallecidos <- 0
  susceptibles <- poblacion - infecciosos
  
  resultado <- data.frame(Dia = 1:dias, Infectados = NA, Recuperados = NA, Fallecidos = NA, Susceptibles = NA)
  
  for (dia in 1:dias) {
    nuevas_infecciones <- round((infecciosos * tasa_transmision / 100) * (1 - dist_social / 100))
    nuevas_infecciones <- min(nuevas_infecciones, susceptibles)  # No exceder susceptibles
    
    nuevos_recuperados <- ifelse(dia > duracion, infecciosos / duracion, 0)
    nuevos_fallecidos <- round((tasa_mortalidad / 100) * infecciosos)
    
    infecciosos <- infecciosos + nuevas_infecciones - nuevos_recuperados - nuevos_fallecidos
    recuperados <- recuperados + nuevos_recuperados
    fallecidos <- fallecidos + nuevos_fallecidos
    susceptibles <- poblacion - infecciosos - recuperados - fallecidos
    
    resultado[dia, ] <- c(dia, infecciosos, recuperados, fallecidos, susceptibles)
  }
  return(resultado)
}
```


Una vez creada la función ahora podemos utilizarla:
Vamos a crear un objeto que garde los datos simulados de una enfermedad ( puede ser de los datos que ya revisamos en la literatura)


# Simulación de ejemplo para COVID-19
sim_covid <- simular_enfermedad(
  "COVID-19", tasa_transmision = 99.4, tasa_mortalidad = 20, 
  duracion = 10, dist_social = 30, poblacion = 1000
)

```{r}
# Simulación de ejemplo para COVID-19
sim_covid <- simular_enfermedad(
  "COVID-19", tasa_transmision = 99.4, tasa_mortalidad = 20, 
  duracion = 10, dist_social = 30, poblacion = 1000
)
```


```{r}
library(ggplot2)

# Gráfico para COVID-19
ggplot(sim_covid, aes(x = Dia)) +
  geom_line(aes(y = Infectados, color = "Infectados")) +
  geom_line(aes(y = Recuperados, color = "Recuperados")) +
  geom_line(aes(y = Fallecidos, color = "Fallecidos")) +
  geom_line(aes(y = Susceptibles, color = "Susceptibles")) +
  labs(title = "Simulación de Covid-19", 
       x = "Días", y = "Número de Personas") +
  scale_color_manual(name = "Estado", values = c("Infectados" = "red", 
                                                 "Recuperados" = "green", 
                                                 "Fallecidos" = "black", 
                                                 "Susceptibles" = "blue")) +
  theme_minimal()
```

Conclusión
La simulación permite visualizar la dinámica de transmisión y el impacto de intervenciones como el distanciamiento social. Los resultados pueden usarse para planificar respuestas ante brotes reales.

Además, permite analizar la dinámica de la propagación de enfermedades bajo diferentes escenarios de intervención y parámetros epidemiológicos.

Siguientes pasos:

Ajustar parámetros para escenarios específicos.

Comparar entre diferentes poblaciones y entornos.

Calculo de tamaño muestral
Introducción
El cálculo del tamaño de muestra es una etapa crucial en el diseño de estudios. Cuando deseamos estimar una proporción, debemos considerar: 1. Nivel de confianza (Zα): Representa la probabilidad de que el intervalo de confianza contenga el valor verdadero. Ejemplo: 95% (( Z = 1.96 )). 2. Precisión deseada (( e )): Diferencia máxima aceptable entre la proporción estimada y la real. 3. Proporción esperada (( p )): Estimación inicial basada en literatura o estudios previos.

En este ejercicio, utilizaremos el paquete pwr para calcular el tamaño de muestra necesario para conocer la prevalencia de diabetes en una población, suponiendo que: - Nivel de confianza: 95% - Precisión deseada: 5% - Proporción esperada: 50% (0.5).

Instalación y configuración de paquetes
Primero, asegurémonos de instalar y cargar los paquetes necesarios.

Paquete pwr

```{r}
# Ejecutar solo una vez si no está instalado:
# install.packages("pwr")

library(pwr)
```


Fórmula para estimar el tamaño de muestra
El cálculo del tamaño de muestra para estimar una proporción se realiza con la fórmula:



Fórmula tamaño de muestra para proporción
Donde:

Z: valor correspondiente al nivel de confianza (por ejemplo, Z = 1.96 para 95 %).
p: proporción esperada.
e: precisión deseada (error máximo permitido).
Aunque el paquete pwr simplifica este cálculo, también podemos hacerlo de forma manual paso a paso en R.

Cálculo del tamaño de muestra
Método 1: Cálculo manual
Utilizando directamente la fórmula clásica para proporciones en población “infinita”:


```{r}
# Parámetros
Z <- 1.96   # Nivel de confianza para 95 %
p <- 0.5    # Proporción esperada
e <- 0.05   # Precisión deseada (5 %)

# Cálculo del tamaño de muestra
n_manual <- (Z^2 * p * (1 - p)) / (e^2)

cat("Tamaño de muestra necesario (método manual):",
    ceiling(n_manual), "\n")
```

Método 2: Uso del paquete pwr
El paquete pwr proporciona una forma más general, basada en tamaño de efecto (h) y poder estadístico.

Supongamos que queremos detectar una diferencia entre una proporción nula p0 = 0.5 y una proporción alternativa p1 = 0.6 con α = 0.05 y poder 80 %:

```{r}
# Parámetros para prueba de una proporción
p0 <- 0.5   # Proporción nula
p1 <- 0.6   # Proporción alternativa

# Tamaño de efecto de Cohen (h) para proporciones
h <- ES.h(p1 = p1, p2 = p0)

# Cálculo del tamaño de muestra con pwr.p.test
res_pwr <- pwr.p.test(h = h,
                      sig.level = 0.05,
                      power = 0.80,
                      alternative = "two.sided")

n_pwr <- ceiling(res_pwr$n)

cat("Tamaño de muestra necesario (pwr.p.test):",
    n_pwr, "\n")
```

Tamaño de muestra en poblaciones finitas
Cuando se conoce el tamaño total de la población, se ajusta el tamaño de muestra mediante la fórmula para poblaciones finitas:



Fórmula población finita
Donde:

N: tamaño de la población.
Z: valor correspondiente al nivel de confianza.
p: proporción esperada.
q = 1 − p.
d: precisión deseada.
En este ejercicio, calculamos el tamaño de muestra para:

N = 10,000
Nivel de confianza: 95 % (Z = 1.96)
Proporción esperada: p = 0.05 (5 %)
Precisión deseada: d = 0.03 (3 %)


```{r}
# Parámetros
N <- 10000   # Tamaño de la población
Z <- 1.96    # Nivel de confianza para 95 %
p <- 0.05    # Proporción esperada (5 %)
q <- 1 - p   # Complemento de la proporción
d <- 0.03    # Precisión deseada (3 %)

# Cálculo del tamaño de muestra para población finita
n_finita <- (N * Z^2 * p * q) /
  ((d^2 * (N - 1)) + (Z^2 * p * q))

cat("Tamaño de muestra necesario (N = 10,000):",
    ceiling(n_finita), "\n")
```
Paso 2: Variación del tamaño de muestra según la precisión
Creamos un gráfico que muestre cómo cambia el tamaño de muestra con distintos valores de d:

```{r}
library(ggplot2)

# Secuencia de precisiones posibles
precisiones <- seq(0.01, 0.10, by = 0.01)

tam_muestra <- sapply(precisiones, function(d){
  (N * Z^2 * p * q) /
    ((d^2 * (N - 1)) + (Z^2 * p * q))
})

# Data frame para graficar
datos_grafico <- data.frame(
  precision      = precisiones,
  tamano_muestra = ceiling(tam_muestra)
)

ggplot(datos_grafico,
       aes(x = precision, y = tamano_muestra)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Relación entre precisión (d) y tamaño de muestra\n(N = 10,000)",
    x     = "Precisión deseada (d)",
    y     = "Tamaño de muestra"
  ) +
  theme_minimal()
```

Ejemplo adicional: población de 15,000 habitantes
Ahora calculamos el tamaño de muestra para estimar la prevalencia de diabetes en una población finita de 15,000 habitantes, con:

Seguridad: 95 %
Precisión: 3 % (d = 0.03)
Proporción esperada: p = 0.05 (5 %)

```{r}
# Parámetros
N <- 15000   # Tamaño de la población
Z <- 1.96    # Nivel de confianza para 95 %
p <- 0.05    # Proporción esperada (5 %)
q <- 1 - p
d <- 0.03    # Precisión deseada (3 %)

# Cálculo para población finita
n_finita_15000 <- (N * Z^2 * p * q) /
  ((d^2 * (N - 1)) + (Z^2 * p * q))

cat("Tamaño de muestra necesario (N = 15,000):",
    ceiling(n_finita_15000), "\n")
```
Exploración gráfica (N = 15,000)

```{r}
precisiones <- seq(0.01, 0.10, by = 0.01)

tam_muestra <- sapply(precisiones, function(d){
  (N * Z^2 * p * q) /
    ((d^2 * (N - 1)) + (Z^2 * p * q))
})

datos_grafico <- data.frame(
  precision      = precisiones,
  tamano_muestra = ceiling(tam_muestra)
)

ggplot(datos_grafico,
       aes(x = precision, y = tamano_muestra)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Relación entre precisión (d) y tamaño de muestra\n(N = 15,000)",
    x     = "Precisión deseada (d)",
    y     = "Tamaño de muestra"
  ) +
  theme_minimal()
```


Tamaño de muestra para estimar una media

```{r}
# Parámetros
Z  <- 1.96   # Nivel de confianza (95 %)
S2 <- 250    # Varianza (S^2)
d  <- 3      # Precisión deseada

# Cálculo del tamaño de muestra
n_media_manual <- (Z^2 * S2) / (d^2)

cat("Tamaño de muestra (media, método manual):",
    ceiling(n_media_manual), "\n")
```

Tamaño de muestra para media con

```{r}
# Parámetros
Z  <- 1.96   # Nivel de confianza (95 %)
S2 <- 250    # Varianza (S^2)
d  <- 3      # Precisión deseada

# Cálculo del tamaño de muestra
n_manual <- (Z^2 * S2) / (d^2)

cat("Tamaño de muestra (media, método manual):",
    ceiling(n_manual), "\n")
```

Comparación de dos proporciones

```{r}
# Parámetros
Z_alpha <- 1.645  # Nivel de confianza ~95 % (una cola)
Z_beta  <- 0.842  # Poder estadístico 80 %
p1 <- 0.7         # Proporción 1
p2 <- 0.9         # Proporción 2
p  <- (p1 + p2) / 2  # Promedio de proporciones

# Cálculo del tamaño de muestra (por grupo)
n_dos_prop_manual <- (
  (Z_alpha * sqrt(2 * p * (1 - p)) +
     Z_beta  * sqrt(p1 * (1 - p1) + p2 * (1 - p2)))^2
) / (p1 - p2)^2

cat("Tamaño de muestra por grupo (dos proporciones, manual):",
    ceiling(n_dos_prop_manual), "\n")
```
```{r}
# Cálculo del tamaño del efecto h para dos proporciones
h <- ES.h(p1 = p1, p2 = p2)

# Tamaño de muestra por grupo con pwr.2p.test
res_2p <- pwr.2p.test(
  h         = h,
  sig.level = 0.05,
  power     = 0.80,
  alternative = "two.sided"
)

cat("Tamaño de muestra por grupo (dos proporciones, pwr):",
    ceiling(res_2p$n), "\n")
```

Comparación de dos medias:

```{r}
# Parámetros
Z_alpha <- 1.645  # Nivel de confianza ~95 % (una cola)
Z_beta  <- 1.282  # Poder estadístico 90 %
S       <- 16     # Desviación estándar
d_mean  <- 15     # Diferencia esperada entre medias

# Cálculo del tamaño de muestra por grupo
n_dos_medias <- (2 * (Z_alpha + Z_beta)^2 * S^2) / (d_mean^2)

cat("Tamaño de muestra por grupo (dos medias, manual):",
    ceiling(n_dos_medias), "\n")
```

