Siguiendo el ejercicio realizado en clase se simulan 5.000 veces una muestra de 100 personas, el porcentaje promedio de contagios debería ser de 6% del total de la población positiva para covid-19.

library(ggplot2)#libreria para graficos
## Warning: package 'ggplot2' was built under R version 3.6.3
library(plotly)
## Warning: package 'plotly' was built under R version 3.6.3
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
calc_sick=function(n){
  
  workers=sample(c(rep("+",60),rep("-",940)))
  
  sample=sample(workers,size = n)
  sick_sample=sum(sample=="+")
  
  return(sick_sample)
}

cases=rep(NA,5000)  
for(i in 1:5000){
  cases[i]=calc_sick(n=100)
}

mean(cases)
## [1] 5.9826

con 5000 simulaciones de muestras de 100, el porcentaje de contagios promedio por COVID-19 sigue siendo aproximadaente de 6%, lo que es consistente con el Teorema Central del Limite.

Ahora, para graficar

data_cases=as.data.frame(cases)

hist_cases<-ggplot(data=data_cases, aes(x=cases, color=cases))+geom_histogram(binwidth = .5)+theme_bw()+xlab("Casos promedio de Contagio (%) ")+
  ggtitle("Histograma de Porcentaje promedio de contagiados (5mil simulaciones)")+ theme(legend.position = "bottom", plot.title = element_text(hjust=0.5))
hist_cases

ggplotly(hist_cases)

el promedio de contagios se acerca al poblacionalluego de 5mil muestras de 100 personas cada una, consitente con teorema central del limite

Ahora, para el caso donde el 30% de la poblacion es contagiada.

calc_sick2=function(n){
  
  workers2=sample(c(rep("+",300),rep("-",700)))
  
  sample2=sample(workers2,size = n)
  sick_sample2=sum(sample2=="+")
  
  return(sick_sample2)
}

cases2=rep(NA,5000)  
for(i in 1:5000){
  cases2[i]=calc_sick2(n=100)
  
}


mean(cases2)
## [1] 29.9272

El contagio promedio de las muestras concuerda con el poblacional. Lo cual se evidencia en el siguiente histograma.

data_cases2 = as.data.frame(cases2)
hist_cases2<-ggplot(data=data_cases2, aes(x=cases, color=cases))+geom_histogram(binwidth = .5)+theme_bw()+xlab("Casos promedio de Contagio (%) ")+
  ggtitle("Histograma de Porcentaje promedio de contagiados (5mil simulaciones)")+ theme(legend.position = "bottom", plot.title = element_text(hjust=0.5))
hist_cases2

ggplotly(hist_cases2)