Siguiendo el ejercicio realizado en clase se simulan 5.000 veces una muestra de 100 personas, el porcentaje promedio de contagios debería ser de 6% del total de la población positiva para covid-19.
library(ggplot2)#libreria para graficos
## Warning: package 'ggplot2' was built under R version 3.6.3
library(plotly)
## Warning: package 'plotly' was built under R version 3.6.3
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
calc_sick=function(n){
workers=sample(c(rep("+",60),rep("-",940)))
sample=sample(workers,size = n)
sick_sample=sum(sample=="+")
return(sick_sample)
}
cases=rep(NA,5000)
for(i in 1:5000){
cases[i]=calc_sick(n=100)
}
mean(cases)
## [1] 5.9826
con 5000 simulaciones de muestras de 100, el porcentaje de contagios promedio por COVID-19 sigue siendo aproximadaente de 6%, lo que es consistente con el Teorema Central del Limite.
Ahora, para graficar
data_cases=as.data.frame(cases)
hist_cases<-ggplot(data=data_cases, aes(x=cases, color=cases))+geom_histogram(binwidth = .5)+theme_bw()+xlab("Casos promedio de Contagio (%) ")+
ggtitle("Histograma de Porcentaje promedio de contagiados (5mil simulaciones)")+ theme(legend.position = "bottom", plot.title = element_text(hjust=0.5))
hist_cases
ggplotly(hist_cases)
el promedio de contagios se acerca al poblacionalluego de 5mil muestras de 100 personas cada una, consitente con teorema central del limite
Ahora, para el caso donde el 30% de la poblacion es contagiada.
calc_sick2=function(n){
workers2=sample(c(rep("+",300),rep("-",700)))
sample2=sample(workers2,size = n)
sick_sample2=sum(sample2=="+")
return(sick_sample2)
}
cases2=rep(NA,5000)
for(i in 1:5000){
cases2[i]=calc_sick2(n=100)
}
mean(cases2)
## [1] 29.9272
El contagio promedio de las muestras concuerda con el poblacional. Lo cual se evidencia en el siguiente histograma.
data_cases2 = as.data.frame(cases2)
hist_cases2<-ggplot(data=data_cases2, aes(x=cases, color=cases))+geom_histogram(binwidth = .5)+theme_bw()+xlab("Casos promedio de Contagio (%) ")+
ggtitle("Histograma de Porcentaje promedio de contagiados (5mil simulaciones)")+ theme(legend.position = "bottom", plot.title = element_text(hjust=0.5))
hist_cases2
ggplotly(hist_cases2)