##Taller 4

polinizadores= read.table("C:\\Users\\USUARIO\\Downloads\\pollination_ants2.txt", header=T)

polinizadores
##    Trial Colony Ants Dye_removed.ng.
## 1      1      1    1      405.214447
## 2      2      3    1      729.537431
## 3      3      1    1      485.047679
## 4      4      3    1      148.824901
## 5      5      1    1      203.493025
## 6      6      3    1      316.606466
## 7      8      1    1      281.743693
## 8      9      3    1     1222.641268
## 9     13      5    1      147.134368
## 10    14      6    1      101.239414
## 11    15      5    1      647.975522
## 12    16      6    1      115.203838
## 13    17      5    1      557.397279
## 14    18      6    1      380.888806
## 15    19      5    1     1062.947136
## 16    20      6    1        1.693226
## 17     1      1    0     1034.427010
## 18     2      3    0     1439.745270
## 19     3      1    0      801.913037
## 20     4      3    0      392.883216
## 21     5      1    0      219.558082
## 22     6      3    0      263.043091
## 23     8      1    0      406.926551
## 24     9      3    0     1657.380260
## 25    13      5    0      213.508142
## 26    14      6    0      477.160034
## 27    15      5    0     1269.296556
## 28    16      6    0      231.970716
## 29    17      5    0      454.201661
## 30    18      6    0      922.499053
## 31    19      5    0     1332.391825
## 32    20      6    0        2.141238

Punto 1a:

hormigas= subset(polinizadores, Ants==1)
hormigas_no= subset(polinizadores, Ants==0)

hormigas_mean= mean(hormigas$Dye_removed.ng.)
hormigas_sd= sd(hormigas$Dye_removed.ng.)
hormigas_var= var(hormigas$Dye_removed.ng.)
hormigas_mediana= median(hormigas$Dye_removed.ng.)

hormigas_no_mean= mean(hormigas_no$Dye_removed.ng.)
hormigas_no_var= var(hormigas_no$Dye_removed.ng.)
hormigas_no_sd= sd(hormigas_no$Dye_removed.ng.)
hormigas_no_mediana= median(hormigas_no$Dye_removed.ng.)

Tabla_datos= data.frame("Tratamiento"=c("Presencia de Hormigas", "Sin presencia de hormigas"), "media"= c(hormigas_mean, hormigas_no_mean), "mediana"=c(hormigas_mediana, hormigas_no_mediana), "Desviacion estandar"=c(hormigas_sd, hormigas_no_sd), "Varianza"=c(hormigas_var, hormigas_no_var))

Tabla_datos
##                 Tratamiento    media  mediana Desviacion.estandar Varianza
## 1     Presencia de Hormigas 425.4743 348.7476            348.7062 121596.0
## 2 Sin presencia de hormigas 694.9404 465.6808            517.2954 267594.5
library(ggplot2)
ggplot(hormigas, aes(x=Dye_removed.ng.)) + geom_histogram(bins=6, color="black") + theme_classic() + ggtitle("Histograma tratamiento con hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_mean, color="red")) +geom_vline(aes(xintercept=hormigas_mediana, color="blue")) + theme(legend.position = "none")

ggplot(hormigas_no, aes(x=Dye_removed.ng.)) + geom_histogram(bins=10, color="black") + theme_classic() + ggtitle("Histograma tratamiento sin  hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_no_mean, color="red")) +geom_vline(aes(xintercept=hormigas_no_mediana, color="blue")) + theme(legend.position = "none")

#lineas rojas media y linea azul mediana 

Lineas rojas media y linea azul mediana

Punto 2

n_boot= 10^6
mediana_bootstrap_h= numeric(length=n_boot)

for (i in 1:n_boot) {bootstrap_h= sample(hormigas$Dye_removed.ng, replace=T)
mediana_bootstrap_h[i]= median(bootstrap_h)
}
  
#Bootstrap sin hormigas

mediana_bootstrap= numeric(length=n_boot)
  
for (a in 1:n_boot) {bootstrap= sample(hormigas_no$Dye_removed.ng, replace=T)
mediana_bootstrap[a]= median(bootstrap)
}
  
group= c(mediana_bootstrap, mediana_bootstrap_h)
library(ggplot2)
ggplot()+aes(mediana_bootstrap_h) + geom_histogram(bins=14, color="black")+ theme_classic()+ xlab("Medianas calculadas por Bootstrap")+ ylab("Frecuencia")+ theme(legend.position = "none")

ggplot()+aes(mediana_bootstrap) + geom_histogram(bins=12, color="black")+ theme_classic()+ xlab("Medianas calculadas por Bootstrap")+ ylab("Frecuencia")+ theme(legend.position = "none")

datos= c(mediana_bootstrap_h, mediana_bootstrap)
tratamientos= c(rep("Con hormigas", 10^6), rep("Sin hormigas", 10^6))
datos_graficar= data.frame(datos, tratamientos)

library(ggplot2)
ggplot(datos_graficar, aes(x=datos, color=tratamientos))+ geom_histogram(bins=25 ,fill="white")

Punto 3:

sd_hormigas= sd(mediana_bootstrap_h)
sd_sin_hormigas=sd(mediana_bootstrap)

se=function(x)sqrt(sum((x-mean(x))^2))/length(x)
se_hormigas= se(hormigas$Dye_removed.ng)
se_sin_hormigas= se(hormigas_no$Dye_removed.ng)

datos= data.frame("Hormigas"=c("si","no"), "Error estándar Bootstrap"=c(sd_hormigas,sd_sin_hormigas), "Error estándar del estimado"= c(se_hormigas, se_sin_hormigas))
datos
##   Hormigas Error.estándar.Bootstrap Error.estándar.del.estimado
## 1       si                 101.0005                    84.40832
## 2       no                 219.0547                   125.21727

Punto 4:

#Punto 4 CON HORMIGAS

#Intervalo 99%
IC_99_inf_h= quantile(mediana_bootstrap_h, 0.001)
IC_99_inf_h
##     0.1% 
## 125.0322
IC_99_sup_h= quantile(mediana_bootstrap_h, 0.995)
IC_99_sup_h
##    99.5% 
## 647.9755
#Intervalo 70%
IC_70_inf_h= quantile(mediana_bootstrap_h, 0.15)
IC_70_inf_h
##      15% 
## 242.6184
IC_70_sup_h= quantile(mediana_bootstrap_h, 0.85)
IC_70_sup_h
##      85% 
## 445.1311
#Punto 4 SIN HORMIGAS

#Intervalo 99%
IC_99_inf= quantile(mediana_bootstrap, 0.001)
IC_99_inf
##     0.1% 
## 225.7644
IC_99_sup= quantile(mediana_bootstrap, 0.995)
IC_99_sup
##    99.5% 
## 1269.297
#Intervalo 70%
IC_70_inf= quantile(mediana_bootstrap, 0.15)
IC_70_inf
##      15% 
## 399.9049
IC_70_sup= quantile(mediana_bootstrap,0.85 )
IC_70_sup
##     85% 
## 862.206
#GRAFICAS


library(cowplot)
library(ggplot2)
#CON HORMIGAS
ggplot()+ aes(mediana_bootstrap_h)+ geom_histogram(bins=20, color='#FFFFFF', fill='#a387a2')+ggtitle("Medianas Bootstrap con hormigas") +geom_vline(aes(xintercept=hormigas_mediana, color="mediana_observado"), linetype="dotted", size=1)+ geom_vline(aes(xintercept= IC_99_inf_h, color="IC_99"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_99_sup_h, color="IC_99"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_70_inf_h, color="IC_70"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_70_sup_h, color="IC_70"), linetype="longdash",size=1)+ labs(x="Medianas Calculadas por Bootstrap", y="Frecuencia")+scale_color_manual(name='', breaks=c("mediana_observado", "IC_99", "IC_70"), labels=c("Mediana del Observado", "IC 99%", "IC 70%"), values=c(mediana_observado='#e7298a', IC_99='#1b9e77', IC_70='#7570b3'))+ cowplot::theme_half_open()+ theme(legend.position = "bottom")

#SIN HORMIGAS
ggplot()+ aes(mediana_bootstrap)+ geom_histogram(bins=14, color='#FFFFFF', fill='#a387a2')+ggtitle("Medianas Bootstrap sin hormigas") +geom_vline(aes(xintercept=hormigas_no_mediana, color="mediana_observado"), linetype="dotted", size=1)+ geom_vline(aes(xintercept= IC_99_inf, color="IC_99"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_99_sup, color="IC_99"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_70_inf, color="IC_70"), linetype="longdash",size=1)+ geom_vline(aes(xintercept= IC_70_sup, color="IC_70"), linetype="longdash",size=1)+ labs(x="Medianas Calculadas por Bootstrap", y="Frecuencia")+scale_color_manual(name='', breaks=c("mediana_observado", "IC_99", "IC_70"), labels=c("Mediana del Observado", "IC 99%", "IC 70%"), values=c(mediana_observado='#e7298a', IC_99='#1b9e77', IC_70='#7570b3'))+ cowplot::theme_half_open()+ theme(legend.position = "bottom")