##Taller 3 #Layla Castellanos, Sara Hernandez y Laura Sofia González #Grupo 10

#1.

polinizadores= read.table("C:\\Users\\USUARIO\\Downloads\\pollination_ants2.txt", header=T)

polinizadores
##    Trial Colony Ants Dye_removed.ng.
## 1      1      1    1      405.214447
## 2      2      3    1      729.537431
## 3      3      1    1      485.047679
## 4      4      3    1      148.824901
## 5      5      1    1      203.493025
## 6      6      3    1      316.606466
## 7      8      1    1      281.743693
## 8      9      3    1     1222.641268
## 9     13      5    1      147.134368
## 10    14      6    1      101.239414
## 11    15      5    1      647.975522
## 12    16      6    1      115.203838
## 13    17      5    1      557.397279
## 14    18      6    1      380.888806
## 15    19      5    1     1062.947136
## 16    20      6    1        1.693226
## 17     1      1    0     1034.427010
## 18     2      3    0     1439.745270
## 19     3      1    0      801.913037
## 20     4      3    0      392.883216
## 21     5      1    0      219.558082
## 22     6      3    0      263.043091
## 23     8      1    0      406.926551
## 24     9      3    0     1657.380260
## 25    13      5    0      213.508142
## 26    14      6    0      477.160034
## 27    15      5    0     1269.296556
## 28    16      6    0      231.970716
## 29    17      5    0      454.201661
## 30    18      6    0      922.499053
## 31    19      5    0     1332.391825
## 32    20      6    0        2.141238
Descripcion= data.frame("Variable"=c("Trial", "Colony", "Ant", "Dye_removed"), "Descripcion"=c("Numero de intento", "Numero que identifica la colonia", "Presencia o ausencia de hormigas", "Cantidad de tinta removida de la flor artificial"), "V.Dependiente"=c("No", "No", "No", "Si"), "V.independiente"=c("Si", "Si", "Si", "No"), "Tipo de Variable"=c("Ordinal", "Nominal", "Cualitativa", "Cuantitativa"))
Descripcion
##      Variable                                      Descripcion V.Dependiente
## 1       Trial                                Numero de intento            No
## 2      Colony                 Numero que identifica la colonia            No
## 3         Ant                 Presencia o ausencia de hormigas            No
## 4 Dye_removed Cantidad de tinta removida de la flor artificial            Si
##   V.independiente Tipo.de.Variable
## 1              Si          Ordinal
## 2              Si          Nominal
## 3              Si      Cualitativa
## 4              No     Cuantitativa

#2.

hormigas= subset(polinizadores, Ants==1)
hormigas_no= subset(polinizadores, Ants==0)

hormigas_mean= mean(hormigas$Dye_removed.ng.)
hormigas_sd= sd(hormigas$Dye_removed.ng.)
hormigas_var= var(hormigas$Dye_removed.ng.)
hormigas_mediana= median(hormigas$Dye_removed.ng.)

hormigas_no_mean= mean(hormigas_no$Dye_removed.ng.)
hormigas_no_var= var(hormigas_no$Dye_removed.ng.)
hormigas_no_sd= sd(hormigas_no$Dye_removed.ng.)
hormigas_no_mediana= median(hormigas_no$Dye_removed.ng.)

Tabla_datos= data.frame("Tratamiento"=c("Presencia de Hormigas", "Sin presencia de hormigas"), "media"= c(hormigas_mean, hormigas_no_mean), "mediana"=c(hormigas_mediana, hormigas_no_mediana), "Desviacion estandar"=c(hormigas_sd, hormigas_no_sd), "Varianza"=c(hormigas_var, hormigas_no_var))
Tabla_datos
##                 Tratamiento    media  mediana Desviacion.estandar Varianza
## 1     Presencia de Hormigas 425.4743 348.7476            348.7062 121596.0
## 2 Sin presencia de hormigas 694.9404 465.6808            517.2954 267594.5

#3

library(ggplot2)
ggplot(hormigas, aes(x=Dye_removed.ng.)) + geom_histogram(bins=6, color="black") + theme_classic() + ggtitle("Histograma tratamiento con hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_mean, color="red")) +geom_vline(aes(xintercept=hormigas_mediana, color="blue")) + theme(legend.position = "none")

ggplot(hormigas_no, aes(x=Dye_removed.ng.)) + geom_histogram(bins=10, color="black") + theme_classic() + ggtitle("Histograma tratamiento sin  hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_no_mean, color="red")) +geom_vline(aes(xintercept=hormigas_no_mediana, color="blue")) + theme(legend.position = "none")

#lineas rojas media y linea azul mediana 

La linea vertical azul en ambas graficas indica la mediana, y la linea roja la media.

#4 Ho: La presencia de hormigas en las flores no afecta la estadía de los abejorros en las mismas Ha: La presencia de hormigas en las flores si influye en la estadía de los abejorros

mediana.diff.hormigas= hormigas_no_mediana- hormigas_mediana
mediana.diff.hormigas
## [1] 116.9332
nPerm= 50
diferencia_mediana= length(nPerm)
for(i in 1:49){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}

diferencia_mediana[nPerm]=mediana.diff.hormigas

library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=mediana.diff.hormigas, color="blue"))+ theme(legend.position = "none")

#Permutation 100000
nPerm=100000
diferencia_mediana= length(nPerm)
for(i in 1:99999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}

diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ theme(legend.position = "none")

#Permutation 500000
nPerm=500000
diferencia_mediana= length(nPerm)
for(i in 1:499999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}

diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+  theme(legend.position = "none")

#Permutation 1000000
nPerm=1000000
diferencia_mediana= length(nPerm)
for(i in 1:999999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}

diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=8, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ theme(legend.position = "none")

#Permutation 5000000
nPerm=1500000
diferencia_mediana= length(nPerm)
for(i in 1:1499999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}

diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=10, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=mediana.diff.hormigas, color="blue"))+ theme(legend.position = "none")

Valor de Significancia : 0.04 #5

my.alpha= 0.04

alpha_cutoff_upper <- mediana.diff.hormigas[5000]
alpha_cutoff_upper
## [1] NA
alpha_cutoff_lower <- mediana.diff.hormigas[995000]
alpha_cutoff_lower
## [1] NA
pValue <- 2*((sum(nula_hormigas <=mediana.diff.hormigas))/(nPerm))

#Bono Ho: La media de la tinta removida para las flores con hormigas es igual a la media de la tinta removida en las flores sin hormigas
Ha: La media de la tinta removida para las flores con hormigas es diferente a la media de la tinta removida en las flores sin hormigas

media.diff.hormigas= hormigas_no_mean- hormigas_mean
media.diff.hormigas
## [1] 269.4661
nPerm= 50
diferencia_media= length(nPerm)
for(i in 1:49){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_media[i]= (mean(nuevo_no_hormigas)- mean(nuevo_hormigas))}
diferencia_media[nPerm]=media.diff.hormigas

library(ggplot2)

nula_hormigas= data.frame(sim=1:50, diferencia_media)
ggplot(nula_hormigas, aes(x=diferencia_media)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de media") + xlab("Diferencia media")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=media.diff.hormigas, color="blue"))+ theme(legend.position = "none")