##Taller 3 #Layla Castellanos, Sara Hernandez y Laura Sofia González #Grupo 10
#1.
polinizadores= read.table("C:\\Users\\USUARIO\\Downloads\\pollination_ants2.txt", header=T)
polinizadores
## Trial Colony Ants Dye_removed.ng.
## 1 1 1 1 405.214447
## 2 2 3 1 729.537431
## 3 3 1 1 485.047679
## 4 4 3 1 148.824901
## 5 5 1 1 203.493025
## 6 6 3 1 316.606466
## 7 8 1 1 281.743693
## 8 9 3 1 1222.641268
## 9 13 5 1 147.134368
## 10 14 6 1 101.239414
## 11 15 5 1 647.975522
## 12 16 6 1 115.203838
## 13 17 5 1 557.397279
## 14 18 6 1 380.888806
## 15 19 5 1 1062.947136
## 16 20 6 1 1.693226
## 17 1 1 0 1034.427010
## 18 2 3 0 1439.745270
## 19 3 1 0 801.913037
## 20 4 3 0 392.883216
## 21 5 1 0 219.558082
## 22 6 3 0 263.043091
## 23 8 1 0 406.926551
## 24 9 3 0 1657.380260
## 25 13 5 0 213.508142
## 26 14 6 0 477.160034
## 27 15 5 0 1269.296556
## 28 16 6 0 231.970716
## 29 17 5 0 454.201661
## 30 18 6 0 922.499053
## 31 19 5 0 1332.391825
## 32 20 6 0 2.141238
Descripcion= data.frame("Variable"=c("Trial", "Colony", "Ant", "Dye_removed"), "Descripcion"=c("Numero de intento", "Numero que identifica la colonia", "Presencia o ausencia de hormigas", "Cantidad de tinta removida de la flor artificial"), "V.Dependiente"=c("No", "No", "No", "Si"), "V.independiente"=c("Si", "Si", "Si", "No"), "Tipo de Variable"=c("Ordinal", "Nominal", "Cualitativa", "Cuantitativa"))
Descripcion
## Variable Descripcion V.Dependiente
## 1 Trial Numero de intento No
## 2 Colony Numero que identifica la colonia No
## 3 Ant Presencia o ausencia de hormigas No
## 4 Dye_removed Cantidad de tinta removida de la flor artificial Si
## V.independiente Tipo.de.Variable
## 1 Si Ordinal
## 2 Si Nominal
## 3 Si Cualitativa
## 4 No Cuantitativa
#2.
hormigas= subset(polinizadores, Ants==1)
hormigas_no= subset(polinizadores, Ants==0)
hormigas_mean= mean(hormigas$Dye_removed.ng.)
hormigas_sd= sd(hormigas$Dye_removed.ng.)
hormigas_var= var(hormigas$Dye_removed.ng.)
hormigas_mediana= median(hormigas$Dye_removed.ng.)
hormigas_no_mean= mean(hormigas_no$Dye_removed.ng.)
hormigas_no_var= var(hormigas_no$Dye_removed.ng.)
hormigas_no_sd= sd(hormigas_no$Dye_removed.ng.)
hormigas_no_mediana= median(hormigas_no$Dye_removed.ng.)
Tabla_datos= data.frame("Tratamiento"=c("Presencia de Hormigas", "Sin presencia de hormigas"), "media"= c(hormigas_mean, hormigas_no_mean), "mediana"=c(hormigas_mediana, hormigas_no_mediana), "Desviacion estandar"=c(hormigas_sd, hormigas_no_sd), "Varianza"=c(hormigas_var, hormigas_no_var))
Tabla_datos
## Tratamiento media mediana Desviacion.estandar Varianza
## 1 Presencia de Hormigas 425.4743 348.7476 348.7062 121596.0
## 2 Sin presencia de hormigas 694.9404 465.6808 517.2954 267594.5
#3
library(ggplot2)
ggplot(hormigas, aes(x=Dye_removed.ng.)) + geom_histogram(bins=6, color="black") + theme_classic() + ggtitle("Histograma tratamiento con hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_mean, color="red")) +geom_vline(aes(xintercept=hormigas_mediana, color="blue")) + theme(legend.position = "none")
ggplot(hormigas_no, aes(x=Dye_removed.ng.)) + geom_histogram(bins=10, color="black") + theme_classic() + ggtitle("Histograma tratamiento sin hormigas")+ xlab("Cantidad de tinta removida (ng)") + ylab("Frecuencia")+ geom_vline(aes(xintercept=hormigas_no_mean, color="red")) +geom_vline(aes(xintercept=hormigas_no_mediana, color="blue")) + theme(legend.position = "none")
#lineas rojas media y linea azul mediana
La linea vertical azul en ambas graficas indica la mediana, y la linea roja la media.
#4 Ho: La presencia de hormigas en las flores no afecta la estadía de los abejorros en las mismas Ha: La presencia de hormigas en las flores si influye en la estadía de los abejorros
mediana.diff.hormigas= hormigas_no_mediana- hormigas_mediana
mediana.diff.hormigas
## [1] 116.9332
nPerm= 50
diferencia_mediana= length(nPerm)
for(i in 1:49){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}
diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=mediana.diff.hormigas, color="blue"))+ theme(legend.position = "none")
#Permutation 100000
nPerm=100000
diferencia_mediana= length(nPerm)
for(i in 1:99999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}
diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ theme(legend.position = "none")
#Permutation 500000
nPerm=500000
diferencia_mediana= length(nPerm)
for(i in 1:499999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}
diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ theme(legend.position = "none")
#Permutation 1000000
nPerm=1000000
diferencia_mediana= length(nPerm)
for(i in 1:999999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}
diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=8, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ theme(legend.position = "none")
#Permutation 5000000
nPerm=1500000
diferencia_mediana= length(nPerm)
for(i in 1:1499999){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_mediana[i]= (median(nuevo_no_hormigas)- median(nuevo_hormigas))}
diferencia_mediana[nPerm]=mediana.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_mediana)
ggplot(nula_hormigas, aes(x=diferencia_mediana)) + geom_histogram(bins=10, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de mediana") + xlab("Diferencia medianas")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=mediana.diff.hormigas, color="blue"))+ theme(legend.position = "none")
Valor de Significancia : 0.04 #5
my.alpha= 0.04
alpha_cutoff_upper <- mediana.diff.hormigas[5000]
alpha_cutoff_upper
## [1] NA
alpha_cutoff_lower <- mediana.diff.hormigas[995000]
alpha_cutoff_lower
## [1] NA
pValue <- 2*((sum(nula_hormigas <=mediana.diff.hormigas))/(nPerm))
#Bono Ho: La media de la tinta removida para las flores con hormigas es igual a la media de la tinta removida en las flores sin hormigas
Ha: La media de la tinta removida para las flores con hormigas es diferente a la media de la tinta removida en las flores sin hormigas
media.diff.hormigas= hormigas_no_mean- hormigas_mean
media.diff.hormigas
## [1] 269.4661
nPerm= 50
diferencia_media= length(nPerm)
for(i in 1:49){shuffle_numbers<-sample(x=polinizadores$Dye_removed.ng., replace=F)
nuevo_hormigas=shuffle_numbers[1:16]
nuevo_no_hormigas=shuffle_numbers[17:32]
diferencia_media[i]= (mean(nuevo_no_hormigas)- mean(nuevo_hormigas))}
diferencia_media[nPerm]=media.diff.hormigas
library(ggplot2)
nula_hormigas= data.frame(sim=1:50, diferencia_media)
ggplot(nula_hormigas, aes(x=diferencia_media)) + geom_histogram(bins=6, color="black")+ theme_classic()+ggtitle("Histograma de la diferencia de media") + xlab("Diferencia media")+ ylab("Frecuencia")+ geom_vline(aes(xintercept=media.diff.hormigas, color="blue"))+ theme(legend.position = "none")