Pregunta 1:
Pregunta de investigacion:¿El tipo de ambiente afecta el tamaño del cono? Predicciones: -Se observarán variaciones en el tamaño de los conos según el tipo de espacio geográfico -Se observarán variaciones en el tamaño de los conos según la presencia o ausencia de ardillas
Valor alfa: 0.03 Hipotesis cientifica: El tamaño de cono de una especie de pino se ve afectado por la presencia o ausencia de ardillas Hipótesis nula: La presencia de ardillas en el ambiente no causa una variación significativa en el tamaño de los conos de los pinos. Hipótesis alternativa: La presencia de ardillas en el ambiente si causa una variación en el tamaño de los conos de los pinos
library(ggplot2)
conos= read.table("C:\\Users\\USUARIO\\Downloads\\conos.txt", header=T)
conos
## Tipo_ambiente Masa_cono
## 1 I 9.6
## 2 I 9.4
## 3 I 8.9
## 4 I 8.8
## 5 I 8.5
## 6 I 8.2
## 7 II 6.8
## 8 II 6.6
## 9 II 6.0
## 10 II 5.7
## 11 II 5.3
## 12 III 6.7
## 13 III 6.4
## 14 III 6.2
## 15 III 5.7
## 16 III 5.6
summary(conos)
## Tipo_ambiente Masa_cono
## Length:16 Min. :5.300
## Class :character 1st Qu.:5.925
## Mode :character Median :6.650
## Mean :7.150
## 3rd Qu.:8.575
## Max. :9.600
as.data.frame(table(conos$Tipo_ambiente))
## Var1 Freq
## 1 I 6
## 2 II 5
## 3 III 5
I= subset(conos, Tipo_ambiente=="I")
II= subset(conos, Tipo_ambiente=="II")
III= subset(conos, Tipo_ambiente=="III")
I_mean= mean(I$Masa_cono)
II_mean= mean(II$Masa_cono)
III_mean= mean(III$Masa_cono)
library(beeswarm)
boostrap_order= factor(conos$Tipo_ambiente, levels=c("II", "III", "I"))
boxplot(data=conos, Masa_cono~boostrap_order, xlab="Tipo de Ambiente", ylab="Masa de los conos")
beeswarm(data=conos, Masa_cono~boostrap_order, pch=16, add=T, col= "blue")
Se puede observar que hay una variacion en la masa de los conos dependiendo del ambiente, sin embargo no podemos deducir si la diferencia de promedios es o no significativa.
library(ggplot2)
hist_I= ggplot(I, aes(x=Masa_cono)) + geom_histogram(bins=5, color="black") + theme_classic() + ggtitle("Histograma masa de cono ambiente tipo I")+ xlab("Masa de cono ambiente tipo I") + ylab("Frecuencia")
hist_I
hist_II= ggplot(II, aes(x=Masa_cono)) + geom_histogram(bins=5, color="black" ) + theme_classic()+ ggtitle("Histograma masa de cono ambiente tipo II") +xlab("Masa de cono ambiente tipo II")+ ylab("Frecuencia")
hist_II
hist_III= ggplot(III, aes(x=Masa_cono)) + geom_histogram(bins=5, color="black" ) + theme_classic()+ ggtitle("Histograma masa de cono ambiente tipo III") +xlab("Masa de cono ambiente tipo III")+ ylab("Frecuencia")
hist_III
library(gridExtra)
grid.arrange(hist_I, hist_II, hist_III, ncol=3)
I_qq= ggplot()+ xlab("Cuantil teórico") + ylab ("Muestra") + aes(sample =I$Masa_cono) +stat_qq() + stat_qq_line() +labs(title = expression(paste('Distribución Normal ambiente tipo I ', mu, ' = 0, ', sigma,' = 1'))) + theme_minimal()
I_qq
II_qq= ggplot()+ xlab("Cuantil teórico") + ylab ("Muestra") + aes(sample =II$Masa_cono) +stat_qq() + stat_qq_line() +labs(title = expression(paste('Distribución Normal ambiente tipo II', mu, ' = 0, ', sigma,' = 1'))) + theme_minimal()
II_qq
III_qq= ggplot()+ xlab("Cuantil teórico") + ylab ("Muestra") + aes(sample =III$Masa_cono) +stat_qq() + stat_qq_line() +labs(title = expression(paste('Distribución Normal ambiente tipo III', mu, ' = 0, ', sigma,' = 1'))) + theme_minimal()
III_qq
grid.arrange(I_qq, II_qq, III_qq, ncol=3)
En las graficas no es posible observar una distribucion normal.
Shapiro test Hipotesis nula= Los datos siguen una distribucion normal Hipotesis alternativa= Los datos no siguen una distribucion normal
shapiro.test(I$Masa_cono)
##
## Shapiro-Wilk normality test
##
## data: I$Masa_cono
## W = 0.96384, p-value = 0.8488
shapiro.test(II$Masa_cono)
##
## Shapiro-Wilk normality test
##
## data: II$Masa_cono
## W = 0.95235, p-value = 0.754
shapiro.test(III$Masa_cono)
##
## Shapiro-Wilk normality test
##
## data: III$Masa_cono
## W = 0.93329, p-value = 0.619
En todos los tipos de ambientes no se rechaza la hipotesis nula por lo que se deduce que tienen una distribucion normal y no es necesario hacer transformaciones.
bartlett.test(conos$Masa_cono~conos$Tipo_ambiente)
##
## Bartlett test of homogeneity of variances
##
## data: conos$Masa_cono by conos$Tipo_ambiente
## Bartlett's K-squared = 0.307, df = 2, p-value = 0.8577
p-value>alpha entonces las varianzas son iguales
modelo_conos= aov(data=conos, Masa_cono~Tipo_ambiente)
summary(modelo_conos)
## Df Sum Sq Mean Sq F value Pr(>F)
## Tipo_ambiente 2 29.404 14.702 50.09 7.79e-07 ***
## Residuals 13 3.816 0.294
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Teniendo encuenta el valor p o Pr(>F), podemos rechazar nuestra hipotesis nula y deducimos que por lo menos una de las medias es diferente a las otras.
TukeyHSD(modelo_conos,"Tipo_ambiente", ordered = T, conf.level = 0.99)
## Tukey multiple comparisons of means
## 99% family-wise confidence level
## factor levels have been ordered
##
## Fit: aov(formula = Masa_cono ~ Tipo_ambiente, data = conos)
##
## $Tipo_ambiente
## diff lwr upr p adj
## III-II 0.04 -1.162648 1.242648 0.9925198
## I-II 2.82 1.668552 3.971448 0.0000028
## I-III 2.78 1.628552 3.931448 0.0000033
plot(modelo_conos)
Teniendo encuenta la comparacion de Tukey el ambiente con una diferencia mas significativa es el I
Analisis pregunta 1: ¿Existen diferencias entre los ambientes? - Si existen diferencias en los ambientes sin embargo las diferencias de conos entre el ambiente I y los ambientes II Y III es mas significante, mientras que los ambientes II Y III tienen diferencias minimas. Esto se debe a que todos los ambientes tienen variables diferentes como la ubicacion y la presencia o n de ardillas lo que genera una diferencia.
¿Qué ambiente está asociado con un mayor tamaño de cono? (Utilice las medias obtenidas para cada ambiente para responder a esta pregunta) -El ambiente asociado a un mayor tamaño de cono es el ambiente I(media de 8.9) Ambiente I(media 8.9)> Ambiente III(media 6.12)> Ambiente II(media 6.08)
¿Qué ambiente afectó en menor medida el tamaño de cono? Realice una gráfica para ilustrar los resultados. - El ambiente que afecto en menor medida de tamaño del cono fue el ambiente II.Como se puede evidenciar en el boxplot.
library(beeswarm)
boostrap_order= factor(conos$Tipo_ambiente, levels=c("II", "III", "I"))
boxplot(data=conos, Masa_cono~boostrap_order, xlab="Tipo de Ambiente", ylab="Masa de los conos")
beeswarm(data=conos, Masa_cono~boostrap_order, pch=16, add=T, col= "blue")
¿Cuál es la conclusión biológica del análisis de los datos?
En conclusion, el ambiente I tiene una masa mayor de conos esto se debe a la ausencia de ardillas en este ambiente. Por lo que podemos deducir que la ubicacion geografica( Continente y isla) no tiene una diferencia significativa en la masa del cono, y el factor responsable de este son las ardillas.
Pregunta II:
Pregunta de investigacion:¿Las temperaturas bajas cambian el consumo de CO2 en la especie Echinochloa crus-galli?
Predicciones: -Las plantas no congeladas tendrán un porcentaje de absorción de CO2 mayor que las plantas congeladas -Se demostrará una diferencia sobre la tolerancia a bajas temperaturas entre ambos grupos.
Valor alfa: 0.06
Hipótesis científica: La especie de pasto Echinochloa crus-galli presenta una tolerancia a bajas temperaturas.
Hipótesis nula: El consumo de CO2 es el mismo en ambos tratamientos, por lo que su tolerancia en diferentes temperaturas es igual.
Hipótesis alternativa: El consumo de CO2 es diferente en ambos tratamientos, por lo que su tolerancia a temperaturas bajas es diferente.
library(ggplot2)
CO2=datasets::CO2
chill=subset(CO2, Treatment=="chilled")
no_chill=subset(CO2, Treatment=="nonchilled")
chill_mean=mean(chill$uptake)
no_chill_mean=mean(no_chill$uptake)
boostrap_order_c= factor(CO2$Treatment, levels=c("chilled","nonchilled"))
boxplot(data=CO2, uptake~boostrap_order_c, xlab="Tipo de tratamiento", ylab="Consumo de CO2")
beeswarm(data=CO2, uptake~boostrap_order_c, pch=16, add=T, col= "blue")
Se puede observar una variacion en el consumo de CO2 dependiendo del tratamiento, sin embargo no podemos deducir si la diferencia de promedios es o no significativa.
hist_chill= ggplot(chill, aes(x=uptake)) + geom_histogram(bins=14, color="black") + theme_classic() + ggtitle("Histograma consumo de CO2 tratamiento congelado")+ xlab("Consumo de CO2 de la planta") + ylab("Frecuencia")
hist_chill
hist_nochill= ggplot(no_chill, aes(x=uptake)) + geom_histogram(bins=12, color="black" ) + theme_classic()+ ggtitle("Histograma consumo de CO2 tratamiento no congelado") +xlab("Consumo de CO2 de la planta")+ ylab("Frecuencia")
hist_nochill
library(gridExtra)
grid.arrange(hist_chill, hist_nochill, ncol=3)
## En las graficas no es posible observar una distribucion normal.
#qqplot
chill_qq= ggplot()+ xlab("Cuantil teórico") + ylab ("Muestra") + aes(sample =chill$uptake) +stat_qq() + stat_qq_line() +labs(title = expression(paste('Distribución Normal tratamiento congelado ', mu, ' = 0, ', sigma,' = 1'))) + theme_minimal()
chill_qq
nochill_qq= ggplot()+ xlab("Cuantil teórico") + ylab ("Muestra") + aes(sample =no_chill$uptake) +stat_qq() + stat_qq_line() +labs(title = expression(paste('Distribución Normal tratamiento descongelado', mu, ' = 0, ', sigma,' = 1'))) + theme_minimal()
nochill_qq
grid.arrange(chill_qq, nochill_qq, ncol=3)
Shapiro test Hipotesis nula= Los datos siguen una distribucion normal Hipotesis alternativa= Los datos no siguen una distribucion normal
shapiro.test(chill$uptake)
##
## Shapiro-Wilk normality test
##
## data: chill$uptake
## W = 0.89789, p-value = 0.001245
shapiro.test(no_chill$uptake)
##
## Shapiro-Wilk normality test
##
## data: no_chill$uptake
## W = 0.94505, p-value = 0.04302
En ambos tratamientos se rechaza la hipoteis nula por lo que es necesario realizar transformaciones.
trans_chill= log(chill$uptake)
trans_nochill= log(no_chill$uptake)
shapiro.test(trans_chill)
##
## Shapiro-Wilk normality test
##
## data: trans_chill
## W = 0.93472, p-value = 0.01876
shapiro.test(trans_nochill)
##
## Shapiro-Wilk normality test
##
## data: trans_nochill
## W = 0.86729, p-value = 0.0001733
Luego de realizar las transformaciones correspondiente spudimos evidenciar que se sigue rechazando la hipotesisis nula, po lo que los datos no tienen una distribucion normal.Por lo que se realiza la prueba no-parametrica de Kruskal-Wallis.
kruskal.test(data=CO2, uptake~Treatment)
##
## Kruskal-Wallis rank sum test
##
## data: uptake by Treatment
## Kruskal-Wallis chi-squared = 7.4703, df = 1, p-value = 0.006272
Teniendo en cuenta el Valor-P obtenido y el valor de significancia(0.06) se rechaza la hipotesis nula y inferimos que existe una diferencia entre el consumo de CO2 de ambos ambientes.
modelo_tratamientos= aov(data=CO2, uptake~Treatment)
summary(modelo_tratamientos)
## Df Sum Sq Mean Sq F value Pr(>F)
## Treatment 1 988 988.1 9.293 0.0031 **
## Residuals 82 8719 106.3
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El Valor-P es significativo a un nivel de significancia menor que 0.001, y teniendo en cuenta nuestro valor alfa rechazamos la hipotesis nula, por lo que las medias son diferentes.
Analisis pregunta 2:
¿Existen diferencias entre los tratamientos? Teniendo la prueba de Kruskal-Wallis si existen diferencias en los tratamientos
¿En cuál tratamiento hay mayor consumo de CO2? En el tratamiento de descongelamiento hay un mayor consumo de CO2. Tratamiento descongelamiento(promedio:30.64)> Tratamiento congelamiento(promedio:23.78)
Realice una gráfica para ilustrar los resultados.
library(ggplot2)
boostrap_order_c= factor(CO2$Treatment, levels=c("chilled","nonchilled"))
boxplot(data=CO2, uptake~boostrap_order_c, xlab="Tipo de tratamiento", ylab="Consumo de CO2")
beeswarm(data=CO2, uptake~boostrap_order_c, pch=16, add=T, col= "blue")
¿Cuál es la conclusión biológica del análisis de los datos? En conclusion, el consumo de CO2 varia dependiendo del tratamiento, por lo que podemos deducir que la especie de pasto presenta una tolerancia diferente a temperaturas bajas, en donde a bsjas temperaturas se diminuye el consume de CO2 esto puede ocurri debido a que la planta no puede hacer el proceso de fotosintesis correctamente en temperaturas bajas.
¿Podría hacer una prueba t en este caso? ¿Cuál es la diferencia entre prueba t y ANOVA? En este caso si se podria hacer un pueba t de datos no parametricos. La diferencia entre la prueb t y la ANOVA es que en la prueba t solo se usa para comparar las medias de dos grupos de datos, mientras que en la ANOVA se pueden comparar mas de dos grupos de datos.