Se está trabajando con una especie de planta que crece en toda la región de Los Lagos que parece tener una actividad antibacteriana. Se cree que esta actividad biológica depende de una furanocumarina presente en estas plantas. Se ha observado que este químico varía ampliamente su concentración dependiendo de las variables ambientales.
Después de explorar los datos, las variables que se presume tienen alguna relación con la concentración del químico en cuestión se muestran en un mapa de la zona de estudio en la figura 1. Estas variables son la precipitación anual, la altura y la exposición de ladera, Norte o Sur.
Se establecen dos objetivos de investigación:
• Identificar las condiciones que generan concentraciones altas y bajas de Furanocumarinas.
• Identificar el efecto de este químico en la actividad bacteriana.
Para esto debe realizar un diseño experimental con esta especie de planta y determinar que tipo de análisis realizar para cada uno de los objetivos.
Modifiquen la altura y precipitación en variables categóricas.
q <- quantile(tabla$Altura, probs = c(0.5))
tablaf <- tabla %>% mutate(Altura_cat = case_when(Altura < q ~ "Baja",
Altura >= q ~ "Alta"))
q <- quantile(tabla$Precipitacion, probs = c(0.33))
p <- quantile(tabla$Precipitacion, probs = c(0.66))
tablaf <- tablaf %>% mutate(Precipitacion_cat = case_when(Precipitacion < q ~ "Baja",
Precipitacion >= q & Precipitacion < p ~ "Media",
Precipitacion >= p ~ "Alta"))
Generen un mínimo de 2 gráficos exploratorios y 2 tablas resumen.
Ladera | Altura_cat | Media_Furanocumarina | Desviacion_Furanocumarina | N |
---|---|---|---|---|
Norte | Alta | 1262.0945 | 254.0481 | 15 |
Norte | Baja | 1322.6447 | 302.4654 | 15 |
Sur | Alta | 544.9111 | 112.3508 | 15 |
Sur | Baja | 543.7219 | 104.8930 | 15 |
Gráfico 1: “Medidas de Furanocumarina en los niveles de Alturas elegidas”.
Ladera | Precipitacion_cat | Media_Furanocumarina | Desviacion_Furanocumarina | N |
---|---|---|---|---|
Norte | Alta | 1417.3205 | 69.84809 | 10 |
Norte | Baja | 999.9522 | 84.93631 | 10 |
Norte | Media | 1203.5673 | 64.56739 | 10 |
Sur | Alta | 633.6142 | 96.16910 | 10 |
Sur | Baja | 422.1811 | 74.08784 | 10 |
Sur | Media | 558.9617 | 35.76445 | 10 |
Gráfico 2: “Medidas de Furanocumarina en los niveles de Precipitaciones elegidos”.
ggplot(data = muestra2, aes(x = Ladera, y = Furanocumarina)) + geom_boxplot()
Gráfico 3: “Medidas de Furanocumarina en las Laderas”.
Con la información obtenida de las tablas y gráficos exploratorios, se elige como Ladera y Precipitación como variable a incluir en el experimento. Altura se deja fuera del análisis debido a que su cambio no afecta visiblemente la variable respuesta.
• Genere hipótesis respecto a las posibles relaciones entre la concentración de furanocumarinas en las plantas y el ambiente (2 pts).
La concentración de Furanocumarinas es dependiente de las precipitaciones a la que esta sometida la planta y a la ladera en la cual se encuentra la planta.
• Diseñe un muestreo acorde (2 pts).
Como la variable Ladera tiene dos niveles y Precipitaciones tiene 3 niveles, se extraeran 26 muestras.
library(readr)
expe <- read_csv("Plantas_2018-06-24seed_58.csv")
## Warning: Missing column names filled in: 'X1' [1]
expe <- expe[2:5]
• Justifique el tipo de análisis que realizará (4 pts).
Se realizará un análisis factorial, donde se observará si las variables precipitación, ladera y su interacción afectan la concentración de Furanocumarinas en la planta.
Para Ladera:
Ho1: No hay efecto de la ladera en la concentración de Furanocumarinas (μ1 = μ2).
Ha1: Existe efecto de la ladera en la concentración de Furanocumarinas (μ1 ≠ μ2).
Para Precipitación:
Ho2: No hay efecto de la preciitación en la concentración de Furanocumarinas (μ1 = μ2 = μ3).
Ha2: Existe efecto de la preciitación en la concentración de Furanocumarinas (al menos una media es distinta).
Para interacción:
Ho3: Efecto de la ladera es independiente de la precipitación (μ11 - μ12 - μ13 = μ22 - μ21 - μ23).
Ha3: Efecto de la ladera depende de la precipitación (μ11 - μ12 - μ13 ≠ μ22 - μ21 - μ23).
• Determine si se cumplen los supuestos para realizar el análisis (2 pts)
Primero se testeará si existe homogeneidad de varianzas.
bartlett.test(Furanocumarina ~ Precipitacion, data = expe)
##
## Bartlett test of homogeneity of variances
##
## data: Furanocumarina by Precipitacion
## Bartlett's K-squared = 7.3952, df = 2, p-value = 0.02478
bartlett.test(Furanocumarina ~ Ladera, data = expe)
##
## Bartlett test of homogeneity of variances
##
## data: Furanocumarina by Ladera
## Bartlett's K-squared = 30.659, df = 1, p-value = 3.076e-08
Las varianzas no son homogeneas, se intentará transformar a logaritmos para que se cumpla el supuesto.
bartlett.test(log(Furanocumarina) ~ Precipitacion, data = expe)
##
## Bartlett test of homogeneity of variances
##
## data: log(Furanocumarina) by Precipitacion
## Bartlett's K-squared = 0.1998, df = 2, p-value = 0.9049
bartlett.test(log(Furanocumarina) ~ Ladera, data = expe)
##
## Bartlett test of homogeneity of variances
##
## data: log(Furanocumarina) by Ladera
## Bartlett's K-squared = 2.0641, df = 1, p-value = 0.1508
Homocedasticidad de varianzas se cumple para ambas variables una vez aplicada la transformación logaritmica.
Luego se observa si existe distribucion normal de los errores.
residual_error <- broom::augment(aov(log(Furanocumarina) ~ Precipitacion*Ladera, data = expe))$.resid
shapiro.test(residual_error)
##
## Shapiro-Wilk normality test
##
## data: residual_error
## W = 0.96454, p-value = 0.0004904
hist(residual_error)
## [1] "Grafico 4: Histograma de errores residuales"
Lo errores no siguen una distribución normal, pero visualmente se muestra que se aproxima a una distribución normal; además esta prueba es robusta a las desviaciones de normalidad, por esto se procede a realizar el test con la transformación aplicada.
• Establezca si se acepta su hipótesis dados los datos (4 pts)
summary(aov(log(Furanocumarina) ~ Ladera*Precipitacion, data = expe))
## Df Sum Sq Mean Sq F value Pr(>F)
## Ladera 1 24.631 24.631 2092.042 <2e-16 ***
## Precipitacion 2 4.721 2.361 200.492 <2e-16 ***
## Ladera:Precipitacion 2 0.004 0.002 0.178 0.837
## Residuals 150 1.766 0.012
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ggplot(data = expe, aes(y = log(Furanocumarina), x = Precipitacion)) + geom_boxplot() + geom_jitter(aes(color = Ladera)) + scale_x_discrete(limits = c("Baja", "Media", "Alta"))
Grafico 5: “Grafico logaritmo Furanocumarinas contra precipitacion y ladera”
Con los resultados de el ANOVA factorial, se establece que Ho1 y Ho2 son rechazadas y Ho3 es aceptada, por lo que ambas variables afectan la concentración de Furanocumarinas y no existe la interacción entre las variables.
• Transforme la concentración de furanocumarinas en variable categórica para el próximo análisis (4 pts)
q <- quantile(expe$Furanocumarina, prob = c(0.5))
expe <- expe %>% mutate(Fura_cat = case_when (Furanocumarina < q ~ "Baja",
Furanocumarina >= q ~ "Alta"))
• Realice un ANOVA de una vía para determinar si las furanocumarinas tienen un efecto en la actividad bacteriana (4 pts)
summary(aov(Abund_Bacterias ~ Fura_cat, data = expe))
## Df Sum Sq Mean Sq F value Pr(>F)
## Fura_cat 1 23832 23832 977.4 <2e-16 ***
## Residuals 154 3755 24
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
• Explique si considera que las plantas presentan actividad antibacteriana y dónde recomienda cultivarla dentro de la región (4 pts)
Usando la información provista por el análisis, es posible determinar que la presencia de Furanocumarinas afecta la abundancia de bacterias significativamente. Además es posible decir que la concentración de Furanocumarinas se ve afectada independientemente por la Ladera donde se encuentra la planta, presentando una mayor concentración en las de la Ladera Norte; y por la precipitación la cual al aumentar aumenta la concentración de Furanocumarinas. Tomando en cuenta lo previamente dicho, se recomiendo plantar en zonas de Ladera Norte con altas tasas de precipitación.