El Problema

Se está trabajando con una especie de planta que crece en toda la región de Los Lagos que parece tener una actividad antibacteriana. Se cree que esta actividad biológica depende de una furanocumarina presente en estas plantas. Se ha observado que este químico varía ampliamente su concentración dependiendo de las variables ambientales.
Después de explorar los datos, las variables que se presume tienen alguna relación con la concentración del químico en cuestión se muestran en un mapa de la zona de estudio en la figura 1. Estas variables son la precipitación anual, la altura y la exposición de ladera, Norte o Sur.
Se establecen dos objetivos de investigación:
• Identificar las condiciones que generan concentraciones altas y bajas de Furanocumarinas.
• Identificar el efecto de este químico en la actividad bacteriana.
Para esto debe realizar un diseño experimental con esta especie de planta y determinar que tipo de análisis realizar para cada uno de los objetivos.

Transformación de Variables Continuas en Categoricas

Modifiquen la altura y precipitación en variables categóricas.

q <- quantile(tabla$Altura, probs = c(0.5))
tablaf <- tabla %>% mutate(Altura_cat = case_when(Altura < q ~ "Baja",
                                                  Altura >= q ~ "Alta"))

q <- quantile(tabla$Precipitacion, probs = c(0.33))
p <- quantile(tabla$Precipitacion, probs = c(0.66))
tablaf <- tablaf %>% mutate(Precipitacion_cat = case_when(Precipitacion < q ~ "Baja",
                                                          Precipitacion >= q & Precipitacion < p ~ "Media",
                                                          Precipitacion >= p ~ "Alta"))

Exploración de Datos

Generen un mínimo de 2 gráficos exploratorios y 2 tablas resumen.

Tabla 1: Tabla exploratoria resumen de variable altura
Ladera Altura_cat Media_Furanocumarina Desviacion_Furanocumarina N
Norte Alta 1262.0945 254.0481 15
Norte Baja 1322.6447 302.4654 15
Sur Alta 544.9111 112.3508 15
Sur Baja 543.7219 104.8930 15

Gráfico 1: “Medidas de Furanocumarina en los niveles de Alturas elegidas”.

Tabla 2: Tabla exploratoria resumen de variables ladera y precipitación
Ladera Precipitacion_cat Media_Furanocumarina Desviacion_Furanocumarina N
Norte Alta 1417.3205 69.84809 10
Norte Baja 999.9522 84.93631 10
Norte Media 1203.5673 64.56739 10
Sur Alta 633.6142 96.16910 10
Sur Baja 422.1811 74.08784 10
Sur Media 558.9617 35.76445 10

Gráfico 2: “Medidas de Furanocumarina en los niveles de Precipitaciones elegidos”.

ggplot(data = muestra2, aes(x = Ladera, y = Furanocumarina)) + geom_boxplot() 

Gráfico 3: “Medidas de Furanocumarina en las Laderas”.

Con la información obtenida de las tablas y gráficos exploratorios, se elige como Ladera y Precipitación como variable a incluir en el experimento. Altura se deja fuera del análisis debido a que su cambio no afecta visiblemente la variable respuesta.

Diseño Experimental

• Genere hipótesis respecto a las posibles relaciones entre la concentración de furanocumarinas en las plantas y el ambiente (2 pts).

La concentración de Furanocumarinas es dependiente de las precipitaciones a la que esta sometida la planta y a la ladera en la cual se encuentra la planta.

• Diseñe un muestreo acorde (2 pts).

Como la variable Ladera tiene dos niveles y Precipitaciones tiene 3 niveles, se extraeran 26 muestras.

library(readr)
expe <- read_csv("Plantas_2018-06-24seed_58.csv")
## Warning: Missing column names filled in: 'X1' [1]
expe <- expe[2:5]

• Justifique el tipo de análisis que realizará (4 pts).

Se realizará un análisis factorial, donde se observará si las variables precipitación, ladera y su interacción afectan la concentración de Furanocumarinas en la planta.
Para Ladera:
Ho1: No hay efecto de la ladera en la concentración de Furanocumarinas (μ1 = μ2).
Ha1: Existe efecto de la ladera en la concentración de Furanocumarinas (μ1 ≠ μ2).
Para Precipitación:
Ho2: No hay efecto de la preciitación en la concentración de Furanocumarinas (μ1 = μ2 = μ3).
Ha2: Existe efecto de la preciitación en la concentración de Furanocumarinas (al menos una media es distinta).
Para interacción:
Ho3: Efecto de la ladera es independiente de la precipitación (μ11 - μ12 - μ13 = μ22 - μ21 - μ23).
Ha3: Efecto de la ladera depende de la precipitación (μ11 - μ12 - μ13 ≠ μ22 - μ21 - μ23).

Análisis Furanocumarinas y Ambiente

• Determine si se cumplen los supuestos para realizar el análisis (2 pts)

Primero se testeará si existe homogeneidad de varianzas.

bartlett.test(Furanocumarina ~ Precipitacion, data = expe)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Furanocumarina by Precipitacion
## Bartlett's K-squared = 7.3952, df = 2, p-value = 0.02478
bartlett.test(Furanocumarina ~ Ladera, data = expe)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Furanocumarina by Ladera
## Bartlett's K-squared = 30.659, df = 1, p-value = 3.076e-08

Las varianzas no son homogeneas, se intentará transformar a logaritmos para que se cumpla el supuesto.

bartlett.test(log(Furanocumarina) ~ Precipitacion, data = expe)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  log(Furanocumarina) by Precipitacion
## Bartlett's K-squared = 0.1998, df = 2, p-value = 0.9049
bartlett.test(log(Furanocumarina) ~ Ladera, data = expe)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  log(Furanocumarina) by Ladera
## Bartlett's K-squared = 2.0641, df = 1, p-value = 0.1508

Homocedasticidad de varianzas se cumple para ambas variables una vez aplicada la transformación logaritmica.

Luego se observa si existe distribucion normal de los errores.

residual_error <- broom::augment(aov(log(Furanocumarina) ~ Precipitacion*Ladera, data = expe))$.resid
shapiro.test(residual_error)
## 
##  Shapiro-Wilk normality test
## 
## data:  residual_error
## W = 0.96454, p-value = 0.0004904
hist(residual_error)

## [1] "Grafico 4: Histograma de errores residuales"

Lo errores no siguen una distribución normal, pero visualmente se muestra que se aproxima a una distribución normal; además esta prueba es robusta a las desviaciones de normalidad, por esto se procede a realizar el test con la transformación aplicada.

• Establezca si se acepta su hipótesis dados los datos (4 pts)

summary(aov(log(Furanocumarina) ~ Ladera*Precipitacion, data = expe))
##                       Df Sum Sq Mean Sq  F value Pr(>F)    
## Ladera                 1 24.631  24.631 2092.042 <2e-16 ***
## Precipitacion          2  4.721   2.361  200.492 <2e-16 ***
## Ladera:Precipitacion   2  0.004   0.002    0.178  0.837    
## Residuals            150  1.766   0.012                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ggplot(data = expe, aes(y = log(Furanocumarina), x = Precipitacion)) + geom_boxplot() + geom_jitter(aes(color = Ladera)) + scale_x_discrete(limits = c("Baja", "Media", "Alta"))

Grafico 5: “Grafico logaritmo Furanocumarinas contra precipitacion y ladera”

Con los resultados de el ANOVA factorial, se establece que Ho1 y Ho2 son rechazadas y Ho3 es aceptada, por lo que ambas variables afectan la concentración de Furanocumarinas y no existe la interacción entre las variables.

• Transforme la concentración de furanocumarinas en variable categórica para el próximo análisis (4 pts)

q <- quantile(expe$Furanocumarina, prob = c(0.5))
expe <- expe %>% mutate(Fura_cat = case_when (Furanocumarina < q ~ "Baja",
                                                  Furanocumarina >= q ~ "Alta"))

Análisis de Actividad Bacteriana

• Realice un ANOVA de una vía para determinar si las furanocumarinas tienen un efecto en la actividad bacteriana (4 pts)

summary(aov(Abund_Bacterias ~ Fura_cat, data = expe))
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Fura_cat      1  23832   23832   977.4 <2e-16 ***
## Residuals   154   3755      24                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

• Explique si considera que las plantas presentan actividad antibacteriana y dónde recomienda cultivarla dentro de la región (4 pts)

Usando la información provista por el análisis, es posible determinar que la presencia de Furanocumarinas afecta la abundancia de bacterias significativamente. Además es posible decir que la concentración de Furanocumarinas se ve afectada independientemente por la Ladera donde se encuentra la planta, presentando una mayor concentración en las de la Ladera Norte; y por la precipitación la cual al aumentar aumenta la concentración de Furanocumarinas. Tomando en cuenta lo previamente dicho, se recomiendo plantar en zonas de Ladera Norte con altas tasas de precipitación.