library(readxl)
library(ggplot2)
library(dplyr)
library(car)
library(plotly)
library(broom)
library(knitr)
library(kableExtra)

Introducción

Este informe analiza dos estudios ecológicos con enfoques distintos. En el Caso Humedales, se investiga si la fuente de agua (precipitación o subterránea) influye en la producción de metano, un gas relevante en estudios ambientales debido a su impacto en el efecto invernadero. Para ello, se tomaron muestras de suelo en tres humedales de cada tipo, analizando su producción de metano en condiciones controladas.

En el Caso Azaleas, se evalúa un tratamiento de enfriamiento aplicado a plantas en diferentes épocas del año (octubre, diciembre y febrero) para determinar si favorece una floración más abundante y homogénea. Este estudio sigue un diseño factorial, combinando dos factores (tratamiento y época) para analizar sus efectos individuales y su posible interacción.

Ambos casos requieren análisis estadísticos rigurosos, incluyendo pruebas de comparación de medias (ANOVA) y verificación de supuestos, para garantizar la validez de los resultados.

Objetivos

Objetivos Generales

Determinar estadísticamente si existen diferencias significativas en:

  1. La producción de metano entre humedales con distintas fuentes de agua.

  2. La proporción de yemas florales abiertas en azaleas, considerando el efecto del tratamiento de enfriamiento y la época de recolección.

Objetivos Especificos

  1. Para Humedales:
  • Comparar las tasas medias de producción de metano entre humedales alimentados por agua de precipitación y subterránea.

  • Verificar si los datos cumplen con los supuestos de normalidad y homogeneidad de varianzas necesarios para el ANOVA.

  1. Para Azaleas:
  • Evaluar el efecto individual del tratamiento de enfriamiento y la época de recolección en la proporción de yemas abiertas.

  • Analizar si existe una interacción entre ambos factores, es decir, si el efecto del tratamiento varía según la época del año.

1. Caso Humedales

library(readxl)
Parcial_2 <- read_excel("Bioestadistica/Parcial 2.xlsx", 
    sheet = "metano", col_types = c("text", 
        "numeric", "numeric", "numeric"))
View(Parcial_2)
metano_data <- read_excel("Bioestadistica/Parcial 2.xlsx", sheet = "metano")
metano_data$Metano <- as.numeric(metano_data$Metano)

Base de Datos

head(metano_data)
metano_data$Tipo <- as.factor(metano_data$Tipo)

Resumen Estadístico

metano_data %>% 
  group_by(Tipo) %>% 
  summarise(Media = mean(Metano),
            SD = sd(Metano),
            n = n())

Análisis: La tabla muestra los datos de producción de metano (en µmol/L/h) para humedales con dos fuentes de agua: precipitación (P) y subterránea (ST). El resumen estadístico indica que los humedales ST tienen una producción media de metano significativamente mayor (8.45 ± 3.20) en comparación con los humedales P (2.03 ± 1.41). Esto sugiere que la fuente de agua podría influir en la producción de este gas.

Boxplot de Produccion de Metano por Tipo de Humedal

p2 <- ggplot(metano_data, aes(x = Tipo, y = Metano, fill = Tipo)) +
  geom_boxplot() +
  labs(title = "",
       x = "Tipo de Humedal",
       y = "Tasa de produccion de metano (m mol/l/hr)") +
  theme_minimal() +
  scale_fill_manual(values = c("P" = "#9c84e4", "ST" = "#e4adc2"))
ggplotly(p2)

Análisis: El gráfico de cajas evidencia una clara diferencia en la distribución de la producción de metano entre ambos tipos de humedales, con los ST mostrando una mayor dispersión y valores más altos. No se observan valores atípicos, lo que respalda la consistencia de los datos.

Modelo de Regresión Lineal

metano_data$Humedal <- as.factor(metano_data$Humedal)

modelo <- lm(Metano ~ Tipo + Humedal, data = metano_data)

modelo_resumen <- summary(modelo)
tabla_coef <- as.data.frame(modelo_resumen$coefficients)

colnames(tabla_coef) <- c("Estimado", "Error Estándar", "t valor", "p valor")

kable(tabla_coef, format = "html", digits = 3, align = "c", caption = "") %>%
  kable_styling(position = "center")  # Centrar tabla
Estimado Error Estándar t valor p valor
(Intercept) 3.403 0.487 6.994 0.000
TipoST 2.943 0.688 4.277 0.001
Humedal2 6.253 0.688 9.086 0.000
Humedal3 0.067 0.688 0.097 0.924
Humedal4 -1.277 0.688 -1.855 0.088
Humedal5 -2.833 0.688 -4.117 0.001

Análisis: El análisis de regresión lineal revela que tanto la clasificación del humedal (subterráneo vs. precipitación) como la identidad específica de cada humedal afectan de manera significativa las emisiones de metano. Los humedales alimentados por aguas subterráneas generan niveles más altos de metano en comparación con aquellos que dependen de la precipitación.

Entre los humedales individuales, el Humedal2 destaca por su producción excepcionalmente alta, superando significativamente al Humedal1, mientras que el Humedal3 no muestra diferencias notables. Por otro lado, el Humedal4 y, en mayor medida, el Humedal5 registran emisiones más bajas que el Humedal1, siendo estas diferencias estadísticamente significativas (especialmente en el caso del Humedal5).

El modelo demuestra un alto grado de precisión, explicando el 96.99% de la variabilidad observada en la producción de metano, lo que respalda su confiabilidad para predecir este fenómeno.

2. Caso Azaleas

azaleas_data <- read_excel("Bioestadistica/Parcial 2.xlsx", sheet = "azaleas")

Base de Datos

head(azaleas_data)
azaleas_data$trat <- as.factor(azaleas_data$trat)
azaleas_data$epoca <- as.factor(azaleas_data$epoca)

Calcular proporción de yemas abiertas

azaleas_data$prop_abiertas <- azaleas_data$abiertas / (azaleas_data$abiertas + azaleas_data$cerradas)
print(azaleas_data)
## # A tibble: 18 × 6
##      rep trat   epoca abiertas cerradas prop_abiertas
##    <dbl> <fct>  <fct>    <dbl>    <dbl>         <dbl>
##  1     1 nofrio 1           83       75         0.525
##  2     1 nofrio 2          115       53         0.685
##  3     1 nofrio 3          188        5         0.974
##  4     1 frio   1          103       99         0.510
##  5     1 frio   2           76       77         0.497
##  6     1 frio   3          176        3         0.983
##  7     2 nofrio 1           81       78         0.509
##  8     2 nofrio 2          110       62         0.640
##  9     2 nofrio 3          174        9         0.951
## 10     2 frio   1           98      101         0.492
## 11     2 frio   2           65       68         0.489
## 12     2 frio   3          110        5         0.957
## 13     3 nofrio 1           97       81         0.545
## 14     3 nofrio 2          101       48         0.678
## 15     3 nofrio 3          201       11         0.948
## 16     3 frio   1          114      101         0.530
## 17     3 frio   2           85       79         0.518
## 18     3 frio   3          201       12         0.944

Análisis: El estudio evaluó el efecto de un tratamiento de enfriamiento (frio vs. nofrio) y la época de recolección (octubre, diciembre, febrero) en la proporción de yemas florales abiertas. La proporción media varió desde 0.51 (frio, época 1) hasta 0.96 (frio y nofrio, época 3), mostrando un aumento notable hacia febrero.

Resumen Estadístico

azaleas_data %>% 
  group_by(trat, epoca) %>% 
  summarise(Proporcion_media = mean(prop_abiertas),
            SD = sd(prop_abiertas),
            n = n())

Análisis: Las mayores proporciones de yemas abiertas se observaron en la época 3 (febrero), independientemente del tratamiento, con valores cercanos al 96%. La desviación estándar fue baja en todos los casos, indicando consistencia en las mediciones.

Gráfico de Proporcion de Yemas Abiertas por Epoca y Tratamiento

g1 <- ggplot(azaleas_data, aes(x = epoca, y = prop_abiertas, fill = trat, group = trat)) +
  geom_bar(stat = "identity", position = "dodge", width = 0.6) +
  theme_minimal() +
  labs(title = "",
       x = "Epoca",
       y = "Proporcion de Yemas Abiertas",
       fill = "Tratamiento") +
  theme(legend.position = "right") +
  scale_fill_manual(values = c("frio" = "#9c84e4", "nofrio" = "#e4adc2"))

ggplotly(g1)

Análisis: En febrero, tanto las plantas tratadas con frío como las no tratadas muestran una mayor apertura de yemas en comparación con los meses de octubre y diciembre, destacándose febrero como el período más propicio para la floración. Si bien en octubre y diciembre las plantas sin tratamiento de frío presentan una proporción más alta de yemas abiertas, en febrero ambos tratamientos alcanzan resultados similares. Esto sugiere que la época del año tiene un impacto más significativo que el tratamiento de frío en el desarrollo floral de las azaleas.

Modelo Logistico

modelo_azaleas <- glm(prop_abiertas ~ trat + epoca, data = azaleas_data, family = binomial)

modelo_resumen <- summary(modelo_azaleas)

data.frame(modelo_resumen$coefficients)

Análisis:¨ Por un lado, en comparación con el tratamiento con frío, el tratamiento sin frío aumenta las probabilidades de apertura de las yemas, febrero tiene una probabilidad mucho mayor de apertura de yemas en comparación con Octubre y finalmente las plantas en diciembre tienen una probabilidad mayor de abrir las yemas en comparación con octubre.

Conclusión

El análisis estadístico realizado en los dos casos estudiados permitió evaluar de manera rigurosa las diferencias en las variables de interés, considerando los factores mencionados y sus posibles interacciones.

En el Caso de Humedales, se encontró evidencia significativa de que la fuente de agua influye en la producción de metano, siendo mayor en humedales alimentados por aguas subterráneas en comparación con aquellos dependientes de precipitación. Además, se identificaron variaciones importantes entre humedales individuales, lo que sugiere que otros factores podrían estar contribuyendo a las diferencias observadas.

En el Caso de Azaleas, el análisis reveló que la época del año (febrero) tiene un impacto más significativo en la floración que el tratamiento de enfriamiento, aunque este último mostró un efecto moderado en los meses previos (octubre y diciembre). La ausencia de una interacción significativa entre tratamiento y época sugiere que el efecto del frío no varía sustancialmente según el momento de aplicación, pero la temporada tardía (febrero) favorece una floración más abundante independientemente del tratamiento.

En conclusión, ambos estudios destacan la importancia de considerar múltiples factores en investigaciones ecológica, así como la necesidad de verificar los supuestos estadísticos para garantizar la validez de las conclusiones. Los resultados proporcionan información valiosa para futuras investigaciones y posibles aplicaciones en el manejo ambiental.