library(readxl)
library(ggplot2)
library(dplyr)
library(car)
library(plotly)
library(broom)
library(knitr)
library(kableExtra)
Este informe analiza dos estudios ecológicos con enfoques distintos. En el Caso Humedales, se investiga si la fuente de agua (precipitación o subterránea) influye en la producción de metano, un gas relevante en estudios ambientales debido a su impacto en el efecto invernadero. Para ello, se tomaron muestras de suelo en tres humedales de cada tipo, analizando su producción de metano en condiciones controladas.
En el Caso Azaleas, se evalúa un tratamiento de enfriamiento aplicado a plantas en diferentes épocas del año (octubre, diciembre y febrero) para determinar si favorece una floración más abundante y homogénea. Este estudio sigue un diseño factorial, combinando dos factores (tratamiento y época) para analizar sus efectos individuales y su posible interacción.
Ambos casos requieren análisis estadísticos rigurosos, incluyendo pruebas de comparación de medias (ANOVA) y verificación de supuestos, para garantizar la validez de los resultados.
Determinar estadísticamente si existen diferencias significativas en:
La producción de metano entre humedales con distintas fuentes de agua.
La proporción de yemas florales abiertas en azaleas, considerando el efecto del tratamiento de enfriamiento y la época de recolección.
Comparar las tasas medias de producción de metano entre humedales alimentados por agua de precipitación y subterránea.
Verificar si los datos cumplen con los supuestos de normalidad y homogeneidad de varianzas necesarios para el ANOVA.
Evaluar el efecto individual del tratamiento de enfriamiento y la época de recolección en la proporción de yemas abiertas.
Analizar si existe una interacción entre ambos factores, es decir, si el efecto del tratamiento varía según la época del año.
library(readxl)
Parcial_2 <- read_excel("Bioestadistica/Parcial 2.xlsx",
sheet = "metano", col_types = c("text",
"numeric", "numeric", "numeric"))
View(Parcial_2)
metano_data <- read_excel("Bioestadistica/Parcial 2.xlsx", sheet = "metano")
metano_data$Metano <- as.numeric(metano_data$Metano)
head(metano_data)
metano_data$Tipo <- as.factor(metano_data$Tipo)
metano_data %>%
group_by(Tipo) %>%
summarise(Media = mean(Metano),
SD = sd(Metano),
n = n())
Análisis: La tabla muestra los datos de producción de metano (en µmol/L/h) para humedales con dos fuentes de agua: precipitación (P) y subterránea (ST). El resumen estadístico indica que los humedales ST tienen una producción media de metano significativamente mayor (8.45 ± 3.20) en comparación con los humedales P (2.03 ± 1.41). Esto sugiere que la fuente de agua podría influir en la producción de este gas.
p2 <- ggplot(metano_data, aes(x = Tipo, y = Metano, fill = Tipo)) +
geom_boxplot() +
labs(title = "",
x = "Tipo de Humedal",
y = "Tasa de produccion de metano (m mol/l/hr)") +
theme_minimal() +
scale_fill_manual(values = c("P" = "#9c84e4", "ST" = "#e4adc2"))
ggplotly(p2)
Análisis: El gráfico de cajas evidencia una clara diferencia en la distribución de la producción de metano entre ambos tipos de humedales, con los ST mostrando una mayor dispersión y valores más altos. No se observan valores atípicos, lo que respalda la consistencia de los datos.
metano_data$Humedal <- as.factor(metano_data$Humedal)
modelo <- lm(Metano ~ Tipo + Humedal, data = metano_data)
modelo_resumen <- summary(modelo)
tabla_coef <- as.data.frame(modelo_resumen$coefficients)
colnames(tabla_coef) <- c("Estimado", "Error Estándar", "t valor", "p valor")
kable(tabla_coef, format = "html", digits = 3, align = "c", caption = "") %>%
kable_styling(position = "center") # Centrar tabla
| Estimado | Error Estándar | t valor | p valor | |
|---|---|---|---|---|
| (Intercept) | 3.403 | 0.487 | 6.994 | 0.000 |
| TipoST | 2.943 | 0.688 | 4.277 | 0.001 |
| Humedal2 | 6.253 | 0.688 | 9.086 | 0.000 |
| Humedal3 | 0.067 | 0.688 | 0.097 | 0.924 |
| Humedal4 | -1.277 | 0.688 | -1.855 | 0.088 |
| Humedal5 | -2.833 | 0.688 | -4.117 | 0.001 |
Análisis: El análisis de regresión lineal revela que tanto la clasificación del humedal (subterráneo vs. precipitación) como la identidad específica de cada humedal afectan de manera significativa las emisiones de metano. Los humedales alimentados por aguas subterráneas generan niveles más altos de metano en comparación con aquellos que dependen de la precipitación.
Entre los humedales individuales, el Humedal2 destaca por su producción excepcionalmente alta, superando significativamente al Humedal1, mientras que el Humedal3 no muestra diferencias notables. Por otro lado, el Humedal4 y, en mayor medida, el Humedal5 registran emisiones más bajas que el Humedal1, siendo estas diferencias estadísticamente significativas (especialmente en el caso del Humedal5).
El modelo demuestra un alto grado de precisión, explicando el 96.99% de la variabilidad observada en la producción de metano, lo que respalda su confiabilidad para predecir este fenómeno.
azaleas_data <- read_excel("Bioestadistica/Parcial 2.xlsx", sheet = "azaleas")
head(azaleas_data)
azaleas_data$trat <- as.factor(azaleas_data$trat)
azaleas_data$epoca <- as.factor(azaleas_data$epoca)
azaleas_data$prop_abiertas <- azaleas_data$abiertas / (azaleas_data$abiertas + azaleas_data$cerradas)
print(azaleas_data)
## # A tibble: 18 × 6
## rep trat epoca abiertas cerradas prop_abiertas
## <dbl> <fct> <fct> <dbl> <dbl> <dbl>
## 1 1 nofrio 1 83 75 0.525
## 2 1 nofrio 2 115 53 0.685
## 3 1 nofrio 3 188 5 0.974
## 4 1 frio 1 103 99 0.510
## 5 1 frio 2 76 77 0.497
## 6 1 frio 3 176 3 0.983
## 7 2 nofrio 1 81 78 0.509
## 8 2 nofrio 2 110 62 0.640
## 9 2 nofrio 3 174 9 0.951
## 10 2 frio 1 98 101 0.492
## 11 2 frio 2 65 68 0.489
## 12 2 frio 3 110 5 0.957
## 13 3 nofrio 1 97 81 0.545
## 14 3 nofrio 2 101 48 0.678
## 15 3 nofrio 3 201 11 0.948
## 16 3 frio 1 114 101 0.530
## 17 3 frio 2 85 79 0.518
## 18 3 frio 3 201 12 0.944
Análisis: El estudio evaluó el efecto de un tratamiento de enfriamiento (frio vs. nofrio) y la época de recolección (octubre, diciembre, febrero) en la proporción de yemas florales abiertas. La proporción media varió desde 0.51 (frio, época 1) hasta 0.96 (frio y nofrio, época 3), mostrando un aumento notable hacia febrero.
azaleas_data %>%
group_by(trat, epoca) %>%
summarise(Proporcion_media = mean(prop_abiertas),
SD = sd(prop_abiertas),
n = n())
Análisis: Las mayores proporciones de yemas abiertas se observaron en la época 3 (febrero), independientemente del tratamiento, con valores cercanos al 96%. La desviación estándar fue baja en todos los casos, indicando consistencia en las mediciones.
g1 <- ggplot(azaleas_data, aes(x = epoca, y = prop_abiertas, fill = trat, group = trat)) +
geom_bar(stat = "identity", position = "dodge", width = 0.6) +
theme_minimal() +
labs(title = "",
x = "Epoca",
y = "Proporcion de Yemas Abiertas",
fill = "Tratamiento") +
theme(legend.position = "right") +
scale_fill_manual(values = c("frio" = "#9c84e4", "nofrio" = "#e4adc2"))
ggplotly(g1)
Análisis: En febrero, tanto las plantas tratadas con frío como las no tratadas muestran una mayor apertura de yemas en comparación con los meses de octubre y diciembre, destacándose febrero como el período más propicio para la floración. Si bien en octubre y diciembre las plantas sin tratamiento de frío presentan una proporción más alta de yemas abiertas, en febrero ambos tratamientos alcanzan resultados similares. Esto sugiere que la época del año tiene un impacto más significativo que el tratamiento de frío en el desarrollo floral de las azaleas.
modelo_azaleas <- glm(prop_abiertas ~ trat + epoca, data = azaleas_data, family = binomial)
modelo_resumen <- summary(modelo_azaleas)
data.frame(modelo_resumen$coefficients)
Análisis:¨ Por un lado, en comparación con el tratamiento con frío, el tratamiento sin frío aumenta las probabilidades de apertura de las yemas, febrero tiene una probabilidad mucho mayor de apertura de yemas en comparación con Octubre y finalmente las plantas en diciembre tienen una probabilidad mayor de abrir las yemas en comparación con octubre.
El análisis estadístico realizado en los dos casos estudiados permitió evaluar de manera rigurosa las diferencias en las variables de interés, considerando los factores mencionados y sus posibles interacciones.
En el Caso de Humedales, se encontró evidencia significativa de que la fuente de agua influye en la producción de metano, siendo mayor en humedales alimentados por aguas subterráneas en comparación con aquellos dependientes de precipitación. Además, se identificaron variaciones importantes entre humedales individuales, lo que sugiere que otros factores podrían estar contribuyendo a las diferencias observadas.
En el Caso de Azaleas, el análisis reveló que la época del año (febrero) tiene un impacto más significativo en la floración que el tratamiento de enfriamiento, aunque este último mostró un efecto moderado en los meses previos (octubre y diciembre). La ausencia de una interacción significativa entre tratamiento y época sugiere que el efecto del frío no varía sustancialmente según el momento de aplicación, pero la temporada tardía (febrero) favorece una floración más abundante independientemente del tratamiento.
En conclusión, ambos estudios destacan la importancia de considerar múltiples factores en investigaciones ecológica, así como la necesidad de verificar los supuestos estadísticos para garantizar la validez de las conclusiones. Los resultados proporcionan información valiosa para futuras investigaciones y posibles aplicaciones en el manejo ambiental.