Caso Humedales


Los humedales son ecosistemas cruciales en los ciclos biogeoquímicos globales, ya que influyen en la emisión de gases de efecto invernadero, como el metano. Este gas tiene un impacto significativamente mayor que el dióxido de carbono en el calentamiento global. Los humedales pueden estar alimentados por diferentes fuentes de agua, como el agua de precipitación o el agua subterránea, y se ha sugerido que estas fuentes pueden afectar las tasas de producción de metano. El objetivo de este estudio es evaluar si el tipo de humedal (alimentado por agua subterránea o de precipitación) tiene un efecto significativo en las tasas de producción de metano.

library(readxl)
bd2 <- read_excel("C:/Users/jaime/Desktop/Naomi/Bioestadistica/metano.xlsx")
# Cargar las librerías necesarias
library(ggplot2)
# Crear el data frame con los datos
data <- data.frame(
  Tipo = c('ST', 'ST', 'ST', 'ST', 'ST', 'ST', 'P', 'P', 'P', 'P', 'P', 'P', 'ST', 'ST', 'ST', 'P', 'P', 'P'),
  Humedal = c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6),
  Muestra = c(1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3),
  Metano = c(6.63, 6.77, 5.64, 12.40, 13.50, 11.90, 7.64, 5.42, 6.18, 2.55, 2.59, 3.02, 4.56, 4.87, 5.13, 4.56, 4.58, 3.67)
)

# Crear la gráfica
ggplot(data, aes(x = factor(Humedal), y = Metano, fill = Tipo)) +
  geom_bar(stat = "summary", fun = "mean", position = "dodge", width = 0.7) +
  geom_errorbar(stat = "summary", fun.data = "mean_cl_boot", width = 0.2, position = position_dodge(width = 0.7)) +
  labs(title = "Comparación de la Producción de Metano por Humedal y Tipo de Agua",
       x = "Humedal",
       y = "Tasa de Producción de Metano (mol/hr)",
       fill = "Tipo de Humedal") +
  theme_minimal()


Modelo de regresion lineal


El modelo de regresión lineal en el caso de los humedales sirve para predecir la concentración de metano en función de dos factores: Tipo de humedal y Humedal específico. Este modelo ayuda a entender cómo el tipo de humedal (subterráneo o de precipitación) y las diferencias entre humedales específicos (como Humedal1, Humedal2, etc.) afectan la producción de metano.

library(broom)
library(knitr)
library(kableExtra)  # Librería para mejorar tablas

bd2$Humedal = as.factor(bd2$Humedal)

modelo = lm(Metano ~ Tipo + Humedal, data = bd2)

# Convertir los coeficientes del modelo en un data frame similar al de glm
modelo_resumen <- summary(modelo)
tabla_coef <- as.data.frame(modelo_resumen$coefficients)

# Renombrar columnas para mayor claridad
colnames(tabla_coef) <- c("Estimado", "Error Estándar", "t valor", "p valor")

# Mostrar la tabla centrada en HTML sin numerales
kable(tabla_coef, format = "html", digits = 3, align = "c", caption = "") %>%
  kable_styling(position = "center")  # Centrar tabla
Estimado Error Estándar t valor p valor
(Intercept) 3.403 0.487 6.994 0.000
TipoST 2.943 0.688 4.277 0.001
Humedal2 6.253 0.688 9.086 0.000
Humedal3 0.067 0.688 0.097 0.924
Humedal4 -1.277 0.688 -1.855 0.088
Humedal5 -2.833 0.688 -4.117 0.001

El R² es igual 0.9699, lo que significa la exactitud del modelo en un 97%

El modelo lineal muestra que tanto el tipo de humedal como el humedal específico influyen significativamente en la producción de metano. Los humedales subterráneos producen más metano que los de tipo precipitación. Además, el Humedal2 tiene una producción mucho mayor de metano que el Humedal1, mientras que el Humedal3 no presenta diferencias significativas. El Humedal4 y Humedal5 tienen una producción de metano más baja que Humedal1, siendo estos resultados estadísticamente significativos, especialmente en el Humedal5. El modelo explica el 96.99% de la variabilidad en la producción de metano, lo que indica una alta precisión en sus predicciones.


Prediccion para el humedal 4 cuando el tipo es subterraneo

# Definir los valores en el chunk de código R
a <- 3.40333
b <- 2.94333
c <- -1.27667
x1 <- 1
x2 <- 1
resultado <- a + (b * x1) + (c * x2)
5.06999

El valor de 5.06999 es la cantidad de metano que se espera producir en Humedal 4 bajo la condición de ser subterráneo


Conclusión de los resultados

El estudio demuestra que la producción de metano en los humedales está influenciada tanto por el tipo de agua como por la ubicación del humedal. Los humedales con agua subterránea generan más metano que aquellos alimentados por precipitación, y existen diferencias significativas entre los humedales evaluados.

El modelo de regresión utilizado tiene un excelente ajuste a los datos (R² = 0.9699), lo que indica que estos factores explican casi toda la variabilidad en la producción de metano. Estos hallazgos resaltan la importancia de considerar las condiciones hidrológicas en la gestión y conservación de humedales, especialmente en el contexto del cambio climático.



Caso Azaleas


En el estudió se analiza la necesidad de aplicar un tratamiento de enfriamiento a las plantas de azalea antes de ser vendidas, con el fin de lograr una floración abundante y homogénea. Para realizar esta investigación, se seleccionaron 18 plantas distribuidas en tres épocas de cultivo siendo octubre, diciembre y febrero, y se sometieron a dos tipos de tratamiento uno con frío y otro sin frío. El diseño experimental utilizado fue un experimento que conto con 3 repeticiones, para analizar la proporción de yemas florales abiertas y cerradas en cada planta. Por medio de los datos obtenidos, se busca determinar si la proporción de yemas abiertas depende del tratamiento de frío, de la época de cultivo o de una interacción entre ambos factores. Dicho esto, Se espera que los resultados de este estudio ayuden a entender cómo el tratamiento de enfriamiento afecta la floración de las azaleas y cómo el momento del año (época de cultivo) influye en este proceso.

library(readxl)
AZALEA <- read_excel("C:/Users/jaime/Desktop/Naomi/Bioestadistica/AZALEA.xlsx", 
    col_types = c("numeric", "text", "numeric", 
        "numeric", "numeric"))

AZALEA$y=AZALEA$abiertas/(AZALEA$abiertas+AZALEA$cerradas)

Exploración de graficas y/o tablas

AZALEA$epoca = factor(AZALEA$epoca, levels = c(1, 2, 3), labels = c("Octubre", "Diciembre", "Febrero"))

Proporción de yemas abiertas por tratamiento (frío vs. no frío)

table1(~y|trat, data=AZALEA)
frio
(N=9)
nofrio
(N=9)
Overall
(N=18)
y
Mean (SD) 0.658 (0.228) 0.717 (0.191) 0.687 (0.206)
Median [Min, Max] 0.518 [0.489, 0.983] 0.678 [0.509, 0.974] 0.592 [0.489, 0.983]


El tratamiento nofrío tiene una mayor proporción de yemas abiertas en comparación con el tratamiento con frío. Se observa por los valores de la media de yemas abiertas es más alta para el tratamiento sin frío (0.717) que para el tratamiento con frío (0.658).


Proporción de yemas abiertas por época de cultivo

table1(~y|epoca, data=AZALEA)
Octubre
(N=6)
Diciembre
(N=6)
Febrero
(N=6)
Overall
(N=18)
y
Mean (SD) 0.519 (0.0185) 0.584 (0.0927) 0.959 (0.0158) 0.687 (0.206)
Median [Min, Max] 0.518 [0.492, 0.545] 0.579 [0.489, 0.685] 0.954 [0.944, 0.983] 0.592 [0.489, 0.983]


La época de cultivo tiene un impacto significativo en la proporción de yemas abiertas de las plantas de azalea.

Época 3 (febrero), las plantas tienen la mayor proporción de yemas abiertas

Épocas 1 y 2 (octubre - Diciembre), valores más bajos


g1 = ggplot(AZALEA, aes(x = epoca, y = y, fill = trat, group = trat)) + 
  geom_bar(stat = "identity", position = "dodge", width = 0.6) +  # Usa los valores de 'y' directamente
  
  theme_minimal() +
  labs(title = "Yemas Abiertas por Tratamiento y Época",
       x = "Época", y = "Proporcion de Yemas Abiertas") +
  theme(legend.position = "right")  # Colocar la leyenda a la derecha

# Mostrar el gráfico
ggplotly(g1)


En febrero, ambas condiciones (con y sin frío) favorecen una mayor apertura de yemas en comparación con octubre y diciembre, siendo febrero la época más favorable para la floración. Aunque el tratamiento sin frío presenta una mayor proporción de yemas abiertas en octubre y diciembre, el tratamiento con frío tiene un desempeño similar en febrero. Dicho esto, la época influye más que el tratamiento para favorecer la floración de las azaleas.


Modelo logistico


El modelo logístico en este caso es útil porque permite modelar la probabilidad de un resultado binario (yema abierta o cerrada) y entender cómo factores como el tratamiento de frío y la época de cultivo afectan esa probabilidad.

modelo=glm(y~trat+epoca, data=AZALEA,family = "binomial")
modelo_resumen=summary(modelo)
data.frame(modelo_resumen$coefficients)
Estimate Std..Error z.value Pr…z..
(Intercept) -0.0927833 0.9922944 -0.0935038 0.9255033
tratnofrio 0.3364182 1.1248264 0.2990846 0.7648755
epocaDiciembre 0.2673168 1.1676336 0.2289390 0.8189164
epocaFebrero 3.1002804 2.2278845 1.3915804 0.1640495


La tabla muestra los resultados de un modelo logístico para evaluar la apertura de yemas en función del tratamiento y la época

Tratamiento “No Frío”:
En comparación con el tratamiento con frío, el tratamiento sin frío aumenta las probabilidades de apertura de las yemas.

Época “Diciembre”:
Las plantas en diciembre tienen una probabilidad mayor de abrir las yemas en comparación con octubre.

Época “Febrero”:
Febrero tiene una probabilidad mucho mayor de apertura de yemas en comparación con Octubre.


Matriz de confusión

library(knitr)

# Crear la tabla de contingencia
tabla <- table(presencia_yema_abierta_real, presencia_yema_abierta_modelo)

# Convertirla en un data frame
tabla_df <- as.data.frame(tabla)

# Mostrar la tabla con formato bonito
kable(tabla_df, caption = "", align = "c")
presencia_yema_abierta_real presencia_yema_abierta_modelo Freq
FALSE FALSE 1
TRUE FALSE 2
FALSE TRUE 2
TRUE TRUE 13
Verdaderos Positivos (VP) = 13 -> Yema abierta
Verdaderos Negativos (VN) = 1 -> Yema cerrada
Total N = 1 + 2 -> Modelo predijo que la yema estaba cerrada
Total P = 2 + 13 -> Modelo predijo que la yema estaba abierta


Desempeño (VP+VN)/total

\[ \frac{13 + 1}{18} = 0.7777778 \]


Acierta en el 77.78% de las predicciones, tanto positivas como negativas.



Sensibilidad - VP/total positivos

\[ \frac{13}{15} = 0.8667 \]


Un 86.67% de los casos positivos los que las yemas realmente se abrieron. Es una medida de la efectividad del modelo para detectar casos positivos.



Especificidad - VN/total negativos

\[ \frac{1}{3} = 0.333 \]


Con un 33.33%, indica que las yemas realmente no se abrieron

Prediccion

¿Que proporcion se espera de que una planta de azalea tenga yemas abiertas en la época de Diciembre, tratada con Frío?
prediccion <- predict(modelo, list(epoca="Diciembre", trat="frio"), type="response")
0.543523


El valor demuestra que aunque hay una probabilidad del 54.35% de que las yemas se abran, no es una certeza, reflejando que el tratamiento con frío en diciembre tiene un efecto positivo, pero todavía hay una incertidumbre en los resultados.


Conclusión de los resultados

El estudio muestra que tanto el tratamiento de frío como la época de cultivo afectan la apertura de las yemas. El modelo predice correctamente el 77.78% de las veces, y tiene una buena capacidad para identificar cuando las yemas se abren (86.67%), pero tiene dificultades para identificar cuando no se abren (33.33%). Las predicciones muestran que el tratamiento no tiene gran importancia, y que la época de cultivo parece ser el factor más importante para mejorar la floración.