Caso de humedales

Introducción

El metano es un gas de efecto invernadero producido en ecosistemas acuáticos bajo condiciones anaerobias. En este análisis, se evaluará si el tipo de humedal influye en la tasa de producción de metano. Para ello, se utilizará un conjunto de datos que incluye mediciones en humedales alimentados por precipitación (P) y agua subterránea (ST), y se aplicará un modelo de regresión para determinar posibles diferencias significativas entre los dos tipos.

Análisis de Producción de Metano en Humedales

Estadísticas Descriptivas

require(readxl)
df_metano = read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica.xlsx", 
    col_types = c("text", "numeric", "numeric", 
        "numeric"))

# Convertir 'Tipo' en factor y ordenar niveles
df_metano$Tipo=factor(df_metano$Tipo, levels = c("ST", "P"))


require(ggplot2)
grafico = ggplot(df_metano, aes(x = Tipo, y = Metano, fill = Tipo, text = paste(
  "Media:", round(mean(Metano, na.rm = TRUE), 2), 
  "<br>Mediana:", round(median(Metano, na.rm = TRUE), 2), 
  "<br>Desv. Est.:", round(sd(Metano, na.rm = TRUE), 2)
))) +
  geom_boxplot() +
  theme_minimal() +
  labs(title = "Distribución de Metano por Tipo de Humedal",
       x = "Tipo de Humedal", y = "Metano (mmol/L/hr)") +
  scale_fill_manual(values = c("ST" = "#EE6363", "P" = "lightgoldenrod2"))

require(plotly)
ggplotly(grafico, tooltip = "text")

Resumen estadistico

Los humedales con agua subterránea (ST) presentan una media de 8.45 mmol/L/hr con una desviación estándar de 3.20.
Los humedales alimentados con precipitación (P) tienen una media de 2.03 mmol/L/hr con una desviación estándar de 1.41.
La mediana es 1.98 en P y 6.77 en ST, indicando que los valores de metano son significativamente mayores en los humedales subterráneos.

Se observa una diferencia notable entre los dos tipos de humedales, con valores de metano más altos en los de agua subterránea.

También hay mayor variabilidad en ST, con un rango más amplio de producción de metano.

Analisis estadistico

Se ajustó un modelo de regresión lineal para evaluar la influencia del tipo de humedal en la producción de metano:

# Ajuste del modelo de regresión lineal
modelo1=lm(Metano ~ Tipo, data = df_metano)

# Resumen del modelo
summary(modelo1)

## 
## Call:
## lm(formula = Metano ~ Tipo, data = df_metano)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.0333 -1.7058 -0.5533  1.3567  5.0467 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   8.4533     0.8249  10.248 1.95e-08 ***
## TipoP        -6.4200     1.1666  -5.503 4.82e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.475 on 16 degrees of freedom
## Multiple R-squared:  0.6543, Adjusted R-squared:  0.6327 
## F-statistic: 30.28 on 1 and 16 DF,  p-value: 4.816e-05

Resultados del modelo

R² = 0.654: El modelo explica el 65.4% de la variabilidad en la producción de metano.

P-valor (< 0.001): Se encuentra una diferencia significativa entre los tipos de humedales.

Coeficientes:

Intercepto (2.03): Producción de metano en humedales de precipitación.
Efecto de ST (+6.42): En promedio, los humedales ST producen 6.42 mmol/L/hr más que los de P.

Conclusion

Los resultados indican que los humedales alimentados por agua subterránea producen significativamente más metano que los alimentados por precipitación. Esta diferencia puede estar relacionada con factores ecológicos como la disponibilidad de materia orgánica y las condiciones anaerobias más estables en humedales subterráneos.

Se recomienda ampliar el estudio con más variables ambientales para comprender mejor los mecanismos que regulan la producción de metano en estos ecosistemas.

Caso Azaleas

Introducción

El objetivo de este estudio es evaluar si la proporción de yemas florales abiertas en plantas de azalea depende del tratamiento de enfriamiento previo a la venta, de la época en la que se obtienen las plantas o de la combinación de ambos factores. Para esto, se realizó un experimento factorial 3x2 con 3 repeticiones por tratamiento, donde se registró el número de yemas abiertas y cerradas en cada planta.

Análisis Descriptivo

require(readxl)
require(tidyr)
require(ggplot2)
require(plotly)


  df_azalea= read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica (azalea).xlsx")



# Transformar los datos a formato largo (long format)
df_azalea_long= pivot_longer(df_azalea, cols = c("Abiertas", "Cerradas"), 
                               names_to = "Tipo_Yema", values_to = "Cantidad")

# Ajustar etiquetas para mejor visualización
df_azalea_long$Tipo_Yema = factor(df_azalea_long$Tipo_Yema, 
                                   levels = c("Abiertas", "Cerradas"),
                                   labels = c("Yemas Abiertas", "Yemas Cerradas"))

# Convertir 'Epoca' en factor y ordenar niveles (ajustar nombres si es necesario)
df_azalea_long$Epoca= factor(df_azalea_long$Epoca, levels = c("1", "2", "3"),
                               labels = c("Octubre", "Diciembre", "Febrero"))

# Crear el boxplot con facetas para separar los tipos de yemas
grafico= ggplot(df_azalea_long, aes(x = Epoca, y = Cantidad, fill = Tratamiento)) +
  geom_boxplot() +
  facet_wrap(~ Tipo_Yema, ncol = 2) +  # Separar en dos gráficos (abiertas y cerradas)
  theme_minimal() +
  labs(title = "Distribución de Yemas Abiertas y Cerradas por Época y Tratamiento",
       x = "Época", y = "Cantidad de Yemas") +
  scale_fill_manual(values = c("frio" = "#009ACD", "nofrio" = "#EEC900"))  # Azul para frío, amarillo para no frío

ggplotly(grafico)

Resumen estadistico

En octubre, el tratamiento con frío tiene más yemas cerradas en promedio (100.33 vs. 78.00), lo que sugiere que en esta época las plantas tratadas con frío tienden a mantener más yemas sin abrirse.
En diciembre, el tratamiento sin frío favorece más la apertura de yemas (media 108.67 vs. 75.33).
En febrero, las yemas abiertas aumentan significativamente en ambos tratamientos, pero el tratamiento sin frío tiene una media ligeramente mayor (187.67 vs. 162.33).

El tratamiento con frío parece favorecer la apertura de yemas, especialmente en febrero, mientras que en octubre y diciembre no se observan diferencias tan marcadas. Esto sugiere que la aplicación de frío podría ser una estrategia para inducir la brotación en determinadas épocas del año.

Analisis estadistico

require(readxl)

  df_azalea= read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica (azalea).xlsx")


# Crear variables para el análisis
tratamiento = df_azalea$Tratamiento
epoca = df_azalea$Epoca
yemas_totales = df_azalea$Abiertas + df_azalea$Cerradas
proporcion_abiertas = df_azalea$Abiertas / yemas_totales

# Construir el nuevo dataframe
df_yemas = data.frame(proporcion_abiertas, tratamiento, epoca)

# Convertir la variable dependiente en 1 si la proporción de abiertas es mayor a 0.5, y 0 si no
df_yemas$proporcion_abiertas = as.numeric(df_yemas$proporcion_abiertas > 0.5)


# Ajustar un modelo logístico para evaluar el efecto del tratamiento y la época
df_yemas = na.omit(df_yemas)
modelo = glm(proporcion_abiertas ~ tratamiento + epoca, data = df_yemas, family = "binomial")
summary(modelo)

## 
## Call:
## glm(formula = proporcion_abiertas ~ tratamiento + epoca, family = "binomial", 
##     data = df_yemas)
## 
## Coefficients:
##                    Estimate Std. Error z value Pr(>|z|)
## (Intercept)         -0.8235     1.8728  -0.440    0.660
## tratamientonofrio   18.9417  3476.2780   0.005    0.996
## epoca                0.7930     0.9423   0.842    0.400
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 16.220  on 17  degrees of freedom
## Residual deviance: 10.686  on 15  degrees of freedom
## AIC: 16.686
## 
## Number of Fisher Scoring iterations: 18

## Resultado
## Se observa que el tratamiento tiene un efecto significativo en la apertura de yemas, 
## mientras que la época no influye de manera relevante.

# Obtener probabilidades ajustadas
probailidad = modelo$fitted.values

# Clasificar presencia de alta proporción de yemas abiertas según un umbral del 50%
presencia_yemas_modelo = probailidad > 0.5
presencia_yemas_real = df_yemas$proporcion_abiertas

# Matriz de confusión
table(presencia_yemas_real, presencia_yemas_modelo)

##                     presencia_yemas_modelo
## presencia_yemas_real FALSE TRUE
##                    0     1    2
##                    1     2   13

## Construcción e interpretación de métricas: accuracy, sensibilidad y especificidad

# Accuracy = 0.777
(13+1)/18

## [1] 0.7777778

# Sensibilidad =0.866
13/(13+2)

## [1] 0.8666667

# Especificidad = 0.333
1/(1+2)

## [1] 0.3333333

##medida nueva=(desempeño+sensibilidad+especificidad)=(0.777+0.866+0.333)= 1.976

Resumen de los resultados

Efecto del Tratamiento y Época:

El análisis muestra que el tratamiento no tiene un efecto significativo en la apertura de yemas.
La época no influye de manera relevante en la proporción de yemas abiertas.

Métricas de Desempeño del Modelo

Accuracy: 0.777 (El modelo clasifica correctamente el 77.7% de los casos).
Sensibilidad: 0.866 (El modelo identifica correctamente el 86.6% de las plantas con alta proporción de yemas abiertas).
Especificidad: 0.333 (El modelo identifica correctamente el 33.3% de las plantas con baja proporción de yemas abiertas).

Conclusion

El análisis estadístico no encontró evidencia de que el tratamiento influya significativamente en la proporción de yemas abiertas (p = 0.996), ni que la época tenga un efecto relevante (p = 0.400). La alta variabilidad en la estimación del tratamiento sugiere posibles problemas en la estructura de los datos, como un tamaño de muestra reducido o factores no considerados.

Además, la tabla de comparación entre la presencia real y la predicción de yemas muestra que el modelo tiene dificultades para diferenciar entre casos sin yemas y con pocas yemas abiertas. Aunque en la mayoría de los casos en los que hubo apertura de yemas el modelo predijo correctamente (13 aciertos), también presentó errores al clasificar dos casos sin yemas como si las tuvieran.

Las métricas reflejan que el modelo tiene un buen desempeño en la clasificación de plantas con alta proporción de yemas abiertas, pero es deficiente en la identificación de plantas con baja proporción de yemas abiertas, lo que indica un posible sesgo hacia la detección de presencia de yemas. Para mejorar el análisis, se podría explorar el uso de modelos mixtos con efectos aleatorios. En general, los resultados no respaldan un impacto claro del tratamiento en la apertura de yemas y sugieren que el modelo actual tiene limitaciones en su capacidad predictiva.

Parcial 2

Juan Pablo Marulanda y Mayra Valencia

2025-03-04

Caso de humedales

Introducción

Análisis de Producción de Metano en Humedales

Estadísticas Descriptivas

Resumen estadistico

Analisis estadistico

Resultados del modelo

Coeficientes:

Conclusion

Caso Azaleas

Introducción

Análisis Descriptivo

Resumen estadistico

Analisis estadistico

Resumen de los resultados

Efecto del Tratamiento y Época:

Métricas de Desempeño del Modelo

Conclusion