El metano es un gas de efecto invernadero producido en ecosistemas acuáticos bajo condiciones anaerobias. En este análisis, se evaluará si el tipo de humedal influye en la tasa de producción de metano. Para ello, se utilizará un conjunto de datos que incluye mediciones en humedales alimentados por precipitación (P) y agua subterránea (ST), y se aplicará un modelo de regresión para determinar posibles diferencias significativas entre los dos tipos.
require(readxl)
df_metano = read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica.xlsx",
col_types = c("text", "numeric", "numeric",
"numeric"))
# Convertir 'Tipo' en factor y ordenar niveles
df_metano$Tipo=factor(df_metano$Tipo, levels = c("ST", "P"))
require(ggplot2)
grafico = ggplot(df_metano, aes(x = Tipo, y = Metano, fill = Tipo, text = paste(
"Media:", round(mean(Metano, na.rm = TRUE), 2),
"<br>Mediana:", round(median(Metano, na.rm = TRUE), 2),
"<br>Desv. Est.:", round(sd(Metano, na.rm = TRUE), 2)
))) +
geom_boxplot() +
theme_minimal() +
labs(title = "Distribución de Metano por Tipo de Humedal",
x = "Tipo de Humedal", y = "Metano (mmol/L/hr)") +
scale_fill_manual(values = c("ST" = "#EE6363", "P" = "lightgoldenrod2"))
require(plotly)
ggplotly(grafico, tooltip = "text")
Los humedales con agua subterránea (ST) presentan una media de 8.45 mmol/L/hr con una desviación estándar de 3.20.
Los humedales alimentados con precipitación (P) tienen una media de 2.03 mmol/L/hr con una desviación estándar de 1.41.
La mediana es 1.98 en P y 6.77 en ST, indicando que los valores de metano son significativamente mayores en los humedales subterráneos.
Se observa una diferencia notable entre los dos tipos de humedales, con valores de metano más altos en los de agua subterránea.
También hay mayor variabilidad en ST, con un rango más amplio de producción de metano.
Se ajustó un modelo de regresión lineal para evaluar la influencia del tipo de humedal en la producción de metano:
# Ajuste del modelo de regresión lineal
modelo1=lm(Metano ~ Tipo, data = df_metano)
# Resumen del modelo
summary(modelo1)
##
## Call:
## lm(formula = Metano ~ Tipo, data = df_metano)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.0333 -1.7058 -0.5533 1.3567 5.0467
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.4533 0.8249 10.248 1.95e-08 ***
## TipoP -6.4200 1.1666 -5.503 4.82e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.475 on 16 degrees of freedom
## Multiple R-squared: 0.6543, Adjusted R-squared: 0.6327
## F-statistic: 30.28 on 1 and 16 DF, p-value: 4.816e-05
R² = 0.654: El modelo explica el 65.4% de la variabilidad en la producción de metano.
P-valor (< 0.001): Se encuentra una diferencia significativa entre los tipos de humedales.
Intercepto (2.03): Producción de metano en humedales de precipitación.
Efecto de ST (+6.42): En promedio, los humedales ST producen 6.42 mmol/L/hr más que los de P.
Los resultados indican que los humedales alimentados por agua subterránea producen significativamente más metano que los alimentados por precipitación. Esta diferencia puede estar relacionada con factores ecológicos como la disponibilidad de materia orgánica y las condiciones anaerobias más estables en humedales subterráneos.
Se recomienda ampliar el estudio con más variables ambientales para comprender mejor los mecanismos que regulan la producción de metano en estos ecosistemas.
El objetivo de este estudio es evaluar si la proporción de yemas florales abiertas en plantas de azalea depende del tratamiento de enfriamiento previo a la venta, de la época en la que se obtienen las plantas o de la combinación de ambos factores. Para esto, se realizó un experimento factorial 3x2 con 3 repeticiones por tratamiento, donde se registró el número de yemas abiertas y cerradas en cada planta.
require(readxl)
require(tidyr)
require(ggplot2)
require(plotly)
df_azalea= read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica (azalea).xlsx")
# Transformar los datos a formato largo (long format)
df_azalea_long= pivot_longer(df_azalea, cols = c("Abiertas", "Cerradas"),
names_to = "Tipo_Yema", values_to = "Cantidad")
# Ajustar etiquetas para mejor visualización
df_azalea_long$Tipo_Yema = factor(df_azalea_long$Tipo_Yema,
levels = c("Abiertas", "Cerradas"),
labels = c("Yemas Abiertas", "Yemas Cerradas"))
# Convertir 'Epoca' en factor y ordenar niveles (ajustar nombres si es necesario)
df_azalea_long$Epoca= factor(df_azalea_long$Epoca, levels = c("1", "2", "3"),
labels = c("Octubre", "Diciembre", "Febrero"))
# Crear el boxplot con facetas para separar los tipos de yemas
grafico= ggplot(df_azalea_long, aes(x = Epoca, y = Cantidad, fill = Tratamiento)) +
geom_boxplot() +
facet_wrap(~ Tipo_Yema, ncol = 2) + # Separar en dos gráficos (abiertas y cerradas)
theme_minimal() +
labs(title = "Distribución de Yemas Abiertas y Cerradas por Época y Tratamiento",
x = "Época", y = "Cantidad de Yemas") +
scale_fill_manual(values = c("frio" = "#009ACD", "nofrio" = "#EEC900")) # Azul para frío, amarillo para no frío
ggplotly(grafico)
El tratamiento con frío parece favorecer la apertura de yemas, especialmente en febrero, mientras que en octubre y diciembre no se observan diferencias tan marcadas. Esto sugiere que la aplicación de frío podría ser una estrategia para inducir la brotación en determinadas épocas del año.
require(readxl)
df_azalea= read_excel("C:/Users/mayra/OneDrive - PUJ Cali/5 QUINTO SEMESTRE/Bioestadística/Copia de Datos Parcial 2 Bioestadistica (azalea).xlsx")
# Crear variables para el análisis
tratamiento = df_azalea$Tratamiento
epoca = df_azalea$Epoca
yemas_totales = df_azalea$Abiertas + df_azalea$Cerradas
proporcion_abiertas = df_azalea$Abiertas / yemas_totales
# Construir el nuevo dataframe
df_yemas = data.frame(proporcion_abiertas, tratamiento, epoca)
# Convertir la variable dependiente en 1 si la proporción de abiertas es mayor a 0.5, y 0 si no
df_yemas$proporcion_abiertas = as.numeric(df_yemas$proporcion_abiertas > 0.5)
# Ajustar un modelo logístico para evaluar el efecto del tratamiento y la época
df_yemas = na.omit(df_yemas)
modelo = glm(proporcion_abiertas ~ tratamiento + epoca, data = df_yemas, family = "binomial")
summary(modelo)
##
## Call:
## glm(formula = proporcion_abiertas ~ tratamiento + epoca, family = "binomial",
## data = df_yemas)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.8235 1.8728 -0.440 0.660
## tratamientonofrio 18.9417 3476.2780 0.005 0.996
## epoca 0.7930 0.9423 0.842 0.400
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 16.220 on 17 degrees of freedom
## Residual deviance: 10.686 on 15 degrees of freedom
## AIC: 16.686
##
## Number of Fisher Scoring iterations: 18
## Resultado
## Se observa que el tratamiento tiene un efecto significativo en la apertura de yemas,
## mientras que la época no influye de manera relevante.
# Obtener probabilidades ajustadas
probailidad = modelo$fitted.values
# Clasificar presencia de alta proporción de yemas abiertas según un umbral del 50%
presencia_yemas_modelo = probailidad > 0.5
presencia_yemas_real = df_yemas$proporcion_abiertas
# Matriz de confusión
table(presencia_yemas_real, presencia_yemas_modelo)
## presencia_yemas_modelo
## presencia_yemas_real FALSE TRUE
## 0 1 2
## 1 2 13
## Construcción e interpretación de métricas: accuracy, sensibilidad y especificidad
# Accuracy = 0.777
(13+1)/18
## [1] 0.7777778
# Sensibilidad =0.866
13/(13+2)
## [1] 0.8666667
# Especificidad = 0.333
1/(1+2)
## [1] 0.3333333
##medida nueva=(desempeño+sensibilidad+especificidad)=(0.777+0.866+0.333)= 1.976
El análisis muestra que el tratamiento no tiene un efecto significativo en la apertura de yemas.
La época no influye de manera relevante en la proporción de yemas abiertas.
Accuracy: 0.777 (El modelo clasifica correctamente el 77.7% de los casos).
Sensibilidad: 0.866 (El modelo identifica correctamente el 86.6% de las plantas con alta proporción de yemas abiertas).
Especificidad: 0.333 (El modelo identifica correctamente el 33.3% de las plantas con baja proporción de yemas abiertas).
El análisis estadístico no encontró evidencia de que el tratamiento influya significativamente en la proporción de yemas abiertas (p = 0.996), ni que la época tenga un efecto relevante (p = 0.400). La alta variabilidad en la estimación del tratamiento sugiere posibles problemas en la estructura de los datos, como un tamaño de muestra reducido o factores no considerados.
Además, la tabla de comparación entre la presencia real y la predicción de yemas muestra que el modelo tiene dificultades para diferenciar entre casos sin yemas y con pocas yemas abiertas. Aunque en la mayoría de los casos en los que hubo apertura de yemas el modelo predijo correctamente (13 aciertos), también presentó errores al clasificar dos casos sin yemas como si las tuvieran.
Las métricas reflejan que el modelo tiene un buen desempeño en la clasificación de plantas con alta proporción de yemas abiertas, pero es deficiente en la identificación de plantas con baja proporción de yemas abiertas, lo que indica un posible sesgo hacia la detección de presencia de yemas. Para mejorar el análisis, se podría explorar el uso de modelos mixtos con efectos aleatorios. En general, los resultados no respaldan un impacto claro del tratamiento en la apertura de yemas y sugieren que el modelo actual tiene limitaciones en su capacidad predictiva.