Introducción

El caso 1 consiste en el análisis de azaleas (género Rhododendron), estas son plantas ornamentales de gran valor comercial debido a su vistosa floración, la cual es un factor clave para su éxito en el mercado. Sin embargo, la floración puede verse afectada por diferentes condiciones ambientales (Lee et al., 2015), incluyendo la temperatura previa a la venta. En este estudio, se evaluó el efecto de un tratamiento de enfriamiento en la floración de azaleas, con el objetivo de determinar si esta práctica favorece una floración más abundante y homogénea.

Para ello, se realizó un experimento factorial 3x2 con tres repeticiones, en el que se analizaron plantas obtenidas en tres momentos distintos (octubre, diciembre y febrero) y se comparó la proporción de yemas florales abiertas entre plantas sometidas o no al tratamiento de enfriamiento. Este análisis permitirá comprender si la floración de las azaleas está influenciada por la época, el tratamiento térmico o la interacción entre ambos factores.

Por otro lado, para el caso 2, la descomposición de materia orgánica puede darse a través de metanogénesis, un proceso del que se encargan ciertas bacterias y microorganismos metanogénicos que producen gas metano que luego puede ser liberado a la atmósfera o consumido por otros organismos. Esta forma de descomposición está altamente ligada a los humedales de agua dulce, donde la producción de gas metano puede variar dependiendo de la composición del agua, la cantidad de nutrientes y los niveles de contaminación (Torres-Alvarado et al. 2005). En este caso, se tienen datos recolectados de 6 humedales diferentes, donde se realizaron 3 muestreos en cada uno. También se tuvo en cuenta el tipo de agua que alimentaba el humedal, por lo que 3 humedales corresponden a aguas subterraneas y los otros 3 corresponden a agua por precipitaciones.

Se busca analizar la relación que existe entre las tasas de producción de metano (m mol/l/hr) halladas en las muestras de suelo recolectadas de cada humedal y el tipo de agua.

Desarrollo Caso 1: Azaleas

require(ggplot2)
require(table1)
require(plotly)

library(readxl)
azaleas <- read_excel("azaleas.xlsx", col_types = c("numeric", 
    "text", "text", "numeric", "numeric"))

pabiertas<-azaleas$abiertas/(azaleas$abiertas+azaleas$cerradas)

azaleas$y=as.numeric(pabiertas)

Análisis de relación entre proporción de yemas abiertas y la época

g1=ggplot(azaleas, aes(y=y, x=epoca,fill = epoca))+geom_boxplot()+theme_bw()

ggplotly(g1)

Gráfico 1. Gráfico de cajas muestra la variable “y” (proporción de yemas abiertas) en función de las 3 épocas evaluadas, representados en colores distintos.

Época 1 (rojo): Presenta valores bajos, la mediana es de 0.5 y los valores son bastante homogéneos.

Época 2 (verde): Muestra una mayor dispersión en comparación con la época 1, con una mediana más alta (~0.6). Hay más variabilidad en los valores de “y”, lo que indica que la floración es más variable en esta época.

Época 3 (azul): Presenta los valores más altos de “y”, con una distribución estrecha y una mediana cercana a 1, lo que sugiere que en esta época la floración es casi completa o más exitosa.

En general, se observa un aumento progresivo de la floración a medida que avanza la época (de 1 a 3). En la época 3, casi todas las observaciones están cerca del valor máximo de “y”, lo que indica una respuesta más homogénea en la floración.

Análisis de relación entre proporción de yemas abiertas y tratamiento

g2=ggplot(azaleas, aes(y=y, x=trat, fill= trat))+ geom_boxplot()+theme_bw()

ggplotly(g2)

Gráfico 2. Gráfico de cajas muestra la distribución de la variable “y” (proporción de yemas abiertas) en función del tratamiento térmico (trat), donde “frio” está representado en rojo y “nofrio” está representado en azul.

Ambas categorías tienen una dispersión amplia en “y”, lo que indica que hay variabilidad en la floración bajo ambos tratamientos, la mediana de la floración en “nofrio” es mayor que en “frio”, lo que indica una tendencia a valores más altos en ausencia de tratamiento de frío.

Análisis de relación entre proporción de yemas abiertas, época y tratamiento

g3=ggplot(azaleas,aes(y=y,x=epoca, fill = epoca))+geom_boxplot()+theme_bw()+facet_grid(~azaleas$trat)

ggplotly(g3)

Gráfico 3. Gráfico de cajas muestra la variable “y” en función de la época y está dividido en dos paneles según la condición de temperatura, “frío” y “nofrío”.

Respecto a la época 1 se puede evidenciar que en ambas condiciones (“frío” y “nofrío”), los valores de “y” son bajos y similares. En la época 2 si se evidencian difernecias entre tratamientos, en “frío” los valores de “y” se mantienen bajos y similares a la época 1, en cambio, en el tratamiento “nofrío” hay un aumento claro. Y en la época 3, en ambos tratamientos los valores de “y” son altos, en “frío” los valores etsán mas cerca de 1.0 con menor variabilidad, en “nofrío” los valores tienen una mayor dispersión en comparacón con el tratamiento “frío”.

Tras realizar la exploración de datos se realiza el modelo lógistico, este es el modelo indicado para realizar el análisis debido a que la proporción de yemas abiertas es de tipo binaria (toma valores entre 0 y 1).

mod=glm(y~epoca+trat, data = azaleas, family = "binomial")
summary(mod)
## 
## Call:
## glm(formula = y ~ epoca + trat, family = "binomial", data = azaleas)
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.09278    0.99229  -0.094    0.926
## epoca2       0.26732    1.16763   0.229    0.819
## epoca3       3.10028    2.22788   1.392    0.164
## tratnofrio   0.33642    1.12483   0.299    0.765
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 4.08724  on 17  degrees of freedom
## Residual deviance: 0.13102  on 14  degrees of freedom
## AIC: 23.404
## 
## Number of Fisher Scoring iterations: 6

Con estos resultados podemos inferir que respecto a la época 2, (0.26732, p=0.926) la proporción de yemas abiertas no es significativamente diferente de la época 1 y el coeficiente positivo sugiere una leve tendecia a mayor proporción de yemas abiertas en la época 2 pero el efecto es débil. Respecto a la época 3 (3.10028, p=0.164), indica un gran aumento en la proporción de yemas abiertas en comparación con la época 1, sin embargo, el valor p sugiere que no es estadísticamente significativo.

En cuanto al tipo de tratamiento aplicado, la ausencia de frío (0.33634, p=0.765) no tiene un efecto significativo sobre la proporción de yemas abiertas en comparación con el tratamiento de frío.


Desarrollo Caso 2: Metano

library(readxl)
humedales <- read_excel("Parcial II Bioestadística.xlsx", 
    sheet = "Hoja1", col_types = c("text", 
        "text", "numeric", "numeric"))

Análisis de Producción de Metano por Tipo de Agua

table1(~Metano|Tipo,data = humedales)
P
(N=9)
ST
(N=9)
Overall
(N=18)
Metano
Mean (SD) 2.03 (1.41) 8.45 (3.20) 5.24 (4.08)
Median [Min, Max] 1.98 [0.320, 4.56] 6.77 [5.42, 13.5] 4.99 [0.320, 13.5]

Tabla 1. Producción de metano promedio por cada tipo de agua.

g4=ggplot(humedales,aes(y=Metano,x=Tipo,fill = Tipo))+geom_boxplot()+theme_classic()

ggplotly(g4)

Gráfico 4. Gráfico de cajas de producción de metano (y) contra tipo de humedal (x).

La producción promedio de metano en humedales de aguas subterraneas es mucho más alta que en humedales de agua de precipitaciones. También se evidencia que los valores de metano en humedales de aguas subterraneas tienen mayor desviación que los valores de metano en humedales de aguas de precipitaciones.

Análisis de Producción de Metano por Humedal

table1(~Metano|Humedal,data = humedales)
1
(N=3)
2
(N=3)
3
(N=3)
4
(N=3)
5
(N=3)
6
(N=3)
Overall
(N=18)
Metano
Mean (SD) 6.35 (0.616) 12.6 (0.819) 6.41 (1.13) 2.13 (0.406) 0.570 (0.241) 3.40 (1.31) 5.24 (4.08)
Median [Min, Max] 6.63 [5.64, 6.77] 12.4 [11.9, 13.5] 6.18 [5.42, 7.64] 2.09 [1.74, 2.55] 0.590 [0.320, 0.800] 3.67 [1.98, 4.56] 4.99 [0.320, 13.5]

Tabla 1. Producción de metano promedio por cada humedal.

g5=ggplot(humedales,aes(y=Metano,x=Humedal,fill = Humedal))+geom_boxplot()+theme_classic()

ggplotly(g5)

Gráfico 5. Gráfico de cajas de producción de metano (y) contra humedal (x).

El humedal con mayor producción de metano en este caso, corresponde al humedal 2 y el de menor producción, corresponde al humedal 5. En general, los 6 humedales no presentan gran desviación entre los datos obtenidos de las 3 muestras de cada uno, sin embargo, los valores entre ellos si varían bastante.

Análisis de Producción de Metano por Tipo de Agua en Cada Humedal

g6=ggplot(humedales,aes(y=Metano,x=Humedal, fill = Humedal))+geom_boxplot()+theme_bw()+facet_grid(~humedales$Tipo)

ggplotly(g6)

Gráfico 5. Gráfico de cajas de producción de metano contra humedal para ambos tipos de agua P y ST.

Los humedales de agua de precipitaciones (4, 5, 6) tienen una producción de metano mucho más baja en todos los casos que los humedales de aguas subterraneas (1,2,3), lo que indica que la producción promedio de metano está directamente relacionada con el tipo de agua que alimenta el humedal.

Modelo de Regresión

Tras realizar la exploración de datos se realiza el modelo de regresión lineal.

modelo2=lm(Metano~Tipo+Humedal,data = humedales)
summary(modelo2)
## 
## Call:
## lm(formula = Metano ~ Tipo + Humedal, data = humedales)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.42333 -0.35250 -0.00833  0.38833  1.22667 
## 
## Coefficients: (1 not defined because of singularities)
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.40333    0.48664   6.994 1.45e-05 ***
## TipoST       2.94333    0.68821   4.277  0.00108 ** 
## Humedal2     6.25333    0.68821   9.086 9.98e-07 ***
## Humedal3     0.06667    0.68821   0.097  0.92443    
## Humedal4    -1.27667    0.68821  -1.855  0.08831 .  
## Humedal5    -2.83333    0.68821  -4.117  0.00143 ** 
## Humedal6          NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8429 on 12 degrees of freedom
## Multiple R-squared:  0.9699, Adjusted R-squared:  0.9574 
## F-statistic:  77.4 on 5 and 12 DF,  p-value: 1.044e-08

A partir de estos datos se demuestra que las variables ST, Humedal 2 y Humedal 5 son estadísticamente significativas (p < 0.01), lo que indica que tienen un impacto relevante en las tasas de producción de metano. El Humedal 2 tiene un efecto altamente significativo (p < 0.001), mientras que Humedal 5 tiene un impacto negativo importante. Humedal 4 puede ser significativo (0.05 < p < 0.1). Por otro lado, el Humedal 3 no es significativo (p > 0.1).

Modelo Predictivo

Con el modelo de regresión se puede establecer un modelo predictivo.

Ejemplo: ¿Cuál sería el valor estimado del humedal 4, si es alimentado por aguas subterraneas?

predict(modelo2,list(Tipo="ST", Humedal="4"))
##    1 
## 5.07 
## attr(,"non-estim")
## 1 
## 1

Según el modelo, se espera que la tasa de producción de metano en este caso sea de 5.07.


Conclusiones

Caso 1: Azaleas

El análisis de los tres gráficos y del modelo logístico permite evaluar la relación entre la proporción de yemas abiertas, la época y el tratamiento aplicado. En el primer gráfico, que muestra la distribución de la proporción de yemas abiertas en función de la época, se observa una tendencia creciente a medida que avanza el tiempo. En la época 1, los valores son bajos y con poca variabilidad, mientras que en la época 2 se presenta un aumento en la dispersión. En la época 3, los valores son más altos y con menor dispersión, lo que sugiere una tendencia de incremento estable. Esto indica que la proporción de yemas abiertas podría estar influenciada por la época, aumentando con el tiempo, aunque el modelo logístico no respalda esta relación de manera estadísticamente significativa.

El segundo gráfico muestra la distribución de la proporción de yemas abiertas según el tratamiento. Se evidencian diferencias en la mediana y la dispersión de los valores entre las condiciones frío y no frío. En el tratamiento de frío, los valores están concentrados en una franja más baja, mientras que en la condición de no frío hay una mayor dispersión y una mediana más alta. Esto sugiere que el tratamiento podría influir en la proporción de yemas abiertas, con el frío limitando su incremento, mientras que en ausencia de este factor la variabilidad y el rango de valores son mayores. Sin embargo, el modelo logístico no muestra evidencia estadística suficiente para afirmar que el tratamiento tiene un efecto significativo sobre la variable respuesta.

El tercer gráfico, que representa la interacción entre época y tratamiento, muestra que en la condición de frío las épocas 1 y 2 presentan valores bajos y estables, mientras que en la época 3 hay un aumento. En la condición de no frío, la tendencia es más gradual y el incremento se observa desde la época 2. Esto sugiere que la respuesta en la proporción de yemas abiertas es más lenta bajo frío pero alcanza valores similares en la última época, mientras que en la condición de no frío el aumento ocurre antes. A pesar de estas tendencias, el modelo logístico no respalda estadísticamente que la interacción entre época y tratamiento tenga un efecto significativo sobre la variable respuesta.

Los resultados obtenidos sugieren que visualmente la proporción de yemas abiertas parece estar influenciada tanto por la época como por el tratamiento, pero el análisis estadístico no permite confirmar una relación significativa. Esto indica que podrían ser necesarias muestras más grandes o modelos alternativos para evaluar mejor la influencia de estas variables en la respuesta observada.

Caso 2: Metano

En general, se observa que todos los 3 humedales con tipo de agua subterranea tienen una mayor producción de metano en comparación con los de agua de precipitaciones. De forma más específica, el Humedal 2 (ST) presenta las mayores tasas de producción de metano entre los 6 muestreados, con valores de producción de metano bastante altos y poca variabilidad. Por otro lado, el Humedal 3 (ST) tiene valores dde tasas de producción de metano ligeramente elevados, pero con una dispersión más amplia. Para los humedales con aguas de precipitaciones, se observa una variabilidad significativa, el Humedal 6 (P) muestra la mayor dispersión en las tasas de producción de metano, mientras que el Humedal 5 (P) tiene los valores más bajos y menos dispersos de los 6 humedales. El Humedal 4 (P) presenta una tasa de producción de metano másintermedia, con un rango algo estrecho de valores.

Los resultados muestran que la producción de metano de los humedales de agua dulce está directamente relacionada con el tipo de agua que los alimenta, en este caso, precipitada o subterránea, siendo la subterranea la que provoca tasas de producción más altas. Este patrón puede deberse a la carga de nutrientes, materia orgánica e incluso contaminantes del suelo que arrastra el agua subterranea, creando un ambiente más prospero para los organismos metanogénicos dentro del humedal, aumentando así la producción y la concentración de este compuesto en el entorno.

Referencias