El objetivo de este estudio es investigar cómo el tipo de agua que alimenta un humedal, ya sea precipitación (P) o agua subterránea (ST), influye en las tasas de producción de metano en el suelo de estos ecosistemas. El metano, un potente gas de efecto invernadero, se genera en los humedales como resultado de la descomposición anaeróbica de materia orgánica en ambientes saturados de agua. Para realizar este análisis, se seleccionaron seis humedales, tres de ellos alimentados por agua subterránea y tres por agua de precipitación. En cada uno de estos humedales, se tomaron tres muestras de suelo aleatorias de diferentes puntos dentro del humedal para asegurar que los datos fueran representativos de la variabilidad natural de cada ecosistema. Posteriormente, las muestras fueron incubadas a temperatura constante en condiciones controladas en el laboratorio, con el fin de replicar un entorno de descomposición constante, y se midió la producción de metano en unidades de moles por litro por hora (mol/l/hr).
library(readxl)
metano <- read_excel("~/Desktop/metano.xlsx",
col_types = c("text", "numeric", "numeric",
"numeric"))
View(metano)
Tipo: Esta variable indica el tipo de agua que alimenta el humedal, es decir, si el humedal es alimentado por agua de precipitación o agua subterránea.
Humedal: Esta variable se refiere al número de humedal dentro del conjunto de humedales estudiados. Los humedales fueron etiquetados con números del 1 al 6, y este número representa el humedal específico dentro del estudio.
Muestra: Se refiere al número de la muestra de suelo tomada en cada humedal. Cada humedal tiene tres muestras de suelo, y cada muestra se etiquetó con un número del 1 al 3 para indicar su origen dentro del mismo humedal.
Metano:Es la variable que estás tratando de
predecir o explicar en este estudio. En este caso, se refiere a la tasa
de producción de metano medida en moles por litro por hora (m mol/l/hr)
# Crear data frame
datos <- data.frame(
Tipo = c(rep("ST", 9), rep("P", 9)),
Humedal = rep(1:6, each = 3),
Muestra = rep(1:3, times = 6),
Metano = c(6.63, 6.77, 5.64, 12.40, 13.50, 11.90, 7.64, 6.18, 5.42,
1.74, 2.55, 2.09, 0.59, 0.32, 0.80, 1.98, 4.56, 3.67)
)
metano$Humedal =as.character(metano$Humedal)
metano$Metano = as.numeric((metano$Metano))
ggplot(datos, aes(x = Tipo, y = Metano, fill = Tipo)) +
geom_boxplot() +
labs(title = "Producción de metano por tipo de humedal",
y = "Metano (m mol/l/hr)") +
theme_minimal()
La gráfica compara la producción de metano entre humedales de agua subterránea (ST) y humedales de precipitación (P). Los humedales de precipitación muestran una producción de metano baja y constante, con valores entre 0 y 4 m mol/l/hr, lo que indica que las tasas de metano son relativamente homogéneas en estos humedales. Esto sugiere que los humedales alimentados por agua de precipitación tienen una producción de metano más estable y con menos variabilidad.
En cambio, los humedales de agua subterránea tienen una producción de metano significativamente más alta (con valores entre 5 y más de 13 m mol/l/hr) y una mayor variabilidad en las tasas de metano. La mediana de metano en estos humedales está cerca de 7, lo que indica que la mayoría de las observaciones se agrupan alrededor de ese valor, pero con una mayor dispersión en los valores. Esto sugiere que el tipo de agua tiene un impacto importante en la cantidad de metano producido, con los humedales de agua subterránea mostrando mayor variabilidad y producción de metano en comparación con los de precipitación.
library(ggplot2)
library(dplyr)
# Calcular media por humedal
media_humedal <- datos %>%
group_by(Humedal, Tipo) %>%
summarise(MediaMetano = mean(Metano))
ggplot(media_humedal, aes(x = factor(Humedal), y = MediaMetano, fill = Tipo)) +
geom_col() +
labs(title = "Media de producción de metano por humedal",
x = "Humedal",
y = "Metano (m mol/l/hr)") +
scale_fill_manual(values = c("ST" = "#00A3A3", "P" = "#FF6347")) +
theme_minimal()
La gráfica muestra cómo varía la producción de metano en diferentes humedales según su tipo de alimentación: si están alimentados por agua de precipitación (P) o por agua subterránea (ST). En el eje X se encuentran los números de los humedales (del 1 al 6), y en el eje Y se mide la producción de metano en unidades de m mol/l/hr. Las barras azules representan los humedales alimentados por agua subterránea (ST), y las barras naranjas representan los alimentados por agua de precipitación (P).
Al observar la gráfica, se nota que los humedales ST tienen una
producción de metano considerablemente más alta en comparación con los
humedales P, sobre todo en el humedal 2, donde la producción de metano
es mucho mayor, alcanzando aproximadamente 12m mol/l/hr. En cambio, los
humedales P tienen una producción de metano mucho más baja, con los
valores más cercanos a cero en algunos casos. Esto sugiere que el tipo
de agua que alimenta un humedal, ya sea agua de precipitación o
subterránea, tiene un impacto significativo en la cantidad de metano
producido. Los humedales alimentados por agua subterránea parecen
generar más metano que aquellos alimentados por agua de precipitación.
# Ajustar el modelo lineal: tasa de metano en función del tipo de humedal y la muestra
modelo1 <- lm(Metano ~ Tipo + Humedal, data = metano)# Resumen del modelo
# Desempeño del modelo
resumen=summary(modelo1)
data.frame(resumen$coefficients)
| Estimate | Std..Error | t.value | Pr…t.. | |
|---|---|---|---|---|
| (Intercept) | 3.4033333 | 0.4866400 | 6.9935335 | 0.0000145 |
| TipoST | 2.9433333 | 0.6882129 | 4.2767771 | 0.0010751 |
| Humedal2 | 6.2533333 | 0.6882129 | 9.0863351 | 0.0000010 |
| Humedal3 | 0.0666667 | 0.6882129 | 0.0968692 | 0.9244293 |
| Humedal4 | -1.2766667 | 0.6882129 | -1.8550460 | 0.0883115 |
| Humedal5 | -2.8333333 | 0.6882129 | -4.1169429 | 0.0014284 |
lm(formula = Metano ~ Tipo + Humedal, data = metano)
Los coeficientes indican el impacto que cada variable (Tipo y Humedal) tiene sobre la producción de metano. Analicemos cada uno:
TipoST (2.94333): Este coeficiente indica que,
cuando el tipo de humedal es agua subterránea (ST), la
producción de metano aumenta en promedio en 2.94333
unidades (en m mol/l/hr) respecto a los humedales alimentados
por precipitación (P). Como el p-valor asociado a este
coeficiente es 0.00108, esto es altamente significativo
(con un nivel de confianza del 99.9%). Esto confirma que el tipo de agua
(subterránea o precipitación) influye significativamente en la
producción de metano, siendo los humedales ST los que producen más
metano.
Humedales específicos (Humedal2, Humedal3, …):
Estos coeficientes muestran el cambio en la producción de metano en
comparación con el Humedal1. Cada humedal tiene un
impacto distinto:
Humedal2 (6.25333): Este coeficiente es
muy positivo y significativo (p-valor < 0.001).
Indica que el Humedal2 tiene una producción de metano
mucho mayor que el Humedal1. La tasa de metano en
Humedal2 es, en promedio, 6.25333 unidades más
alta que en Humedal1.
Humedal3 (0.06667): Este coeficiente es
prácticamente cero, y el p-valor es muy alto
(0.92443), lo que indica que la producción de metano en
Humedal3 no difiere significativamente de la producción
de metano en el Humedal1. En otras palabras, Humedal3
no tiene un efecto notable en la tasa de metano.
Humedal4 (-1.27667): Este valor negativo sugiere que la producción de metano en Humedal4 es más baja que en el Humedal1. Aunque el p-valor es 0.08831, que no es tan bajo como el de otros coeficientes, todavía se puede considerar algo significativo y relevante.
Humedal5 (-2.83333): Este coeficiente negativo indica que Humedal5 tiene una producción de metano significativamente más baja que el Humedal1. El p-valor (0.00143) es bastante bajo, lo que lo convierte en un resultado estadísticamente significativo.
El R² de 0.9699 indica que el modelo es capaz de explicar el 97% de
la variabilidad en la producción de metano. Esto sugiere que las
variables seleccionadas, como el tipo de humedal y los humedales
específicos, son altamente relevantes para predecir la producción de
metano. Solo el 3% de la variabilidad no es explicado por el modelo, lo
que refleja un ajuste muy preciso y una alta capacidad predictiva de las
variables utilizadas.
¿Cuál sería el valor estimado de metano del humedal 2 es alimentado por agua subterranea?
predict(modelo1,list(Tipo = "ST", Humedal = "2"))
## 1
## 12.6
3.40333 + (2.94333*1) + (6.25333*1)
12.59999
Se espera que en el humedal 2 alimentado por agua subterranea el valor de metano sea de 12.6 mol/l/hr
Este estudio tiene como objetivo evaluar el impacto de un tratamiento de enfriamiento en las plantas de azalea, con el fin de favorecer una floración más homogénea y abundante al momento de la venta. Para ello, se emplea un diseño experimental factorial 3x2, considerando dos factores principales: el tratamiento, es decir, con frío y sin frío y la época de recolección que corresponde a los meses de octubre, diciembre y febrero. A través de tres repeticiones, se registraron el número de yemas florales abiertas y cerradas en cada planta, lo que permite analizar si la proporción de yemas abiertas (y) está influenciada por el tratamiento, la época o la interacción de ambos factores. Lo que busca este análisis es proporcionar información clave para optimizar el proceso de floración antes de que las azaleas lleguen al mercado.
library(readxl)
AZALEA <- read_excel("~/Desktop/AZALEA.xlsx",
col_types = c("numeric", "text", "numeric",
"numeric", "numeric"))
View(AZALEA)
rep: Representa el número de repetición del experimento, con tres repeticiones en total para cada combinación de tratamiento y época.
trat: Indica el tratamiento aplicado a las plantas de azalea, con dos posibles valores: “nofrio” (sin frío) y “frio” (con frío). Este tratamiento busca evaluar su influencia en la apertura de las yemas.
epoca: Corresponde al mes de la época de recolección, con tres valores posibles: 1 para octubre, 2 para diciembre y 3 para febrero. Cada época se utiliza para evaluar cómo el tiempo de recolección afecta la floración de las azaleas.
abiertas: Representa el número de yemas abiertas en cada planta durante el experimento.
cerradas: Indica el número de yemas cerradas en cada planta.
y: Indica el porcentaje de yemas que están abiertas en cada planta de azalea en comparación con el total de yemas presentes (abiertas y cerradas).
require(ggplot2)
require(plotly)
AZALEA$y=AZALEA$abiertas/(AZALEA$abiertas+AZALEA$cerradas)
AZALEA$epoca = as.numeric((AZALEA$epoca))
AZALEA$epoca = factor(AZALEA$epoca, levels = c(1, 2, 3), labels = c("Octubre", "Diciembre", "Febrero"))
g1 = ggplot(AZALEA, aes(x = epoca, y = y, fill = trat, group = trat)) +
# Barras con color para cada tratamiento
stat_summary(fun = mean, geom = "bar", position = "dodge", width = 0.6) + # Barras para cada tratamiento
# Degradado de rojos para las barras
scale_fill_manual(values = c("nofrio" = "#FF6347", "frio" = "#8B0000")) + # Colores personalizados para la leyenda
theme_minimal() +
labs(title = "Promedio de Yemas Abiertas por Tratamiento y Época",
x = "Época", y = "Promedio de Yemas Abiertas") +
theme(legend.position = "right") # Colocar la leyenda a la derecha
# Mostrar el gráfico interactivo con las etiquetas personalizadas
ggplotly(g1)
La gráfica muestra la proporción de yemas abiertas en plantas
tratadas con “frío” y “no frío” a lo largo de tres épocas: Octubre,
Diciembre y Febrero. En Octubre y Diciembre, las plantas tratadas con
“no frío” presentan una mayor proporción de yemas abiertas, con valores
de 0.527 en la epoca 1 y 0.667 en la epoca 2, en comparación con las
tratadas con “frío”, aunque la diferencia no es muy pronunciada. Sin
embargo, en el mes de Febrero, las plantas tratadas con “frío” tienen
ligeramente una mayor proporción de yemas abiertas con un valor de 0.961
o 96.1%. La gráfica sugiere que la proporción de yemas abiertas parece
depender de ambos factores, el tratamiento y la época. Sin embargo, la
relación entre estos dos factores no es lineal, ya que el impacto de
cada tratamiento varía según la época, lo que implica que este factor
juega un papel importante en cómo el tratamiento afecta la floración de
las azaleas, influyendo en los resultados finales. En particular, la
época de Febrero favorece un mayor efecto del tratamiento “frío”,
mientras que en Octubre y Diciembre, el tratamiento “no frío” tiene un
efecto más favorable.
modelo=glm(y~trat+epoca, data = AZALEA,family = "binomial")
mod_resumen=summary(modelo)
data.frame(mod_resumen$coefficients)
| Estimate | Std..Error | z.value | Pr…z.. | |
|---|---|---|---|---|
| (Intercept) | -0.0927833 | 0.9922944 | -0.0935038 | 0.9255033 |
| tratnofrio | 0.3364182 | 1.1248264 | 0.2990846 | 0.7648755 |
| epocaDiciembre | 0.2673168 | 1.1676336 | 0.2289390 | 0.8189164 |
| epocaFebrero | 3.1002804 | 2.2278845 | 1.3915804 | 0.1640495 |
Tratamiento No Frío (0.33642): El coeficiente de tratamiento no frío (0.33642) indica que, en comparación con el tratamiento con frío, las plantas tratadas con tratamiento sin frío tienen probabilidades más altas de que las yemas se abran. Sin embargo, el p-valor asociado a este coeficiente es 0.765, lo que indica que este efecto no es estadísticamente significativo. Por lo tanto, aunque el tratamiento sin frío parece tener un efecto positivo, no se puede concluir con certeza que el tratamiento sin frío influya en la apertura de las yemas de manera significativa.
Época de Diciembre (0.26732): El coeficiente de época diciembre (0.26732) sugiere que las plantas en diciembre tienen probabilidades ligeramente más altas de abrir las yemas en comparación con las plantas de octubre. Es decir, las plantas en diciembre, en promedio, tienen una probabilidad algo mayor de abrir sus yemas en comparación con las plantas en octubre. Sin embargo, el p-valor es 0.819, lo que indica que el efecto de esta época no es estadísticamente significativo en la proporción de yemas abiertas.
Época de Febrero (3.10028): El coeficiente de época febrero (3.10028) indica que las plantas en este mes tienen probabilidades significativamente mayores de abrir las yemas en comparación con las plantas en octubre. Este es el valor más alto entre los coeficientes, lo que sugiere que febrero es un mes mucho más favorable para la apertura de las yemas. Sin embargo, el p-valor asociado a este coeficiente es 0.164, lo que indica que el efecto de la época de febrero no es estadísticamente significativo. Esto significa que, aunque el modelo muestra un efecto positivo para febrero, no hay suficiente evidencia estadística para afirmarlo con certeza.
Ya que el valor de probabilidad es alto para época y tratamiento, esto sugiere que, aunque estos factores pueden parecer tener un efecto, el modelo no puede concluir con confianza que realmente afectan la apertura de las yemas.
prob= modelo$fitted.values
proporcion_yema_abierta_modelo= prob > 0.5
proporcion_yema_abierta= AZALEA$y >0.5
tabla=table(proporcion_yema_abierta,proporcion_yema_abierta_modelo)
tabla
## proporcion_yema_abierta_modelo
## proporcion_yema_abierta FALSE TRUE
## FALSE 1 2
## TRUE 2 13
VP= 13
VN= 1
Total N= 1+2
Total P= 2+13= 15
Esta fórmula calcula la precisión o exactitud del modelo. Dicho en otras palabras, indica la proporcion de aciertos del modelo.
\[ \frac{VP + VN}{Total} = \frac{13 + 1}{18} = 0.7777778 \]
En este caso, el porcentaje indica que el 77,78% de las predicciones fueron correctas (es decir, el modelo acertó el 77,78% de las veces, ya sea prediciendo correctamente que las yemas se abrirían o no).
La sensibilidad se encarga de medir la capacidad del modelo para indicar correctamente los casos en los que realmente ocurrió el evento; en este caso, cuando las yemas realmente se abrieron.
\[ \frac{VP}{\text{Total positivos}} = \frac{13}{15} = 0.8666667 \]
El resultado del calculo indica que el modelo fue capaz de identificar correctamente el 86.67% de los casos en los que las yemas realmente se abrieron. Es una medida de la efectividad del modelo para detectar casos positivos.
La especificidad es muy importante a la hora de identificar correctamente los casos negativos, como las plantas sin yemas abiertas.
\[ \frac{VN}{\text{Total negativos}} = \frac{1}{3} = 0.3333333 \]
El resultado del cálculo indica que el modelo fue capaz de predecir el 33,33% de los casos en los que las yemas realmente no se abrieron. Es una medida de la efectividad del modelo para detectar casos negativos.
¿Qué proporcion se espera de que una planta de azalea tenga yemas abiertas en la época de Febrero, tratada con frío?
predict(modelo, list(epoca="Febrero",trat="frio"), type="response")
## 1
## 0.9529117
La probabilidad predicha de que las yemas se abran en las plantas
tratadas con frío en el mes de febrero es 0.9529 o 95.29%. Este valor
sugiere una alta probabilidad de que las plantas tratadas con frío en
febrero tengan las yemas abiertas, lo que indica que este tratamiento en
este mes es muy efectivo para lograr una floración exitosa.
¿Qué proporcion se espera de que una planta de azalea tenga yemas abiertas en la época de Diciembre, tratada con frío?
predict(modelo, list(epoca="Diciembre",trat="frio"), type="response")
## 1
## 0.543523
La probabilidad predicha de que las yemas se abran en las plantas tratadas con frío en el mes de diciembre es 0.5435 o 54.35%. Este valor es significativamente más bajo que el de febrero, lo que sugiere que el tratamiento frío en diciembre tiene una probabilidad moderada de abrir las yemas. Esto indica que diciembre no es tan favorable como febrero para la floración de las azaleas tratadas con frío.
Se realizaron estas dos predicciones con el objetivo de mostrar que, aunque en ambas predicciones se utilizó el mismo tratamiento, la notable diferencia en el porcentaje de yemas abiertas sugiere que el tratamiento no es un factor determinante para optimizar la floración.