Punto 1 - Salinidad

Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

a. Realice un análisis exploratorio univariado para cada característica e interpretar. b. Realice un análisis exploratorio bivariado que permita conocer como es la relación entre la biomasa y las covariables pH, Salinidad y Zinc (determine cuales variables son las que presentan mayor relación con la biomasa).

#load("C:/Users/sebas/Documents/5to semestre/Bioestadistica/Salinidad - Copy.RData")
load("C:/Users/mcami/OneDrive/Desktop/universidad/Semestre 2026-1/bioestad/Salinidad.RData")

La base de datos contiene 45 registros. La variable principal es la producción de biomasa de una planta forrajera; las demas son características (pH, Salinidad, Zinc y Potasio) del suelo en el que la planta estaba creciendo. Los datos se tomaron de diferentes ambientes. Todas son variables cuantitativas continuas.

require(table1)
require(ggplot2)

Punto 1.A - Exploración Univariada

A continuación se hará un análisis univariado de todas las variables.

Biomasa: Esta variable contiene los gramos de unas plantas forrajeras naturales obtenidas de 45 muestras en diferentes ambientes; esto se puede observar en la tabla 1.

# Tabla descriptiva
table1(~Biomasa, data = Salinidad)
Overall
(N=45)
Biomasa
Mean (SD) 1080 (546)
Median [Min, Max] 992 [370, 2340]

Tabla A1

Con esta tabla se observa que en promedio los ambientes producen 1080 gramos de biomasa, por otro lado la desviación estándar de 546 gramos al ser tan alta puede indicar que hay una alta variabilidad entre los diferentes ambientes. Por otro lado la mediana al ser 992 gramos es menor que el promedio y puede indicar valores elevados, finalmente el mínimo y máximo de datos indica un rango amplio que puede estar relacionado con los diferentes suelos.

# Histograma
ggplot(Salinidad, aes(x = Biomasa)) +
  geom_histogram(bins = 15, fill = "lightblue", color = "darkblue")

#bins divide el rango de biomasa en 15 intervalos 

Gráfica A1

Con este histograma se puede observar la relación de la biomasa y la frecuencia en la que se encontraron los datos de las 45 muestras divididos en 15 intervalos. En donde el segundo intervalo tiene la mayor frecuencia sin embargo hasta el séptimo intervalo la frecuencia es entre 3 y 4 (excluyendo el segundo intervalo). Ademas se ven algunos intervalos en 0 y a partir del noveno intervalo la frecuencia esta mas dispersa.

# Grafica de densidad
ggplot(data= Salinidad,aes(x=Biomasa)) + geom_density(fill="lightblue", color = "darkblue")+
  labs(
    title = "Grafica de Densidad de la biomasa",
    x = "Biomasa",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica A2

La siguiente gráfica de densidad muestra una asimetría positiva, ya que la cola está hacia los valores altos; esto sugiere que existen algunos ambientes con biomasa mayor que el resto, lo que probablemente genera que la media sea mayor que la mediana. Comprobando así lo que se ve en la gráfica anterior (Gráfica A1).

pH: Las siguientes gráficas y tablas tienen como objetivo mostrar los diferentes valores de concentración de pH en el suelo.

table1(~pH, data = Salinidad)
Overall
(N=45)
pH
Mean (SD) 4.61 (1.25)
Median [Min, Max] 4.45 [3.20, 7.45]

Tabla B1

En el caso de los datos correspondientes al pH en el suelo de los diferentes ambientes, se observa un promedio de 4.61 y una desviación estándar de 1.25; esto quiere decir que los suelos estudiados presentan condiciones ácidas. El dato mínimo es de 3.20, lo cual es considerablemente más ácido en comparación con el promedio, mientras que el valor mayor es de 7.45, lo cual está un poco sobre el valor neutro. Esto muestra una variabilidad alta debido al rango tan amplio que se observa en las condiciones de pH de los diferentes suelos y sus ambientes.

ggplot(Salinidad, aes(x = pH)) +
  geom_histogram(bins = 15, fill = "lightgreen", color = "darkgreen")

Gráfica B1

El siguiente histograma muestra, al igual que la gráfica A1, la relación, en este caso entre el nivel de pH y la frecuencia en la que se encuentra en las 45 muestras repartidas en 15 intervalos. Con esta gráfica se puede observar algo muy interesante, ya que los valores de pH más frecuentes son los que están más cercanos al intervalo donde cae el pH de 3,2. Sin embargo, la media es de 4,61; esto se debe a que hay valores más altos que hacen que la media aumente. Como se ve en el histograma, los intervalos que caen entre un pH de 4 a 5,5 tienen una frecuencia alta, lo cual contribuye al aumento de la media.

# Grafica de densidad
ggplot(data= Salinidad,aes(x=pH)) + geom_density(fill="lightgreen", color = "darkgreen")+
  labs(
    title = "Grafica de Densidad del pH",
    x = "pH",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica B2

La siguiente gráfica de densidad muestra una asimetría positiva, confirmando lo que se observo en el histograma (Gráfica B1) ya que la cola esta hacia los valores altos,lo que quiere decir esto es que hay una mayor dispersión en los valores de pH mas altos en los diferentes ambientes. Lo que probablemente genera que la media sea mayor que la mediana.

Salinidad: Las siguientes gráficas y tablas tienen como objetivo mostrar los diferentes valores de concentración de salinidad en el suelo.

table1(~Salinidad, data = Salinidad)
Overall
(N=45)
Salinidad
Mean (SD) 30.3 (3.72)
Median [Min, Max] 30.0 [24.0, 38.0]

Tabla C1

Con esta tabla se permite observar que, en promedio, la salinidad de los ambientes estudiados es de 30.3 u, con una desviación estándar de 3.72 u, lo cual es relativamente bajo. Así mismo, la mediana es de 30.0 u, lo cual es un valor muy cercano al promedio, mostrando así una distribución que puede que se acerque a ser simétrica, lo que se refleja en el rango de valores, siendo el mínimo 24.0 u y el máximo 38.0 u; es decir, el rango es de 14 u.

ggplot(Salinidad, aes(x = Salinidad)) +
  geom_histogram(bins = 15, fill = "pink", color = "darkred") 

Gráfica C1

El siguiente gráfico compara las unidades de salinidad con la frecuencia en la que se encuentran, dividiendo los datos en 15 intervalos; Estos permiten observar y confirmar que la mayor concentración de datos está ubicada alrededor de las 30 u que pertenece al intervalo 7 y es el que cuenta con mayor frecuencia. Este gráfico también ilustra de mejor manera que la distribución no es completamente simétrica, ya que se evidencia una concentración ligeramente mayor en los valores entre medios y bajos, haciéndolos más “compactos”, mientras que los valores más altos están un poco más dispersos, lo que puede explicar ese leve aumento de la media con respecto a la mediana.

# Grafica de densidad
ggplot(data= Salinidad,aes(x=Salinidad)) + geom_density(fill="pink", color = "darkred")+
  labs(
    title = "Grafica de Densidad de la salinidad",
    x = "slinidad",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica C2

La gráfica de densidad de la salinidad permite observar de manera más clara la distribución aproximadamente simétrica, aunque con una ligera asimetría positiva, evidenciada por una cola levemente más extendida hacia los valores altos. Esto sugiere la presencia de algunos valores de salinidad mayores que el promedio, aunque la distribución general no presenta un sesgo marcado, lo que confirma que la distribución de los datos es relativamente simétrica.

Zinc: Las siguientes gráficas y tablas tienen como objetivo mostrar los diferentes valores de concentración de zinc en el suelo.

table1(~Zinc, data = Salinidad)
Overall
(N=45)
Zinc
Mean (SD) 17.8 (8.27)
Median [Min, Max] 19.2 [0.211, 31.3]

Tabla D1

En el caso del zinc hay una media de 17,8 y una desviación estándar de 8,27; por otro lado, la mediana fue de 19,2, lo que la hace un poco mayor que la media, lo que puede generar una pequeña asimetría. Por otro lado, se ve un rango bastante amplio con un mínimo de 0,211 y un máximo de 31,3, mostrando una posible variabilidad alta en las concentraciones de zinc de los diferentes lugares.

ggplot(Salinidad, aes(x = Zinc)) +
  geom_histogram(bins = 15, fill = "violet", color = "purple") 

Gráfica D1

Este histograma muestra la distribución de las concentraciones de zinc en las muestras, dividiéndolas en 15 intervalos. Se puede observar que la mayor concentración de calores está entre el quinto y el séptimo intervalo, en donde la frecuencia es mayor. Por otro lado, también se puede ver que hay unos cuantos valores muy bajos, cercanos a 0 , lo que confirma lo indicado en la Tabla D1. Lo que hacen esos valores bajos es generar la asimetría que se refleja en los valores de la media y la mediana. Otra cosa que se visibiliza con este gráfico es el amplio rango que hay. Finalmente se pueden ver unos valores bajos que están separados del resto de los datos.

# Grafica de densidad
ggplot(data= Salinidad,aes(x=Zinc)) + geom_density(fill="violet", color = "purple")+
  labs(
    title = "Grafica de Densidad del Zinc",
    x = "Zinc",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica D2

Esta gráfica de densidad muestra una simetría negativa, ya que la cola va hacia los valores bajos, al contrario de los casos anteriores. Hay unos valores que están extremadamente cercanos a 0, lo cual puede explicar por qué la media es menor que la mediana. En general, este rango tan amplio muestra una alta variabilidad en las concentraciones de zinc en los suelos de los diferentes ambientes.

Potasio: Las siguientes gráficas y tablas tienen como objetivo mostrar los diferentes valores de concentración de potasio en el suelo.

table1(~Potasio, data = Salinidad)
Overall
(N=45)
Potasio
Mean (SD) 797 (298)
Median [Min, Max] 773 [351, 1440]

Tabla E1

En esta tabla se pueden ver los datos del potasio encontrado en las muestras de tierra de los diferentes ambientes, con una media de 797 y desviación estándar de 298 que indica una dispersión alta de los datos. La mediana fue de 773, es decir, un poco menor que la media, que se puede deber a los valores tan altos que hay, ya que el mayor es de 1440, mientras que el menor es de 351, lo cual también muestra una alta variabilidad.

ggplot(Salinidad, aes(x = Potasio)) +
  geom_histogram(bins = 15, fill = "darkorange", color = "brown") +
  theme_bw()

Gráfica E1

Este histograma muestra la distribución del potasio en el suelo de los diferentes ambientes estudiados y las frecuencias en las que se encontraron, separándolas en 15 intervalos también. Se puede observar que la mayor concentración de datos se encuentra en el tercero y octavo intervalo. También hay algunos valores mayores a 1000 que están más dispersos y se encuentran en menor frecuencia.

ggplot(data= Salinidad,aes(x=Potasio)) + geom_density(fill="darkorange", color = "brown")+
  labs(
    title = "Grafica de Densidad del potasio",
    x = "Potasio",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica E2

La gráfica de densidad del potasio muestra una distribución con asimetría positiva, evidenciada por una cola extendida hacia valores altos. Además, se observa la presencia de dos picos en la distribución, lo que podría indicar la variabilidad de los datos mayores, los cuales hacen que esta suba un poco. Como resultado, la asimetría positiva observada.

En conclusión, se observa que la mayoría de las variables presentan una asimetría positiva, exceptuando una asimétrica negativa y una parcialmente simétrica. Adicionalmente, los rangos de estas son bastante amplios, lo que indica una alta variabilidad en las condiciones del suelo donde se realizó la toma de datos. Esta variabilidad también pudo contribuir a la asimetría de los datos al haber valores tanto muy bajos como muy altos.

Punto 2.A - Exploración Bivariada

A continuación se realizara la exploración bivariada sobre la relación entre la biomasa y las covariables pH, Zinc y Salinidad.

Coeficiente de correlación de Pearson entre biomasa y las covariables

Se comienza obteniendo el coeficiente de Correlación de Pearson para cada uno de las variables donde se obtuvieron los siguientes resultados:

Correlación de Pearson entre Biomasa y las covariables
Variable r
pH 0.928
Salinidad -0.067
Zinc -0.781
Potasio -0.073

Tabla F1

Según los resultados obtenidos, tanto el Potasio como la salinidad mostraron un coeficiente de correlación de Pearson muy cercano a 0, lo que indica que no hay relación entre ellos y la biomasa. Por otro lado, el pH muestra una correlación positiva bastante significativa, siendo cercana a 1. Mientras que el Zinc muestra una correlación inversa un poco menos significativa que la del pH con un valor de -0.7814625, pero que, por su cercanía al -1 indica que existe una correlación entre la covariable y la respuesta Y.

Diagrama de dispersión con linea de regresión lineal correspondiente

library(patchwork)

#pH
g1 = ggplot(datos,aes(y=Biomasa,x=pH))+geom_point(col="darkblue")+theme_bw()+
  ggtitle("Correlacion de 0.92")+geom_smooth(method = "lm")

#salinidad
g2 = ggplot(datos,aes(y=Biomasa,x=Salinidad))+geom_point(col="darkblue")+theme_bw()+
  ggtitle("Correlacion de -0.066")+geom_smooth(method = "lm")

#zinc
g3 = ggplot(datos,aes(y=Biomasa,x=Zinc))+geom_point(col="darkblue")+theme_bw()+
  ggtitle("Correlacion de -0.78")+geom_smooth(method = "lm")

#potasio
g4 = ggplot(datos,aes(y=Biomasa,x=Potasio))+geom_point(col="darkblue")+theme_bw() +
  ggtitle("Correlacion de -0.073")+geom_smooth(method = "lm")

(g1+g2)/(g3+g4)

Gráfica F1

Los diagramas de dispersión con la línea de regresión lineal permiten observar más claramente lo descrito analizando los coeficientes de Pearson. En estos se ve la clara relación positiva entre el pH y Biomasa en el gráfico superior izquierdo. Además, en el gráfico inferior izquierdo nuevamente se observa la relación inversa entre el Zinc y la Biomasa. Adicionalmente, se confirma con los gráficos de la derecha cómo el Potasio y Salinidad no muestran una correlación clara con el aumento o disminución de cantidad de Biomasa. Cabe destacar que la correlación del pH es mayor a la del Zinc al estar más cerca de su valor de referencia correspondiente, que en este caso sería 1.

Modelos de Regresión Lineal Simple

lm(Biomasa~Zinc,data=datos)  
## 
## Call:
## lm(formula = Biomasa ~ Zinc, data = datos)
## 
## Coefficients:
## (Intercept)         Zinc  
##     2002.15       -51.59
lm(Biomasa~pH,data=datos)
## 
## Call:
## lm(formula = Biomasa ~ pH, data = datos)
## 
## Coefficients:
## (Intercept)           pH  
##      -780.2        404.1

Para el pH se obtuvo el modelo:

-780.2 + (pH * 404.1)

Mientras que para el Zinc se obtuvo el siguiente modelo:

2002.15 + (Zinc * -51.59)

Estos modelos de regresión lineal simple se pueden ver aplicados en la línea predictiva de la gráfica F1. Estos hacen un ajuste basado en los datos obtenidos para poder predecir la cantidad de biomasa que se obtendrá con base en los niveles de pH o Zinc dependiendo del modelo utilizado. Tener este modelo a disposición permite realizar análisis que ayuden a determinar como un pH o Zinc producirá cierta cantidad de biomasa, o por el contrario que niveles de Zinc o pH se requerirían para obtener una biomasa especifica. Cabe resaltar que se podría hacer una predicción más precisa al hacer un modelo multivariado que incluya tanto Zinc como pH.

Conclusión Punto 1

De este modo se observa con las gráficas y los coeficientes cómo la biomasa se ve principalmente afectada por el pH y el Zinc, mientras que el potasio y la salinidad no muestran una correlación clara. De este modo, si se quiere maximizar la obtención de forraje natural, se deben priorizar en primer lugar las condiciones de pH y posteriormente, las del Zinc.

Punto 2 - Moluscos

Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.

a. Realice un análisis exploratorio univariado para cada característica e interpretar. b. Realice un análisis exploratorio bivariado que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco.

#load("C:/Users/sebas/Documents/5to semestre/Bioestadistica/moluscos.RData")

load("C:/Users/mcami/OneDrive/Desktop/universidad/Semestre 2026-1/bioestad/Parcial 1/moluscos.RData")

La base de datos contiene 48 registros divididos en 3 variables. La primera variable es la concentración de agua de mar en la que se sometieron los moluscos, que son 100%, 50% y 70%, siendo esta una variable cualitativa ordinal. La segunda variable contiene el tipo de molusco, donde se encuentra el tipo A y B siendo esta una variable cualitativa nominal. Por último, la tercera variable se refiere al consumo de oxígeno por cada individuo a una concentración de agua de mar específica; esta es una variable cuantitativa continua.

Punto 2.A - Exploración Univariada

require(table1)
BD_moluscos$c_agua <- as.factor(BD_moluscos$c_agua)
table1(~.,data = BD_moluscos)
Overall
(N=48)
c_agua
50 16 (33.3%)
75 16 (33.3%)
100 16 (33.3%)
molusco
A 24 (50.0%)
B 24 (50.0%)
cons_o
Mean (SD) 9.30 (3.68)
Median [Min, Max] 9.70 [1.80, 18.8]

Tabla G1

La tabla anterior permite tener una mejor visión de los datos. Con esta se observa cómo se tomaron 16 entradas para cada concentración de agua de mar, mientras que se ve cómo la mitad de las entradas de los datos pertenecen a cada tipo de molusco, siendo 24 para cada uno. Finalmente, se observa como para la concentración de oxígeno la media y la mediana son bastante similares (9.30 y 9.70 respectivamente), lo que indica una distribución normal de los datos; adicionalmente, se observa un rango amplio en las concentraciones de oxígeno.

require(ggplot2)
ggplot(data= BD_moluscos,aes(x=cons_o)) + geom_histogram(fill = "darkgreen", color = "black")+
  labs(
    title = "Histograma de la distribución del consumo de oxígeno",
    x = "Consumo de Oxigeno",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica G1

La gráfica de la distribución del consumo de oxígeno nos permite observar cómo los datos muestran una ligera asimetría positiva con una cola hacia la derecha; sin embargo, teniendo en cuenta el análisis previo de que la moda y la mediana son similares, parece que no es un sesgo muy significativo. Además, se observa una mayor frecuencia desde aproximadamente 4 a 7 y 8 a 12; el análisis bivariado posiblemente permita observar si esto puede relacionarse al tipo de molusco o a la concentración de agua de mar. Finalmente, se observan valores extremos hacia ambos lados aproximadamente entre los rangos 1-3 y 17-19, respectivamente.

require(ggplot2)
ggplot(data= BD_moluscos,aes(x=cons_o)) + geom_density(fill="purple", color = "black")+
  labs(
    title = "Grafica de Densidad de la distribución del consumo de oxígeno",
    x = "Consumo de Oxigeno",
    y = "Frecuencia"
  )+
  theme(
    plot.title = element_text(
      hjust = 0.5,   # centra el título
      face = "bold",
      size = 14
    )
  )

Gráfica G2

La gráfica de densidad del consumo del oxígeno permite reforzar el análisis hecho previamente con el histograma. En este, la ligera asimetría positiva es más evidente. También se muestran dos picos en la frecuencia de los datos, uno alrededor del intervalo de consumo de oxígeno de 5 a 7 aproximadamente y otro aproximadamente de 9 a 12; esto va acorde con la concentración de los datos observada en el histograma e incluso da unos intervalos un poco más estrechos de los observados en esa gráfica. Finalmente, los datos extremos en esta gráfica parecen no ser atípicos, principalmente los valores bajos de consumo de oxígeno; sin embargo, esto debe comprobarse con las gráficas boxplot que se utilizarán en el análisis bivariado.

Con esto se observa cómo se tomó una amplia variedad de registros para las concentraciones de oxígeno y cómo hay ciertos rangos de mayor concentración. Con el análisis bivariado se debe verificar si esto está relacionado al tipo de molusco, la concentración de agua de mar o si es un factor influido por ambas. Finalmente, cabe mencionar que, tanto para los tres niveles de concentración de agua de mar como para los dos tipos de molusco, se tomó una cantidad equitativa de registros en cada uno, lo que parece indicar una correcta toma de datos.

Punto 2.B - Exploración Bivariada

  1. Realice un análisis exploratorio bivariado que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco.

Tabla 1 general

table1(~ cons_o | c_agua + molusco, data = BD_moluscos)
50
75
100
Overall
A
(N=8)
B
(N=8)
A
(N=8)
B
(N=8)
A
(N=8)
B
(N=8)
A
(N=24)
B
(N=24)
cons_o
Mean (SD) 12.2 (3.09) 12.3 (3.52) 7.89 (2.74) 6.10 (2.74) 9.94 (2.75) 7.41 (2.84) 10.0 (3.27) 8.61 (4.00)
Median [Min, Max] 11.1 [9.74, 18.8] 12.9 [6.38, 17.7] 7.18 [5.20, 13.2] 5.60 [1.80, 9.96] 9.30 [6.78, 14.0] 6.14 [3.68, 11.6] 9.74 [5.20, 18.8] 8.06 [1.80, 17.7]

Tabla H1

La siguiente tabla muestra que cuando el agua esta a 50% no hay diferencias relevantes entre los grupos A y B. Contrario a esto, en los grupos del 75% y 100%, el grupo A presenta un promedio mas alto, sin embargo el grupo B presenta mayor variabilidad. Con estos datos se harán unos gráficos para entender mejor que esta pasando y así hacer un breve análisis de la relación del porcentaje de agua y como afecta el consumo de O2 y si el tipo de molusco afecta los datos.

Análisis Bivariado General

library(ggplot2)

ggplot(BD_moluscos, aes(x = factor(c_agua), y = cons_o)) +
  geom_boxplot(fill = "lightblue") +
  geom_jitter(width = 0.1, alpha = 0.5) +
  labs(title = "Consumo de O2 segun concentracion de agua",
       x = "Concentracion de agua (%)",
       y = "Consumo de O2" )

Gráfica H2

El siguiente boxplot permite ver el efecto del consumo de O2 según la concentración del agua; se puede ver que hay mayor consumo de O2 cuando la concentración de agua es menor; sin embargo, el consumo de O2 no está en su punto mínimo cuando el agua tiene una concentración del 100, sino que hay menos consumo cuando la concentración del agua es del 75. Esto puede indicar que cuando la concentración de agua está en 50, hay una mayor demanda metabólica por parte del animal, lo cual hace que este consuma una cantidad mayor de O2. En cuanto a la dispersión de los datos, se puede observar que en la concentración 50 es donde más dispersión hay, o sea que en ese punto es en el que el metabolismo de los individuos varía más. A continuación se van a separar los datos por grupo de molusco, si hay alguna diferencia.

Comparación de consumo de O2 vs concentración de agua según el molusco.

ggplot(BD_moluscos, aes(x = factor(c_agua), y = cons_o, fill = molusco)) +
  geom_boxplot(position = position_dodge(0.8), alpha = 0.6) +
  geom_jitter(aes(color = molusco), width = 0.2, alpha = 0.9, show.legend = TRUE) +
  labs(title = "Consumo de O2 segun concentracion de agua y tipo de molusco",
       x = "Concentracion de agua (%)",
       y = "Consumo de O2") +
  scale_fill_brewer(palette = "Set3") +
  scale_y_continuous(breaks = seq(0,
                                  max(BD_moluscos$cons_o),
                                  by = 2)) +
  theme_minimal()

Gráfica H3

Aunque la relación consumo-concentración sigue igual que en el boxplot del gráfico H2. Se pueden hacer nuevas observaciones que confirman la información de la tabla, el molusco B en su mayoría muestra valores de consumo de O2 menor comparado al molusco A, cosa que baja bastante la linea central en el boxplot. Esto se ve claramente en la concentración de agua a 100%, pero también se puede ver que el molusco B muestra ser mas sensible a los cambios ya que el cambio del 75% al 100% es casi nulo cuando se mira el molusco A, es decir que el molusco B es el que mas estrés muestra cuando la concentración esta en 50% y el que mas baja cuando esta en 75% pero después no hay mucha diferencia cuando esta en agua al 100% .

Conclusión Punto 2

Después de analizar los datos, se observa que el consumo de O2 varia dependiendo de la concentración del agua, así como el tipo del molusco. Los valores mas altos se encontraron cuando la concentración del agua era menor y el consumo de O2 era el mayor. En cuanto a los moluscos en si, el molusco A muestra un comportamiento mas estable, dados los datos, este tiene una variabilidad menor, mostrando también un cambio menos drástico entre cambios de concentración de 75% a 50%.

Finalmente, hay algunas cosas que se tienen que tener cuenta en este análisis; es importante resaltar que el tamaño de la muestra es bastante pequeño, esto hace que los cambios se vean reflejados de manera mas exagerada, limitando la precisión de las estimaciones. Ademas, la metodología no es muy clara por lo que la interpretación es limitada; si bien es evidente que los resultados muestran una diferencia en la respuesta de estos animales frente al cambio, si los cambios de porcentaje de agua fueron inmediatos, se estaría analizando directamente la respuesta de los animales al estrés, mientras que si los cambios se hicieron en momentos separados, se estaría analizando mas que todo las adaptaciones fisiológicas de los animales.