Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
la base de datos está compuesta por 45 observaciones y 5 variables, la variable Biomasa está registrada como numérica, al igual que pH, Zinc y Potasio, mientras que la variable Salinidad aparece como entera.
## 'data.frame': 45 obs. of 5 variables:
## $ Biomasa : num 765 954 828 755 896 ...
## $ pH : num 5 4.7 4.2 4.4 5.55 5.5 4.25 4.45 4.75 4.6 ...
## $ Salinidad: int 33 35 32 30 33 33 36 30 38 30 ...
## $ Zinc : num 16.5 14 15.3 17.3 22.3 ...
## $ Potasio : num 1442 1299 1154 1045 522 ...
Se realiza un resumen estadístico con el fin de obtener una descripción general de la variable analizada,con este procedimiento permite identificar medidas de tendencia central como la media y la mediana, así como valores mínimos, máximos y cuartiles, proporcionando una visión inicial del comportamiento y rango de los datos.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 369.8 654.8 991.8 1082.2 1346.9 2337.3
La biomasa varía entre 369.8 y 2337.3 gramos, mostrando alta dispersión, la media (1346.9) es mayor que la mediana (1082.2), lo que indica posible asimetría positiva y presencia de valores altos que elevan el promedio.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.200 3.450 4.450 4.609 5.350 7.450
El pH del suelo varía entre 3.2 y 7.45, indicando que las muestras incluyen suelos desde ácidos hasta cercanos a neutros, la media (4.61) y la mediana (4.45) son relativamente cercanas, lo que sugiere una distribución aproximadamente simétrica
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 24.00 27.00 30.00 30.27 33.00 38.00
La salinidad presenta valores entre 24 y 38 unidades, con una media de 30.27 y una mediana de 30, lo que indica una distribución bastante simétrica.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.2105 13.9852 19.2420 17.8308 22.6758 31.2865
Los niveles de zinc oscilan entre 0.21 y 31.29, mostrando una alta variabilidad, La media (17.83) es ligeramente superior a la mediana (19.42), lo que podría indicar una leve asimetría en la distribución.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 350.7 527.0 773.3 797.4 954.1 1441.7
El potasio oscila entre 350.7 y 1441.7, la media (954.1) es mayor que la mediana (797.4), lo que indica posible asimetría positiva y dispersión considerable.
## Biomasa pH Salinidad Zinc Potasio
## 546.287433 1.254731 3.719726 8.274169 297.576022
La biomasa presenta una desviación estándar de 546.29, lo que indica alta variabilidad y una dispersión considerable respecto a la media.
El pH tiene una desviación estándar de 1.25, mostrando baja variabilidad y valores relativamente cercanos al promedio.
La salinidad presenta una desviación estándar de 3.72, lo que indica una dispersión moderada en los datos.
El zinc muestra una desviación estándar de 8.27, reflejando una variabilidad considerable en sus concentraciones.
El potasio presenta una desviación estándar de 297.58, evidenciando una alta dispersión en comparación con otras variables.
## Cargando paquete requerido: ggplot2
ggplot(Salinidad, aes(x=Biomasa))+geom_histogram(bins = 10, fill= "skyblue",color="black")+labs(title = "Histograma Biomasa",x="Biomasa (g)",y="Frecuencia")+theme_minimal()La mayor frecuencia de observaciones se concentra aproximadamente entre 600 y 1400 g, lo que indica que la mayoría de las muestras presentan niveles intermedios de producción, en general, se observa una variabilidad considerable, lo que refleja heterogeneidad las muestras estudiadas.
ggplot(Salinidad, aes(x=pH))+geom_histogram(bins = 10, fill= "skyblue",color="black")+labs(title = "Histograma pH",x="pH",y="Frecuencia")+theme_minimal()El histograma del pH muestra que la mayoría de las muestras se concentran entre valores de 3 y 5.5, indicando predominancia de suelos ácidos. Se observa una ligera asimetría positiva debido a algunos valores más altos (cercanos a 7–7.5), que podrían corresponder a condiciones menos ácidas o cercanas a neutras.
ggplot(Salinidad, aes(x=Salinidad))+geom_histogram(bins = 10, fill= "skyblue",color="black")+labs(title = "Histograma Salinidad",x="Salinidad",y="Frecuencia")+theme_minimal()La salinidad muestra una distribución bastante uniforme alrededor de valores cercanos a 30, sin evidencia clara de asimetría marcada. La mayoría de los datos se concentran en un rango estrecho, lo que indica variabilidad moderada.
ggplot(Salinidad, aes(x=Zinc))+geom_histogram(bins = 10, fill= "skyblue",color="black")+labs(title = "Histograma Zinc",x="Zinc",y="Frecuencia")+theme_minimal()El zinc presenta una distribución con posible asimetría negativa leve, debido a algunos valores bajos cercanos a cero. La mayor concentración de observaciones se encuentra en valores intermedios, evidenciando dispersión considerable en las concentraciones.
ggplot(Salinidad, aes(x=Potasio))+geom_histogram(bins = 10, fill= "skyblue",color="black")+labs(title = "Histograma Potasio",x="Potasio",y="Frecuencia")+theme_minimal()El histograma del potasio muestra una distribución amplia, con la mayor concentración de valores en rangos intermedios y algunos valores elevados que extienden la cola hacia la derecha, lo que sugiere ligera asimetría positiva.
En conclusion, los histogramas muestran que la biomasa y el pH presentan distribuciones relativamente simétricas y con una tendencia clara en sus valores centrales, mientras que las variables como el potasio y el zinc evidencian mayor dispersión y ligera asimetría, indicando heterogeneidad en la disponibilidad de nutrientes en el suelo y la salinidad presenta variabilidad intermedia, sin una forma perfectamente simétrica, con esto se puede decir que histogramas permiten identificar diferencias en la distribución y variabilidad de las variables, lo cual es relevante para comprender su posible influencia sobre la producción de biomasa.
ggplot(Salinidad, aes(y = Biomasa)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplot de Biomasa",
y = "Biomasa (g)") +
theme_minimal()La mediana se ubica aproximadamente en 1000 g, lo que indica que la mitad de las muestras tienen valores por encima y por debajo de ese punto,al serla caja amplia, refleja una dispersión considerable en el 50% central de los datos.
ggplot(Salinidad, aes(y = pH)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplot de pH",
y = "pH") +
theme_minimal()El boxplot de pH muestra una mediana cercana a 4.5, indicando predominancia de condiciones ácidas en las muestras analizadas. El 50% central de los datos presenta una amplitud moderada, lo que sugiere variabilidad controlada en esta variable.
ggplot(Salinidad, aes(y = Salinidad)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplot de Salinidad",
y = "Salinidad") +
theme_minimal()La mediana se encuentra alrededor de 30 y su dispersión es moderada y la distribución parece bastante equilibrada, ademas los bigotes tienen longitudes similares, lo que indica ausencia de asimetría marcada y no se observan valores extremos.
ggplot(Salinidad, aes(y = Zinc)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplot de Zinc",
y = "Zinc") +
theme_minimal()Se evidencia una mediana cercana a 19–20 y una dispersión considerable en el 50% central de los datos y se identifica un valor atípico bajo, lo que indica la presencia de una muestra con concentración significativamente inferior al resto.
ggplot(Salinidad, aes(y = Potasio)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplot de Potasio",
y = "Potasio") +
theme_minimal()Presenta una mediana cercana a 800–900 y una amplitud considerable en el 50% central de los datos, evidenciando alta variabilidad en las concentraciones y una ligera asimetría positiva sugiere la presencia de valores elevados que amplían el rango superior.
Con estos boxplots se evidencian diferencias en la variabilidad y dispersión de las variables y se observa que la biomasa y el pH presentan una distribución relativamente estable, con medianas bien definidas y menor presencia de valores atípicos, a diferencia de el potasio y el zinc que muestran mayor amplitud intercuartílica, indicando una mayor heterogeneidad en la disponibilidad de estos nutrientes y a la salinidad presenta una variabilidad intermedia
ggplot(Salinidad, aes(x = pH, y = Biomasa)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal()## `geom_smooth()` using formula = 'y ~ x'
Se observa una relación positiva muy fuerte y lineal, ya que los puntos siguen claramente una tendencia ascendente y están bastante cerca de la recta de regresión, lo que indica que a medida que aumenta el pH, la biomasa también aumenta de manera consistente.
ggplot(Salinidad, aes(x = Salinidad, y = Biomasa)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal()## `geom_smooth()` using formula = 'y ~ x'
Los puntos no muestra una tendencia clara, ya que la línea de regresión es casi horizontal, con una leve pendiente negativa. Esto indica que la relación entre salinidad y biomasa es muy débil o prácticamente inexistente
ggplot(Salinidad, aes(x = Zinc, y = Biomasa)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal()## `geom_smooth()` using formula = 'y ~ x'
Se observa una relación negativa fuerte y lineal, la recta de regresión desciende, lo que está indicando que a medida que aumenta la concentración de zinc, la biomasa disminuye.
BIOMASA vs Potasio
ggplot(Salinidad, aes(x = Potasio, y = Biomasa)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal()## `geom_smooth()` using formula = 'y ~ x'
Se observa una relación negativa muy débil, evidenciada por la pendiente ligeramente descendente de la recta de regresión y la amplia dispersión de los puntos indica baja asociación lineal entre ambas variables.
el pH fue el factor que mostró la relación más fuerte y positiva con la biomasa, evidenciando una asociación lineal clara y consistente, mientras que la salinidad y el potasio no presentaron relaciones significativas, ya que los gráficos de dispersión mostraron alta dispersión y pendientes cercanas a cero. Por su parte, el zinc evidenció una relación negativa con la biomasa, indicando que concentraciones más altas podrían asociarse con menor producción.
Relación positiva muy fuerte, ya que cuando aumenta el pH, aumenta la biomasa.
Relación muy débil, ya que prácticamente no hay asociación lineal con biomasa.
Relación negativa fuerte, porque cuando aumenta el zinc, la biomasa tiende a disminuir.
Relación negativa y muy débil, indicando que no existe una asociación lineal significativa entre ambas variables.
El análisis de correlación mostró que el pH presentó una asociación positiva muy fuerte con la biomasa, lo que indica que esta variable es el principal factor relacionado con la producción vegetal,por otro lado el zinc evidenció una correlación negativa fuerte, sugiriendo que concentraciones elevadas podrían estar asociadas con menor biomasa y la salinidad y el potasio, no mostraron relaciones significativas, ya que sus coeficientes fueron cercanos a cero, con estos resultados se puede decir que el pH es la variable con mayor influencia sobre la biomasa, mientras que las demás variables presentan efectos débiles.
El análisis descriptivo evidenció diferencias en la dispersión de las variables ambientales evaluadas, la biomasa y el pH presentaron distribuciones relativamente consistentes, mientras que zinc y potasio mostraron mayor variabilidad y heterogeneidad en sus concentraciones, con el análisis bivariado mediante gráficos de dispersión y coeficientes de correlación, indicó que el pH mantiene una asociación lineal positiva muy fuerte con la biomasa, sugiriendo un efecto determinante sobre la producción vegetal, mientras que el zinc presentó una correlación negativa fuerte, lo que podría indicar un efecto limitante o potencialmente adverso a concentraciones elevadas, sin embargo la salinidad y el potasio no mostraron asociaciones lineales significativas, indicando baja capacidad explicativa respecto a la variación de la biomasa, estos resultados sugieren que el pH constituye el principal factor ambiental asociado a la productividad del sistema, mientras que los demás factores presentan influencia limitada dentro del rango observado.
Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.
Nombres de las columnas
## [1] "c_agua" "molusco" "cons_o"
Estructura
## tibble [48 × 3] (S3: tbl_df/tbl/data.frame)
## $ c_agua : num [1:48] 100 100 100 100 100 100 100 100 100 100 ...
## $ molusco: chr [1:48] "A" "A" "A" "A" ...
## $ cons_o : num [1:48] 7.16 8.26 6.78 14 13.6 11.1 8.93 9.66 6.14 6.14 ...
Modificación a factores
Confirmación
## tibble [48 × 3] (S3: tbl_df/tbl/data.frame)
## $ c_agua : num [1:48] 100 100 100 100 100 100 100 100 100 100 ...
## $ molusco: Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 2 2 ...
## $ cons_o : num [1:48] 7.16 8.26 6.78 14 13.6 11.1 8.93 9.66 6.14 6.14 ...
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.800 6.312 9.700 9.305 11.232 18.800
## [1] 3.682652
El histograma muestra una distribución aproximadamente simétrica, con mayor concentración de valores entre 6 y 12 unidades, no hay asimetría marcada, aunque hay algunos valores altos cercanos a 18–19 que amplían la dispersión, el consumo de oxígeno presenta una distribución relativamente normal con variabilidad moderada.
La mediana se encuentra cerca de 10, coherente con los estadísticos descriptivos, el 50% central de los datos se ubica aproximadamente entre 6 y 11 unidades y se observa un posible valor atípico superior cercano a 18, lo que indica la presencia de un individuo con consumo considerablemente alto respecto al resto.
Las categorías A y B presentan la misma frecuencia, lo que indica un diseño balanceado del experimento.
##
## 50 75 100
## 16 16 16
Las tres concentraciones (50, 75 y 100) presentan frecuencias similares, lo que indica una distribución homogénea de las muestras entre tratamientos, esto sugiere un diseño experimental equilibrado para evaluar el efecto de la concentración sobre el consumo de oxígeno.
Las tres concentraciones (50, 75 y 100) presentan frecuencias similares, lo que indica una distribución homogénea de las muestras entre tratamientos.
El análisis univariado del consumo de oxígeno mostró una distribución aproximadamente simétrica, con una media de 9.30 y una mediana de 9.70, lo que indica ausencia de asimetría marcada, los valores oscilaron entre 1.8 y 18.8, evidenciando variabilidad moderada y presencia de un posible valor atípico superior, las variables categóricas, tipo de molusco y concentración de agua de mar, presentaron frecuencias equilibradas entre sus niveles, lo que sugiere un diseño experimental balanceado y adecuado para realizar comparaciones, en resumen el análisis descriptivo permite concluir que los datos presentan una estructura adecuada para proceder con el análisis bivariado e inferencial.
## Warning: Orientation is not uniquely specified when both the x and y aesthetics are
## continuous. Picking default orientation 'x'.
## Warning: Continuous x aesthetic
## ℹ did you forget `aes(group = ...)`?
Hay diferencias en el consumo de oxígeno según la concentración de agua de mar, ya que la concentración del 75% presentó la mediana más baja de consumo, mientras que el 50% mostró valores superiores incluso al 100%, este patrón sugiere que la respuesta metabólica no sigue una tendencia lineal con la disminución de salinidad, indicando una posible respuesta fisiológica diferencial ante los niveles intermedios de concentración.
El molusco A presenta una mediana de consumo de oxígeno superior a la del molusco B, sugiriendo diferencias en la tasa metabólica entre ambos tipos.
## Warning: Orientation is not uniquely specified when both the x and y aesthetics are
## continuous. Picking default orientation 'x'.
El análisis conjunto mostró que el efecto de la concentración sobre el consumo de oxígeno no es uniforme entre los tipos de molusco, aunque ambos presentan una disminución marcada en la concentración del 75%, las diferencias entre A y B varían según el nivel de concentración, sugiriendo la presencia de una posible interacción entre los factores, esto indica que la respuesta metabólica depende simultáneamente del tipo de molusco y del nivel de salinidad.
## Df Sum Sq Mean Sq F value Pr(>F)
## molusco 1 23.2 23.23 2.055 0.1588
## c_agua 1 102.5 102.50 9.068 0.0043 **
## molusco:c_agua 1 14.4 14.38 1.272 0.2655
## Residuals 44 497.3 11.30
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El análisis de varianza de dos vías mostró que la concentración de agua de mar tiene un efecto significativo sobre el consumo de oxígeno, indicando que la salinidad influye directamente en la actividad metabólica de los moluscos, por otro lado, no se encontraron diferencias significativas entre los tipos de molusco ni evidencia de interacción entre tipo y concentración, con estos resultados se sugiere que ambos moluscos responden de manera similar a las variaciones en la concentración de agua, y que la salinidad constituye el principal factor determinante del consumo de oxígeno en el experimento.
El análisis del consumo de oxígeno en moluscos sometidos a diferentes concentraciones de agua de mar evidenció que la salinidad constituye el principal factor que influye en la actividad metabólica, el análisis de varianza de dos vías mostró un efecto significativo de la concentración sobre el consumo de oxígeno, indicando que las variaciones en salinidad generan cambios en la tasa metabólica de los organismos, sin embargo, no se encontraron diferencias significativas entre los tipos de molusco ni interacción entre tipo y concentración, lo que sugiere que ambos responden de manera similar a los cambios en las condiciones del medio, los resultados indican que la regulación metabólica en estos moluscos está determinada principalmente por la concentración de agua de mar.