knitr::opts_chunk$set(echo = TRUE)
Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
load("C:/Users/Usuario/Downloads/YDRAY-Salinidad.RData")
library (psych)
library (ggplot2)
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
summary (Salinidad)
## Biomasa pH Salinidad Zinc
## Min. : 369.8 Min. :3.200 Min. :24.00 Min. : 0.2105
## 1st Qu.: 654.8 1st Qu.:3.450 1st Qu.:27.00 1st Qu.:13.9852
## Median : 991.8 Median :4.450 Median :30.00 Median :19.2420
## Mean :1082.2 Mean :4.609 Mean :30.27 Mean :17.8308
## 3rd Qu.:1346.9 3rd Qu.:5.350 3rd Qu.:33.00 3rd Qu.:22.6758
## Max. :2337.3 Max. :7.450 Max. :38.00 Max. :31.2865
## Potasio
## Min. : 350.7
## 1st Qu.: 527.0
## Median : 773.3
## Mean : 797.4
## 3rd Qu.: 954.1
## Max. :1441.7
pH
##Análisis Univariado de pH (Gráfico de caja e histograma)
ggplot(data = Salinidad, aes(y = pH, x = "")) + geom_jitter(alpha = 0.4, color = "blue2") +geom_boxplot(alpha = 0.4, outlier.colour = "red", outlier.shape = 1) + labs(title="pH", x = "pH")
ggplot(Salinidad, aes(x = pH)) + geom_histogram(fill = "cornflowerblue",color = "white",bins=30) + labs(title="pH", y="Número de muestras", x="pH")
El gráfico de caja y el histograma muestran que entre las 45 muestras no se observan datos atípicos. Además, se evidencia que el pH del suelo tiende a ser ácido, siendo en su mayoría inferior a 7, con un valor promedio de 4.4.
SALINIDAD
##Análisis univariado de Salinidad (Gráfico de caja e histograma)
ggplot(data = Salinidad, aes(y = Salinidad, x = "")) + geom_jitter(alpha = 0.4, color = "blue2") + geom_boxplot(alpha = 0.4, outlier.colour = "red", outlier.shape = 1) + labs(title="Salinidad", x="Salinidad")
ggplot(Salinidad, aes(x = Salinidad)) + geom_histogram(fill = "cornflowerblue", color = "white", bins=30) + labs(title="Salinidad", Y="Número de muestras", x="Salinidad")
Los datos obtenidos y su posterior análisis y gráficas revelan que, en promedio, la concentración de salinidad es de 30 unidades. El histograma no revela una tendencia clara sobre la tendencia de la concentración de salinidad. Sin embargo, se observa un dato atípico en el diagrama de caja.
ZINC
##Análisis univariado del Zinc (Gráfico de caja e histograma)
ggplot(data = Salinidad, aes(y = Zinc, x = "")) + geom_jitter(alpha = 0.4, color = "blue2") + geom_boxplot(alpha = 0.4, outlier.colour = "red", outlier.shape = 1) + labs(title="Zinc", x="Zinc")
ggplot(Salinidad, aes(x = Zinc)) + geom_histogram(fill = "cornflowerblue", color = "white", bins=20) + labs(title="Zinc", y="Número de muestras", x="Zinc")
El análisis de datos y las gráficas indican que, en promedio, la concentración de Zinc obtenido de las muestras es de 19.24. No obstante, se evidencian datos atípicos en los cuales la presencia de Zinc es mínima, casi nula. No hay una distribución normal en la concentración pero sí una clara tendencia hacia una concentración mayor a 10.
POTASIO
##Análisis univariado de Potasio (Gráfico de caja e histograma)
ggplot(data = Salinidad, aes(y = Potasio, x = "")) + geom_jitter(alpha = 0.4, color = "blue2") + geom_boxplot(alpha = 0.4, outlier.colour = "red", outlier.shape = 1) + labs(title="Potasio", x="Potasio")
ggplot(Salinidad, aes(x = Potasio)) + geom_histogram(fill = "cornflowerblue", color = "white", bins=20) + labs(title="Potasio", y="Número muestras", x="Potasio")
El análisis de datos y las gráficas indican que, en promedio, la concentración de potasio es de 773.3 unidades. Aunque parece haber un dato atípico, su valor no excede por mucho el rango. El histograma por su parte, no muestra una tendencia clara sobre la concentración de potasio, sus datos son muy dispersos
## Biomasa vs Salinidad
ggplot(Salinidad, aes(y=Biomasa, x=Salinidad)) + theme_bw() + geom_point(aes(color = Salinidad), alpha=1) + geom_smooth(method = "lm") + scale_color_gradientn(colors = c("#00AFBB", "#E7B800", "#FC4E07")) + labs(title = "Biomasa vs. Salinidad", y="Biomasa", x="Salinidad")
## `geom_smooth()` using formula 'y ~ x'
##Biomasa vs pH
ggplot(Salinidad, aes(y=Biomasa, x=pH)) + theme_bw() + geom_point(aes(color = pH), alpha=1) + geom_smooth(method = "lm") + scale_color_gradientn(colors = c("#00AFBB", "#E7B800", "#FC4E07")) + labs(title = "Biomasa vs. pH", y="Biomasa", x="pH")
## `geom_smooth()` using formula 'y ~ x'
##Biomasa vs Zinc
ggplot(Salinidad, aes(y=Biomasa, x=Zinc)) + theme_bw()+ geom_point(aes(color = Zinc), alpha=1)+ geom_smooth(method = "lm") + scale_color_gradientn(colors = c("#00AFBB", "#E7B800", "#FC4E07")) + labs(title = "Biomasa vs. Zinc", y="Biomasa", x="Zinc")
## `geom_smooth()` using formula 'y ~ x'
##Biomasa vs Potasio
ggplot(Salinidad, aes(y=Biomasa, x=Potasio)) + theme_bw()+ geom_point(aes(color = Potasio), alpha=1)+ geom_smooth(method = "lm") + scale_color_gradientn(colors = c("#00AFBB", "#E7B800", "#FC4E07")) +labs(title = "Biomasa vs. Potasio", y="Biomasa", x="Potasio")
## `geom_smooth()` using formula 'y ~ x'
El análisis obtenido obtenido del estudio bivariado entre la biomasa y los diferentes factores (salinidad, pH, Zinc y Potasio) revela que el pH y el Zinc, son los factores que mayor afectan la biomasa, puesto que un aumento o disminución en sus valores tienen un efecto más drástico. Por su parte, el análisis revela que un pH menos ácido favorece el aumento de la Biomasa. Por el contrario, a mayor concentración de Zinc, la Biomasa se reduce.
La concentración promedio de Zinc es de 19.24 y el valor de pH es de 4.45. En principio, estos valores permiten una cantidad de Biomasa relativamente igual. Sin embargo, el análisis revela que las concentraciones de Zinc tienen en esencia un efecto mayor sobre la Biomasa, ya que la gráfica revela que las cantidades de ésta última varía más ante las concentraciones de Zinc que por el valor del pH.
Aunque la Salinidad y el Potasio, generan de igual forma una variación en las cantidades de Biomasa, éstas no la reducen o incrementan al punto que lo hacen el pH y el Zinc. Por lo tanto, si bien se observa que tienen influencia sobre la misma, no lo hacen al grado del Zinc y del Potasio.
Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.
load ("C:/Users/Usuario/Downloads/YDRAY-moluscos.RData")
require(ggplot2)
##Realice un análisis exploratorio univariado para cada característica e interpretar.
##(histograma y diagrama de caja)
ggplot(BD_moluscos,aes(x=cons_o))+geom_histogram()+labs(x="O2",y="Número de muestras")+ggtitle("Consumo de oxigeno con relacion a la [H2O]")+facet_grid(~c_agua)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
ggplot(BD_moluscos,aes(y=cons_o))+geom_boxplot()+labs(y="O2")+ggtitle("Consumo de oxigeno con relacion a la [H2O]")+facet_grid(~c_agua)
El histograma y el diagrama de caja indican que el consumo de oxígeno es mayor cuando la Concentración de agua de mar (H2O mar) es de 50. Seguida por la concentración de 100 y por último de 75. Esto puede deberse a características propias de la especie de molusco en cada estudio.
##Realice un análisis exploratorio bivariado que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco
BD_moluscos$c_agua=as.factor(BD_moluscos$c_agua)
g1<-ggplot(BD_moluscos, aes (y=cons_o, x=c_agua, fill= c_agua))
g2<-g1+geom_boxplot()+xlab("H2O de mar")+ylab("consumo de oxígeno")+ ggtitle("Análisis exploratorio bivariado")+facet_grid(~molusco)
g2
El análisis exploratorio bivariado, indica en principio, que bajo una concentración de 50, el consumo de oxígeno es mayor bien sea en la especie A como en la B. De igual forma, bajo una concentración de agua de mar de 100, el consumo de oxígeno es mejor a las de 50 pero mayor a la de 75.
No obstante, se observan diferencias entre especies. Cuando la concentración de agua de mar es de 50, el consumo de oxígeno de la especie B es en promedio mayor a la de la especie A, no obstante, el consumo de la primera varía más respecto a la segunda.
Por su parte, El consumo promedio de oxígeno ante una concentración de agua de mar de 100, es mayor en la especie A que en la B. Igualmente, ante una concentración promedio de agua de mar de 75, la espceie A consume en promedio más oxígeno.
Estas diferencias en el consumo de oxígeno puede deberse a la fisiología misma de cada especie.