Punto 1 - Datos Salinidad

a. Análisis exploratorio univariado para cada característica e interpretar.

summary(Salinidad)
##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7
require(ggplot2)

hist(Salinidad$Biomasa,col= "pink",main = "Biomasa")

boxplot(Salinidad$Biomasa,col= "pink",main = "Biomasa")

hist(Salinidad$Salinidad,col= "blue",main = "Salinidad")

boxplot(Salinidad$Salinidad,col= "blue",main = "Salinidad")

hist(Salinidad$Zinc,col= "green",main = "Zinc")

boxplot(Salinidad$Zinc,col= "green",main = "Zinc")

hist(Salinidad$Potasio,col= "yellow",main = "Potasio")

boxplot(Salinidad$Potasio,col= "yellow",main = "Potasio")

ggplot(data=Salinidad,aes(x=pH))+geom_histogram()+theme_bw()+xlab("pH")+ylab("Cantidad")+ggtitle("Frecuencia de pH")

INTERPRETACIÓN GRÁFICAS

  • Gráfica frecuencia Biomasa: En la gráfica se observa que los valores de biomasa con más frecuencia son los de 500-1000, seguido de los valores de 1000-15000. Por último el valor de biomasa con menos frecuencia es 1500-2000.

En la gráfica de cajas se observa que la mediana de los datos es 1000 para Biomasa.

  • Gráfica frecuencia Salinidad: En la gráfica se observa que los valores de salinidad con más frecuencia son los de 28-30, seguido de los valores de 24-26. Por último el valor de salinidad con menos frecuencia es 36-38.

En la gráfica de cajas se observa que la mediana de los datos es 30 para Salinidad.

  • Gráfica frecuencia Zinc: En la gráfica se observa que los valores de Zinc con más frecuencia son los de 15-25, seguido de los valores de 10-15. Por último el valor de Zinc con menos frecuencia es 5-10.

En la gráfica de cajas se observa que la mediana de los datos aproximadamente es de 20 para Zinc.

  • Gráfica frecuencia Potasio: En la gráfica se observa que los valores de Potasio con más frecuencia son los de 400-600, seguido de los valores de 800-1000. Por último el valor de Potasio con menos frecuencia es 200-400 y 1400-1600.

En la gráfica de cajas se observa que la mediana de los datos es aproximado a 800 para Potasio.

  • Gráfica frecuencia pH: En la gráfica se observa que los valores de pH con más frecuencia son los de 3.2, seguido de los valores de 5.6. Por último el valor de pH con menos frecuencia es 7, con una media de 4.6.

b. Análisis exploratorio bivariado para cada característica

require(ggplot2)

ggplot(data = Salinidad,aes(x=pH))+geom_histogram()

ggplot(data = Salinidad,aes(y=Biomasa,x=pH))+geom_point()+theme_bw()+xlab("pH")+ylab("Biomasa")+geom_smooth()

ggplot(data = Salinidad,aes(x=Salinidad))+geom_histogram()

ggplot(data = Salinidad,aes(y=Biomasa,x=Salinidad))+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+geom_smooth()

ggplot(data = Salinidad,aes(x=Zinc))+geom_histogram()

ggplot(data = Salinidad,aes(y=Biomasa,x=Zinc))+geom_point()+theme_bw()+xlab("Zinc")+ylab("Biomasa")+geom_smooth()

  • Gráfica Biomasa vs pH: En la gráfica se observa una distribución lineal entre las variables pH y la producción de biomasa, en donde se puede iterpretar que mientras mayor es el valor del pH en el suelo mayor sera también la producción de Biomasa, por lo tanto el pH puede ser considerado como una variable que esta muy relacionada con la producción de Biomasa.

  • Gráfica Biomasa vs Salinidad: En la gráfica se observa una distribución más dispersa entre las variables Salinidad y la producción de biomasa, en donde se puede iterpretar que la salinidad NO es una variable estrechamente relacionada con la producción de Biomasa.

  • Gráfica Biomasa vs Zinc: En la gráfica se observa una distribución casi lineal negativa entre las variables Zinc y la producción de biomasa, en donde se puede iterpretar que a menor concentración de Zinc hay más producción de Biomasa, sin embargo la gráfica no es lo suficientemente clara como para determinar que el Zinc es una variable estrechamente relacionada con la producción de Biomasa.

Punto 2 - Datos Moluscos

a. ANÁLISIS EXPLORATORIO UNIVARIADO

summary(BD_moluscos)
##      c_agua      molusco              cons_o      
##  Min.   : 50   Length:48          Min.   : 1.800  
##  1st Qu.: 50   Class :character   1st Qu.: 6.312  
##  Median : 75   Mode  :character   Median : 9.700  
##  Mean   : 75                      Mean   : 9.305  
##  3rd Qu.:100                      3rd Qu.:11.232  
##  Max.   :100                      Max.   :18.800
hist(BD_moluscos$cons_o,col= "gray")

boxplot(BD_moluscos$cons_o,col= "green", main="Consumo de O")

Interpretación Summary: en la tabla los datos más relevantes son los de el consumo de Oxígeno donde el promedio de consumo es de 9.3, con un mínimo de consumo de 1.8 y un máximo de 18.8 (por unidad de peso seco del molusco)

Boxplot al igual que en la tabla en el boxplot del consumo de Oxígeno se aprecia el promedio de consumo de 9.3.

b. ANÁLISIS EXPLORATORIO BIVARIADO

tapply(BD_moluscos$cons_o, BD_moluscos$c_agua, mean,na.rm= TRUE)
##       50       75      100 
## 12.25062  6.99250  8.67125
tapply(BD_moluscos$cons_o, BD_moluscos$molusco, mean,na.rm= TRUE)
##         A         B 
## 10.000417  8.609167

En el tapply se observa que el promedio del consumo de oxígeno en función a la concentración de Agua de mar al 50% es de 12.25, concentración al 75 con un promedio de 6.9 y finalmente para la concentración al 100 es de 8.6.

Por otro lado en el tapply también se aprecia el promedio del consumo de oxígeno en función al tipo de molusco; para el tipo de molusco A el promedio de consumo es de 10 y para el tipo de molusco B el promedio de consumo es de 8.6.

boxplot(BD_moluscos$cons_o~BD_moluscos$c_agua,col="red",xlab = "Concentracón de agua", ylab = "Consumo de Oxígeno", main="Cajas")

boxplot(BD_moluscos$cons_o~BD_moluscos$molusco,col="red",xlab = "Tipo de Molusco", ylab = "Consumo de Oxígeno", main="Cajas")

Interpretación Boxplot:

Consumo de Oxígeno vs Concentración de Agua: en esta gráfica se aprecia como en concentración de agua de mar al 50% requeire de un consumo de Oxígeno es mayor a comparación de los otros porcentajes. Asi como también se aprecia que para la concentración de agua de mar al 75% el consumo de oxígeno es menor.

GRÁFICA: Concentración de Agua (eje y) VS Consumo de O (eje x) VS Tipo de Molusco.

require(ggplot2)
data(BD_moluscos)

g1=ggplot(data = BD_moluscos,aes(y=cons_o,x=c_agua,colour = molusco))+geom_point()+theme_bw()+xlab("Concentración de Agua")+ylab("Consumo de O")+geom_smooth()+facet_grid(~molusco)

require(plotly)
ggplotly(g1)

Al observar la gráfica se puede deducir que cuando la concentración de agua de mar es de 75 se observa que el promedio del consumo de O en los moluscos B es menor al promedio de los moluscos tipo A. También se aprecia que cuando la concentración de agua es de 50% los moluscos tipo B consumen más oxígeno que los moluscos tipo A (pero muy ligeramente).