Punto 1—- Análisis exploratorio univariado para las características del suelo

summary.data.frame(Salinidad)
##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7
Salinidad$Biomasa
##  [1]  765.280  954.017  827.686  755.072  896.176 1422.836  821.069 1008.804
##  [9] 1306.494 1039.637 1193.223  777.474  818.127 1203.568  977.515  369.823
## [17]  509.872  448.315  615.091  545.538  436.552  465.907  664.601  502.466
## [25]  496.797 2270.294 2332.220 2162.531 2222.588 2337.326 1349.192 1058.976
## [33] 1408.206 1491.276 1254.872 1152.341  568.455  612.447  654.825  991.829
## [41] 1895.942 1346.880 1482.793 1145.643 1137.193
sd(Salinidad$Biomasa)
## [1] 546.2874
sd(Salinidad$pH)
## [1] 1.254731
sd(Salinidad$Salinidad)
## [1] 3.719726
sd(Salinidad$Zinc)
## [1] 8.274169
sd(Salinidad$Potasio)
## [1] 297.576
ggplot(data = Salinidad,aes(x=Salinidad))+geom_histogram(col= "blue")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = Salinidad,aes(y=Salinidad))+geom_boxplot(col= "blue")

En base a los datos podemos decir que:

La salinidad: posee una media de 30.27, un mínimo de 24 y un máximo de 38, datos que nos indican suelos con una concentración salina alta, que lleva a la perdida de fertilidad y perjudica los cultivos (biomasa).

ggplot(data = Salinidad,aes(x=Biomasa))+geom_histogram(col= "green")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = Salinidad,aes(y=Biomasa))+geom_boxplot(col= "green")

La biomasa: presenta en promedio 1082 gramos, con una desviación estándar de 546 gr. Por su parte el dato máximo fue 2337.3 gr, lo que indica que esta fue la mayor biomasa que las caracteristcas del suelo permitieron producir.

ggplot(data = Salinidad,aes(x=pH))+geom_histogram(col= "yellow")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = Salinidad,aes(y=pH))+geom_boxplot(col= "yellow")

El pH: es una medición de que tan ácido o alcalino está el suelo, según estos datos la media fue de 4.6, lo que sugiere que se encuentra entre un pH ácido y un punto neutro; presenta una desviación estándar de 1.25, que indica que puede variar drásticamente. Detallando los extremos podemos resaltar que el pH mínimo fue de 3.2 que indica un suelo bastante ácido y deteriorado, poco óptimo para la producción de biomasa.

ggplot(data = Salinidad,aes(x=Zinc))+geom_histogram(col= "orange")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = Salinidad,aes(y=Zinc))+geom_boxplot(col= "orange")

Concentración de Zinc: en promedio se encontraron suelos con un 17.83 de concentración en suelo, con una desviación de 8.2 que puede generar gran variación en los datos, su mínimo es 0.21, una concentración basstante baja lo cual no permitirá una buena producción de biomasa; mientras que su máximo es 31.3 que es una concentración mucho más alta y óptima. Esta característa está ligada al pH, entre más ácido el suelo menos concentración de Zinc habrá disponible.

ggplot(data = Salinidad,aes(x=Potasio))+geom_histogram(col= "red")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = Salinidad,aes(y=Potasio))+geom_boxplot(col= "red")

Concentración de Potasio: La media es 797.4, con un máximo de 1442 y un mínimo de 352, su desviación es de 297.8. Sin embargo, esta concentración no tendrá repercusión alguna en la producción de biomasa pues para esto se requiere de factores biologicos para su absorción y aprovechamiento, que lleve a generar cambios significativos en esta.

–Análisis exploratorio Bivariado: Relación entre la biomasa y las covariables pH, Salinidad y Zinc (determine cuales variables son las que presentan mayor relación con la biomasa).

ggplot(data = Salinidad,aes(y=Biomasa,x=pH,))+geom_point()+theme_bw()+xlab("pH")+ylab("Biomasa")+geom_smooth()+ ggtitle ("Producción de biomasa de acuerdo al pH")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Podemos observar que existe una relación entre la acidez del suelo y la disminución de la biomasa presente, es decir, entre más tienda el pH hacia ph de 3, 4 o 5 menor será la producción de Biomasa; mientras entre más tienda a neutro incrementa dicha producción.

ggplot(data = Salinidad,aes(y=Biomasa,x=Salinidad,))+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

El gráfico indica que entre el suelo sea menos salino, la producción de biomasa se incrementará, lo que confirma lo dicho anteriormente.

ggplot(data = Salinidad,aes(y=Biomasa,x=Zinc,))+geom_point()+theme_bw()+xlab("Zinc")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Pese a que entre mayor Zinc mayor Pn de biomasa en este caso observamos una gráfica en donde a mayor concentracion de Zinc menor es la biomasa producida, esto puede deberse a que existen otros factores y procesos biológicos y antropicos incidiendo en la actividad natural del zinc.

Punto 2 –— Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.

knitr::opts_chunk$set(echo = TRUE)
load("~/2021-II/Bioestadistica/YDRAY-moluscos.RData", verbose = TRUE)
## Loading objects:
##   BD_moluscos
attach(BD_moluscos)
require(faraway)
require(ggplot2)

BD_moluscos
## # A tibble: 48 x 3
##    c_agua molusco cons_o
##     <dbl> <chr>    <dbl>
##  1    100 A         7.16
##  2    100 A         8.26
##  3    100 A         6.78
##  4    100 A        14   
##  5    100 A        13.6 
##  6    100 A        11.1 
##  7    100 A         8.93
##  8    100 A         9.66
##  9    100 B         6.14
## 10    100 B         6.14
## # ... with 38 more rows
BD_moluscos$c_agua
##  [1] 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100  75  75  75
## [20]  75  75  75  75  75  75  75  75  75  75  75  75  75  50  50  50  50  50  50
## [39]  50  50  50  50  50  50  50  50  50  50
summary.data.frame(BD_moluscos)
##      c_agua      molusco              cons_o      
##  Min.   : 50   Length:48          Min.   : 1.800  
##  1st Qu.: 50   Class :character   1st Qu.: 6.312  
##  Median : 75   Mode  :character   Median : 9.700  
##  Mean   : 75                      Mean   : 9.305  
##  3rd Qu.:100                      3rd Qu.:11.232  
##  Max.   :100                      Max.   :18.800
sd(BD_moluscos$c_agua)
## [1] 20.62842
sd(BD_moluscos$cons_o)
## [1] 3.682652
ggplot(data = BD_moluscos,aes(x=cons_o))+geom_boxplot()+ggtitle("Consumo de Oxigeno")+xlab("Consumo de Oxigeno")

ggplot(data = BD_moluscos,aes(x=c_agua))+geom_histogram()+xlab("Concentración de agua de mar")+ylab("Frecuencia")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(data = BD_moluscos,aes(y=cons_o,x=c_agua,colour=molusco))+geom_point()+theme_bw()+xlab("Concentración de agua de mar")+ylab("Consumo de oxigeno")+facet_grid(~molusco)+ggtitle("Consumo de Oxigeno vs Concentración agua marina")

Análisis de los datos:

  1. En general el consumo de oxígeno presenta un promedio de 9.3 con una desviaciín de 3.6, se observa la existencia de un dato atípico de 18.8 de consumo por parte de un individuo de la especie A. La distribución de los datos muestra un sesgo positivo,es decir, el 75% de los datos se encuentran ubicados por debajo del promedio.

  2. En la gráfica que relaciona el consumo de oxigeno con la concentración de agua marina para ambas especies de moluscos, podemos observar una ventaja por parte de la especie A que tiene mayor adaptabilidad para extraer el oxigeno del agua salada, mientras que en la especie B notamos una disminución de los niveles de oxigeno consumidos.