Punto 1 - Datos salinidad

Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

Los datos se muestran a continuación:

load("C:/Users/Claudia Gallo/Desktop/Bioestadistica/Salinidad.RData")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96

Se observa que la base de datos contiene un total de 45 registros con 5 variables: Biomasa, pH, Salinidad, Zinc y Potasio.

  1. Realice un análisis exploratorio univariado para cada característica e interpretar.

Biomasa

hist(Salinidad$Biomasa,col="blue",main="Biomasa",ylab="Frecuencia",xlab="Biomasa (gr)")

summary(Salinidad$Biomasa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   369.8   654.8   991.8  1082.2  1346.9  2337.3

En primer lugar, en el histograma anterior (Biomasa) se observa la variación en la cantidad en gramos de biomasa colectada en los diferentes puntos de muestreo de la investigación, indicando que la planta forrajera en los diferentes ambientes de muestra produce diferentes cantidades de biomasa.La cantidad máxima que se pudo colectar fue de 2337.3 gr, mientras que la cantidad mínima de colecta fue de 369.8 gr. El promedio de biomasa obtenido en las muestras fue de 1082.2 gr y la mediana fue de 991.8 gr.

pH

hist(Salinidad$pH,col="green",main="pH de los suelos",ylab="Frecuencia",xlab="pH")

summary(Salinidad$pH)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.200   3.450   4.450   4.609   5.350   7.450

En segundo lugar, en el histograma anterior (pH de los suelos) se observa la variación en el pH de los suelos en los que fueron tomadas las muestras de biomasa en la investigación, indicando que los niveles de pH fluctuaron entre 3.2 y 7.45. Por otro lado se puede evidenciar que en ningún caso el nivel de pH en los suelos tuvo valores entre 6 y 7.El promedio del nivel de pH en los suelos fue de 4.609 y la mediana fue de 4.450.

Salinidad

hist(Salinidad$Salinidad,col="yellow",main="Salinidad de los suelos",ylab="Frecuencia",xlab="Salinidad")

summary(Salinidad$Salinidad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   27.00   30.00   30.27   33.00   38.00

En tercer lugar, en el histograma anterior (salinidad de los suelos) se observa la variación en la salinidad de los suelos en los que fueron tomadas las muestras de biomasa en la investgación, indicando que la salinidad fue una característica que registró valores muy diferentes con respecto de un suelo a otro. El valor de salinidad máximo obtenido fue de 38 y el valor mínimo de salinidad fue de 24. Para el promedio de salinidad en los suelos se obtuvo un valor de 30.27 y la mediana fue de 30.00.

Zinc

hist(Salinidad$Zinc,col="red",main="Zinc presente en los suelos",ylab="Frecuencia",xlab="Zinc")

summary(Salinidad$Zinc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2105 13.9852 19.2420 17.8308 22.6758 31.2865

En cuarto lugar, en el histograma anterior (Zinc presente en los suelos) se observa la variación del zinc presente en los suelos en los que fueron tomadas las muestras de biomasa en la investgación, indicando que los valores de zinc fluctuaron entre 0.2105 y 31.2865. Esta variación es significativamente grande, esto quiere decir que el zinc es un elemento que se encuentra en diferentes proporciones según las condiciones del ambiente. El promedio de zinc presente en los suelos fue de 17.8308 y para la mediana se obtuvo un valor de 19.2420.

Potasio

hist(Salinidad$Potasio,col="purple",main="Potasio presente en los suelos",ylab="Frecuencia",xlab="Potasio")

summary(Salinidad$Potasio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   350.7   527.0   773.3   797.4   954.1  1441.7

Por último, en el histograma anterior (Potasio presente en los suelos) se observa la variación del potasio presente en los suelos en los que fueron tomadas las muestras de biomasa en la investgación, indicando que los valores de potasio fueron significativamente diferentes con respecto de un suelo a otro. El valor máximo de potasio fue de 1441.7 y el valor mínimo fue de 350.7. El promedio de potasio presente en los suelos fue de 797.4 y la mediana fue de 773.3.

  1. Realice un análisis exploratorio bivariado que permita conocer cómo es la relación entre la biomasa y las covariables pH, Salinidad y Zinc (determine cuales variables son las que presentan mayor relación con la biomasa).
require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout

Biomasa vs pH

Salinidad$pH=as.numeric(Salinidad$pH)
Salinidad$Biomasa=as.numeric(Salinidad$Biomasa)
p1=ggplot(Salinidad,aes(y=Biomasa,x=pH, fill=pH))
p2=p1+geom_point()+theme_bw()+xlab("pH")+ylab("Biomasa")+ggtitle("Relación entre la biomasa y el pH de los suelos")
ggplotly(p2)
## Warning in L$marker$color[idx] <- aes2plotly(data, params, "fill")[idx]: número
## de items para para sustituir no es un múltiplo de la longitud del reemplazo

En el diagrama de puntos anterior (Relación entre la biomasa y el pH de los suelos) se puede evidenciar una relación que tiende a ser directamente proporcional en el conjunto de datos. Entre más cantidad de biomasa haya en un lugar, más básico es el nivel de pH registrado en el suelo. En ese sentido se obtuvo para el suelo donde fue colectada la cantidad más grande de biomasa (2337.326 gr) un pH alcalino o básico de 7.40, y para el suelo donde fue colectada la cantidad más pequeña de biomasa (369.823 gr) un pH ácido de 3.25. Por lo anterior se puede inferir que la planta forrajera de estudio crece mucho más y produce mucha más biomasa cuando se desarrolla en suelos básicos.

Biomasa vs Salinidad

Salinidad$Salinidad=as.numeric(Salinidad$Salinidad)
Salinidad$Biomasa=as.numeric(Salinidad$Biomasa)
s1=ggplot(Salinidad,aes(y=Biomasa,x=Salinidad, fill=Salinidad))
s2=s1+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+ggtitle("Relación entre la biomasa y la salinidad de los suelos")
ggplotly(s2)
## Warning in L$marker$color[idx] <- aes2plotly(data, params, "fill")[idx]: número
## de items para para sustituir no es un múltiplo de la longitud del reemplazo

En el diagrama de puntos anterior (relación entre la biomasa y la salinidad de los suelos) se puede inferir que no existe una relación clara entre la biomasa presente en un lugar y la salinidad del suelo de ese lugar. Así, el máximo valor de salinidad (38) se obtuvo en el suelo donde se colectó una muestra de 1306.494 gr de biomasa, y el mínimo valor de salinidad (24) se obtuvo en el suelo donde se colectó una muestra de 1895.942 gr de biomasa. Por otro lado, esta relación nula se puede evidenciar más claramente si se revisa el valor de salinidad de los suelos en donde se colectaron la cantidad máxima y la cantidad mínima de biomasa. La cantidad más grande de biomasa (2337.326 gr) se obtuvo de un suelo que presentó un valor de salinidad de 30, y la cantidad más pequeña de biomasa (369.823 gr) se obtuvo de un suelo que presentó también un valor de salinidad de 30. Esto quiere decir que los valores de salinidad de los suelos fluctúan significativamente sin depender de la cantidad de biomasa que haya en el lugar. La planta forrajera de estudio no crece ni produce más biomasa dependiendo de la salinidad del suelo.

Biomasa vs Zinc

Salinidad$Zinc=as.numeric(Salinidad$Zinc)
Salinidad$Biomasa=as.numeric(Salinidad$Biomasa)
z1=ggplot(Salinidad,aes(y=Biomasa,x=Zinc, fill=Zinc))
z2=z1+geom_point()+theme_bw()+xlab("Zinc")+ylab("Biomasa")+ggtitle("Relación entre la biomasa y el zinc presente en los suelos")
ggplotly(z2)
## Warning in L$marker$color[idx] <- aes2plotly(data, params, "fill")[idx]: número
## de items para para sustituir no es un múltiplo de la longitud del reemplazo

En el diagrama de puntos anterior (relación entre la biomasa y el zinc presente en los suelos) se puede evidenciar un relación que tiende a ser inversamente proporcional en el conjunto de datos. Entre más pequeña sea la presencia de zinc en el suelo, más cantidad de biomasa habrá en el lugar. En ese sentido se obtuvo para el suelo donde se colectó la cantidad más grande de biomasa (2337.326 gr) un valor de zinc de 0.2105, y para el suelo donde se colectó la cantidad más pequeña de biomasa (369.823 gr) un valor de zinc de 31.2865.Por lo anterior se puede inferir que la planta forrajera de estudio crece mucho más y produce mucha más biomasa cuando se desarrolla en suelos pobres en zinc.

Teniendo en cuenta la información presentada en este trabajo se puede concluir que las características que presentan mayor relación con la biomasa producida por la planta forrajera de estudio son el pH de los suelos y el zinc presente en los suelos. Mientras el pH del suelo sea básico y los valores de zinc en el suelo sean pequeños, la cantidad de biomasa será más alta.