#Exploracion de datos de salinidad. El siguiente archivo muestra el procesamiento de lo datos del estudio de suelos, de la base de datos Salinidad.

#Ejercision con datos de Salinidad. #Analisis Univariado.

load("C:/Bioestadistica/Primer_parcial/Parcial 1/Salinidad.RData")
require(faraway)
## Loading required package: faraway
head(Salinidad)
##    Biomasa   pH Salinidad    Zinc Potasio
## 1  765.280 5.00        33 16.4524 1441.67
## 2  954.017 4.70        35 13.9852 1299.19
## 3  827.686 4.20        32 15.3276 1154.27
## 4  755.072 4.40        30 17.3128 1045.15
## 5  896.176 5.55        33 22.3312  521.62
## 6 1422.836 5.50        33 12.2778 1273.02
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96

La siguinete tabla muestra la base de datos compuesta de 5 variables; Ph haciendo referencia al pH de la muestra, salinidad refiriendose a la concentracion de salinidad en cada muestra de suelo, Zinc, refiriendose a la concentracion de zinc en cada muestra de suelo y Potasio, refiriendose a la concetracion de potasio en cada muestra de suelo, las cuatro variables respecto a la Biomasa. En total se evaluaron 45 muestras de suelo de manera aleatoria.

#Exploracion de datos muestras de suelo “pH”

require(ggplot2)
## Loading required package: ggplot2
grafica_1=ggplot(Salinidad,aes(x=pH))+geom_histogram()+ggtitle("Valores de pH")+ylab("count")
grafica_1
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

summary(Salinidad$pH)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.200   3.450   4.450   4.609   5.350   7.450

En la grafica_1 que representa un histograma se evidencian los diferentes valores de ph en las 45 muestras de suelo. El valor maximo de pH para la muestra es de 7.45 en relacion al promedio de 4.609, lo que podemos inferir es que el 75% de las muestras presentan un pH acido mientra que el 25% presenta un pH neutro. En este caso de estudio las varibales se estan midiendo respecto a la biomasa, debido a que la biomasa hace referencia a la cantidad total de masa presente en un sistema natural, y teneniendo en cuenta que las plantas prefieren suelos neutros con pH entre 6 y 7, la disminucion del ph en las muestras de suelo es inversamente proporcinal a la cantidad de biomasa ganada.

#Exploracion de datos- Concentracion de Potasio en el suelo.

grafica_2=ggplot(Salinidad,aes(x=Potasio))+geom_histogram()+ggtitle("Valores de Potasio en el suelo")+ylab("Count")
grafica_2
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

summary(Salinidad$Potasio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   350.7   527.0   773.3   797.4   954.1  1441.7

En la grafica_2 Se evidencia las diferentes concentraciones de potasio en el suelo. Donde las mayores concentraciones representan 1441.7 y el promedio de potasio en las 45 muestras es de 797.4. Lo que se puede interpretar como que la mayoria de las muestras presentan un concentracion considerable de potasio, a lo que se refiere que el aumento en el potasio es directamente proporcional al aumento de la biomasa.

#Exploracion de datos_ Concentracion de Zinc en el suelo.

grafica_3=ggplot(Salinidad,aes(x=Zinc))+geom_histogram()+ggtitle("Valores de Zinc en el suelo")+ylab("Count")
grafica_3
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

summary(Salinidad$Zinc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2105 13.9852 19.2420 17.8308 22.6758 31.2865

En la grafica_3 se evidencian las diferentes concentraciones de Zinc en las 45 muestras de suelo. El comportamiento de las concentraciones de zinc presenta una alta variabilidad respecto a los valores maximos de 31.286 y los valores minimos 0.21. Sin embargo el promedio de las concentraciones de zinc en las muestras es de 17.83, lo que quiere decir que menos del 25% de las muestras presenta una concentracion de zinc estable.

#Exploracion de datos_ “Salinidad en el suelo”

grafica_4=ggplot(Salinidad,aes(x=Salinidad))+geom_histogram()+ggtitle("Valores de Salinidad en el suelo")+ylab("Count")
grafica_4
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

summary(Salinidad$Salinidad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   27.00   30.00   30.27   33.00   38.00

Si entendemos que la salinidad de un suelo se define como la concentración de sales solubles que existe en la solución del suelo y comprendemos que los suelos afectados por salinidad tienen una concentración de sales más solubles que carbonato de calcio y yeso afectando el crecimiento de las plantas. En este caso el valor maximo de salinidad para las muestras es de 38.00 y el promedio de salinidad para el total de las muestras es 30.27. Interpretamos que el 80% de las muestras presentan una concentracion de salinidad conciderable lo que puede afectar a la biomasa presente en las muestras.

#Analisis Bivariado. #Analisis de correlacion con graficos de dispersion.

str(Salinidad)
## 'data.frame':    45 obs. of  5 variables:
##  $ Biomasa  : num  765 954 828 755 896 ...
##  $ pH       : num  5 4.7 4.2 4.4 5.55 5.5 4.25 4.45 4.75 4.6 ...
##  $ Salinidad: int  33 35 32 30 33 33 36 30 38 30 ...
##  $ Zinc     : num  16.5 14 15.3 17.3 22.3 ...
##  $ Potasio  : num  1442 1299 1154 1045 522 ...
cor(Salinidad)
##               Biomasa          pH   Salinidad        Zinc     Potasio
## Biomasa    1.00000000  0.92810235 -0.06657756 -0.78146249 -0.07319518
## pH         0.92810235  1.00000000 -0.04458851 -0.72046995  0.03236212
## Salinidad -0.06657756 -0.04458851  1.00000000 -0.42663388 -0.01963288
## Zinc      -0.78146249 -0.72046995 -0.42663388  1.00000000  0.07877268
## Potasio   -0.07319518  0.03236212 -0.01963288  0.07877268  1.00000000
grafica_5=pairs(Salinidad[,1:5])

grafica_5
## NULL

En la grafica de correlacion se puede evidenciar la relacion de las varibales pH, Zinc, Potasio, Salinidad respecto a la varible Biomasa.

require(ggplot2)
ggplot(Salinidad,aes(x=pH,y=Biomasa))+geom_point()

En este caso para las 45 muestras de suelo la relacion entre la biomasa y el pH es positiva y se acerca a 1. (9.3) por lo tanto el ph influye directamente en el aumento de la biomasa en las muestras de suelo. El aumento en la biomasa es directamente proporcional a la disminucion del pH.

ggplot(Salinidad,aes(x=Salinidad,y=Biomasa))+geom_point()

En la suguiente relacion entre la biomasa y la variable salinidad no es significativa y es negativa (-0.06) por lo tanto la salinidad no influye de manera directa en la presencia de biomasa en las muestras. Los datos se encuentran muy dispersos generando una relacion no significativa.

ggplot(Salinidad,aes(x=Zinc,y=Biomasa))+geom_point()

En la siguiente relacion entre la biomasa y la variable Zinc, es negativa (-0.78). Por lo tanto las concentraciones de Zinc influyen de manera inversa, a mayores concentraciones de Zinc menor cantidad de Biomasa.

ggplot(Salinidad,aes(x=Potasio,y=Biomasa))+geom_point()

En la siguiente relacion entre la biomasa y la variable Potasio, es negativa (-0.73). Por lo tanto las concentraciones de potasio no inflyen directamente en la presencia de biomasa en las muestras.

#Conclusiones. Respecto a la relacion entre la Biomasa y las variables pH, Zinc, Potasio y Salinidad, la variable que presenta una relacion significativa es el pH, ya que el aumento de la biomasa es directamente proporcional al aumento del pH. Por otro lado la relacion entre la varibale Zinc y la Biomasa es negativa, en lo que podemos decir que el auemento en las concentraciones de zinc es inversamente proporcional al aumento de la biomasa. Se recomienda mantener un pH neutro y Alkalino para aumentar la biomasa, y disminuir las concetraciones de Zinc.

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.