#Exploracion de datos de salinidad. El siguiente archivo muestra el procesamiento de lo datos del estudio de suelos, de la base de datos Salinidad.
#Ejercision con datos de Salinidad. #Analisis Univariado.
load("C:/Bioestadistica/Primer_parcial/Parcial 1/Salinidad.RData")
require(faraway)
## Loading required package: faraway
head(Salinidad)
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
Salinidad
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
## 7 821.069 4.25 36 17.8225 1346.35
## 8 1008.804 4.45 30 14.3516 1253.88
## 9 1306.494 4.75 38 13.6826 1242.65
## 10 1039.637 4.60 30 11.7566 1282.95
## 11 1193.223 4.10 30 9.8820 553.69
## 12 777.474 3.45 37 16.6752 494.74
## 13 818.127 3.45 33 12.3730 526.97
## 14 1203.568 4.10 36 9.4058 571.14
## 15 977.515 3.50 30 14.9302 408.64
## 16 369.823 3.25 30 31.2865 646.65
## 17 509.872 3.25 27 30.1652 514.03
## 18 448.315 3.20 29 28.5901 350.73
## 19 615.091 3.35 34 17.8795 496.29
## 20 545.538 3.30 36 18.5056 580.92
## 21 436.552 3.25 30 22.1344 535.82
## 22 465.907 3.25 28 28.6101 490.34
## 23 664.601 3.20 31 23.1908 552.39
## 24 502.466 3.20 31 24.6917 661.32
## 25 496.797 3.35 35 22.6758 672.12
## 26 2270.294 7.10 29 0.3729 525.65
## 27 2332.220 7.35 35 0.2703 563.13
## 28 2162.531 7.45 35 0.3205 497.96
## 29 2222.588 7.45 30 0.2648 458.38
## 30 2337.326 7.40 30 0.2105 498.25
## 31 1349.192 4.85 26 18.9875 936.26
## 32 1058.976 4.60 29 20.9687 894.79
## 33 1408.206 5.20 25 23.9841 941.36
## 34 1491.276 4.75 26 19.9727 1038.79
## 35 1254.872 5.20 26 21.3864 898.05
## 36 1152.341 4.55 25 23.7063 989.87
## 37 568.455 3.95 26 30.5589 951.28
## 38 612.447 3.70 26 26.8415 929.83
## 39 654.825 3.75 27 27.7292 925.42
## 40 991.829 4.15 27 21.5699 954.11
## 41 1895.942 5.60 24 19.6531 720.72
## 42 1346.880 5.35 27 20.3295 782.09
## 43 1482.793 5.50 26 19.5880 773.30
## 44 1145.643 5.50 28 20.1328 829.26
## 45 1137.193 5.40 28 19.2420 856.96
La siguinete tabla muestra la base de datos compuesta de 5 variables; Ph haciendo referencia al pH de la muestra, salinidad refiriendose a la concentracion de salinidad en cada muestra de suelo, Zinc, refiriendose a la concentracion de zinc en cada muestra de suelo y Potasio, refiriendose a la concetracion de potasio en cada muestra de suelo, las cuatro variables respecto a la Biomasa. En total se evaluaron 45 muestras de suelo de manera aleatoria.
#Exploracion de datos muestras de suelo “pH”
require(ggplot2)
## Loading required package: ggplot2
grafica_1=ggplot(Salinidad,aes(x=pH))+geom_histogram()+ggtitle("Valores de pH")+ylab("count")
grafica_1
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(Salinidad$pH)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.200 3.450 4.450 4.609 5.350 7.450
En la grafica_1 que representa un histograma se evidencian los diferentes valores de ph en las 45 muestras de suelo. El valor maximo de pH para la muestra es de 7.45 en relacion al promedio de 4.609, lo que podemos inferir es que el 75% de las muestras presentan un pH acido mientra que el 25% presenta un pH neutro. En este caso de estudio las varibales se estan midiendo respecto a la biomasa, debido a que la biomasa hace referencia a la cantidad total de masa presente en un sistema natural, y teneniendo en cuenta que las plantas prefieren suelos neutros con pH entre 6 y 7, la disminucion del ph en las muestras de suelo es inversamente proporcinal a la cantidad de biomasa ganada.
#Exploracion de datos- Concentracion de Potasio en el suelo.
grafica_2=ggplot(Salinidad,aes(x=Potasio))+geom_histogram()+ggtitle("Valores de Potasio en el suelo")+ylab("Count")
grafica_2
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(Salinidad$Potasio)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 350.7 527.0 773.3 797.4 954.1 1441.7
En la grafica_2 Se evidencia las diferentes concentraciones de potasio en el suelo. Donde las mayores concentraciones representan 1441.7 y el promedio de potasio en las 45 muestras es de 797.4. Lo que se puede interpretar como que la mayoria de las muestras presentan un concentracion considerable de potasio, a lo que se refiere que el aumento en el potasio es directamente proporcional al aumento de la biomasa.
#Exploracion de datos_ Concentracion de Zinc en el suelo.
grafica_3=ggplot(Salinidad,aes(x=Zinc))+geom_histogram()+ggtitle("Valores de Zinc en el suelo")+ylab("Count")
grafica_3
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(Salinidad$Zinc)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.2105 13.9852 19.2420 17.8308 22.6758 31.2865
En la grafica_3 se evidencian las diferentes concentraciones de Zinc en las 45 muestras de suelo. El comportamiento de las concentraciones de zinc presenta una alta variabilidad respecto a los valores maximos de 31.286 y los valores minimos 0.21. Sin embargo el promedio de las concentraciones de zinc en las muestras es de 17.83, lo que quiere decir que menos del 25% de las muestras presenta una concentracion de zinc estable.
#Exploracion de datos_ “Salinidad en el suelo”
grafica_4=ggplot(Salinidad,aes(x=Salinidad))+geom_histogram()+ggtitle("Valores de Salinidad en el suelo")+ylab("Count")
grafica_4
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(Salinidad$Salinidad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 24.00 27.00 30.00 30.27 33.00 38.00
Si entendemos que la salinidad de un suelo se define como la concentración de sales solubles que existe en la solución del suelo y comprendemos que los suelos afectados por salinidad tienen una concentración de sales más solubles que carbonato de calcio y yeso afectando el crecimiento de las plantas. En este caso el valor maximo de salinidad para las muestras es de 38.00 y el promedio de salinidad para el total de las muestras es 30.27. Interpretamos que el 80% de las muestras presentan una concentracion de salinidad conciderable lo que puede afectar a la biomasa presente en las muestras.
#Analisis Bivariado. #Analisis de correlacion con graficos de dispersion.
str(Salinidad)
## 'data.frame': 45 obs. of 5 variables:
## $ Biomasa : num 765 954 828 755 896 ...
## $ pH : num 5 4.7 4.2 4.4 5.55 5.5 4.25 4.45 4.75 4.6 ...
## $ Salinidad: int 33 35 32 30 33 33 36 30 38 30 ...
## $ Zinc : num 16.5 14 15.3 17.3 22.3 ...
## $ Potasio : num 1442 1299 1154 1045 522 ...
cor(Salinidad)
## Biomasa pH Salinidad Zinc Potasio
## Biomasa 1.00000000 0.92810235 -0.06657756 -0.78146249 -0.07319518
## pH 0.92810235 1.00000000 -0.04458851 -0.72046995 0.03236212
## Salinidad -0.06657756 -0.04458851 1.00000000 -0.42663388 -0.01963288
## Zinc -0.78146249 -0.72046995 -0.42663388 1.00000000 0.07877268
## Potasio -0.07319518 0.03236212 -0.01963288 0.07877268 1.00000000
grafica_5=pairs(Salinidad[,1:5])
grafica_5
## NULL
En la grafica de correlacion se puede evidenciar la relacion de las varibales pH, Zinc, Potasio, Salinidad respecto a la varible Biomasa.
require(ggplot2)
ggplot(Salinidad,aes(x=pH,y=Biomasa))+geom_point()
En este caso para las 45 muestras de suelo la relacion entre la biomasa y el pH es positiva y se acerca a 1. (9.3) por lo tanto el ph influye directamente en el aumento de la biomasa en las muestras de suelo. El aumento en la biomasa es directamente proporcional a la disminucion del pH.
ggplot(Salinidad,aes(x=Salinidad,y=Biomasa))+geom_point()
En la suguiente relacion entre la biomasa y la variable salinidad no es significativa y es negativa (-0.06) por lo tanto la salinidad no influye de manera directa en la presencia de biomasa en las muestras. Los datos se encuentran muy dispersos generando una relacion no significativa.
ggplot(Salinidad,aes(x=Zinc,y=Biomasa))+geom_point()
En la siguiente relacion entre la biomasa y la variable Zinc, es negativa (-0.78). Por lo tanto las concentraciones de Zinc influyen de manera inversa, a mayores concentraciones de Zinc menor cantidad de Biomasa.
ggplot(Salinidad,aes(x=Potasio,y=Biomasa))+geom_point()
En la siguiente relacion entre la biomasa y la variable Potasio, es negativa (-0.73). Por lo tanto las concentraciones de potasio no inflyen directamente en la presencia de biomasa en las muestras.
#Conclusiones. Respecto a la relacion entre la Biomasa y las variables pH, Zinc, Potasio y Salinidad, la variable que presenta una relacion significativa es el pH, ya que el aumento de la biomasa es directamente proporcional al aumento del pH. Por otro lado la relacion entre la varibale Zinc y la Biomasa es negativa, en lo que podemos decir que el auemento en las concentraciones de zinc es inversamente proporcional al aumento de la biomasa. Se recomienda mantener un pH neutro y Alkalino para aumentar la biomasa, y disminuir las concetraciones de Zinc.
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.