Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
load("/Users/sabm/Downloads/Salinidad.RData")
La base de datos muestra 5 variables, niveles de biomasa, pH, salinidad, Zinc y Potasio. Todas las variable son de tipo cuantitativas.
Para los cálculos de los niveles de biomasa.
mean(Salinidad[,1])
## [1] 1082.173
median(Salinidad[,1])
## [1] 991.829
min(Salinidad[,1])
## [1] 369.823
max(Salinidad[,1])
## [1] 2337.326
sd(Salinidad[,1])
## [1] 546.2874
En el calculo anterior podemos ver entonces que la media y la mediana tienen valores similares para la variable biomasa, y que los valores minimos y maximos son 396.8 y 2337.32, respectivamente. La desviación estandar de 546.28 indica una variación relativamente grande entre los datos de la muestra.
Ahora, para la variable pH:
mean(Salinidad[,2])
## [1] 4.608889
median(Salinidad[,2])
## [1] 4.45
min(Salinidad[,2])
## [1] 3.2
max(Salinidad[,2])
## [1] 7.45
sd(Salinidad[,2])
## [1] 1.254731
En el caso de esta variable, la media y la mediana son diferentes, indicando una distribución asimétrica en la muestra. El pH minimos registrado es de 3.2 y el pH máximo es de 7.45; este dato nos permite inferir que aunque las condiciones cambien, el nivel de pH nunca será mayor a 7.5. Por último, con la desviación estándar en este valor, podemos inferir que la variación entre los datos de la muestra es bastante pequeña, siendo que todos están en un rango bastante cercano.
Para la variable de los niveles de salinidad:
mean(Salinidad[,3])
## [1] 30.26667
median(Salinidad[,3])
## [1] 30
min(Salinidad[,3])
## [1] 24
max(Salinidad[,3])
## [1] 38
sd(Salinidad[,3])
## [1] 3.719726
La media y la mediana no son iguales, sin embargo, podemos notar que los valores son bastante cercanos, indicando que la asimetría es poca en la distribución de los datos. El valor máximo de salinidad es 38, y el mínimo es 24. La desviación estandar en esta variable, de 3.71, indica una baja variación de los datos, y esto lo podemos notar en la diferencia que hay entre los datos maximos y minimos, que no es mas de 14.
Para la variable que indica los niveles de zinc:
mean(Salinidad[,4])
## [1] 17.8308
median(Salinidad[,4])
## [1] 19.242
min(Salinidad[,4])
## [1] 0.2105
max(Salinidad[,4])
## [1] 31.2865
sd(Salinidad[,4])
## [1] 8.274169
En el caso de esta variable, notamos una diferencia entre la media y la mediana que indica una asimetría en la distribución de los datos. El nivel máximo de Zinc es 31, y el minimo es casi 0; esta es una diferencia significativa que puede inferir en la producción de biomasa. En esta variable, la desviación estándar indica una variación grande los datos, con un valor de 8.2.
Por último, la variable que indica los niveles de potasio:
mean(Salinidad[,5])
## [1] 797.3778
median(Salinidad[,5])
## [1] 773.3
min(Salinidad[,5])
## [1] 350.73
max(Salinidad[,5])
## [1] 1441.67
sd(Salinidad[,5])
## [1] 297.576
En el analisis de esta variable notamos una diferencia aún mas significativa entre media y mediana que en las otras variables, lo que nos indica que la distribucion de los datos de esta son muy asimétricos. El nivel minimo es 350.7 y el maximo es 1441.6, indicando una diferencia bastante grande entre el uno y el otro, y que se ve reflejada en el valor de la desviación estandar.
Ahora bien, una vez hemos hecho el analisis de cada de las variables, realizaremos 2 analisis bivariados para conocer: 1. El impacto del nivel del pH en la producción de biomasa. 2. El impacto de los niveles de Zinc en la producción de biomasa. 3. El impacto de los niveles de salinidad en la producción de biomasa.
require(psych)
## Loading required package: psych
tapply(Salinidad$Biomasa, Salinidad$pH, mean)
## 3.2 3.25 3.3 3.35 3.45 3.5 3.7 3.75
## 538.4607 445.5385 545.5380 555.9440 797.8005 977.5150 612.4470 654.8250
## 3.95 4.1 4.15 4.2 4.25 4.4 4.45 4.55
## 568.4550 1198.3955 991.8290 827.6860 821.0690 755.0720 1008.8040 1152.3410
## 4.6 4.7 4.75 4.85 5 5.2 5.35 5.4
## 1049.3065 954.0170 1398.8850 1349.1920 765.2800 1331.5390 1346.8800 1137.1930
## 5.5 5.55 5.6 7.1 7.35 7.4 7.45
## 1350.4240 896.1760 1895.9420 2270.2940 2332.2200 2337.3260 2192.5595
plot(Salinidad$Biomasa~Salinidad$pH, col="blue", xlab= "Niveles pH", ylab="Biomasa")
En el gráfico podemos observar que a mayor pH hay mayor producción de biomasa, como es el caso de pH>7. Sin embargo, en los datos con menor pH son más comunes, por lo tanto, los niveles de biomasa se mantienen comunmento por debajo de 1500, y raramente sube por encima de 2000.
Ahora bien, para la medicion del impacto de los niveles de Zinc y producción de biomasa:
tapply(Salinidad$Biomasa, Salinidad$Zinc, mean)
## 0.2105 0.2648 0.2703 0.3205 0.3729 9.4058 9.882 11.7566
## 2337.326 2222.588 2332.220 2162.531 2270.294 1203.568 1193.223 1039.637
## 12.2778 12.373 13.6826 13.9852 14.3516 14.9302 15.3276 16.4524
## 1422.836 818.127 1306.494 954.017 1008.804 977.515 827.686 765.280
## 16.6752 17.3128 17.8225 17.8795 18.5056 18.9875 19.242 19.588
## 777.474 755.072 821.069 615.091 545.538 1349.192 1137.193 1482.793
## 19.6531 19.9727 20.1328 20.3295 20.9687 21.3864 21.5699 22.1344
## 1895.942 1491.276 1145.643 1346.880 1058.976 1254.872 991.829 436.552
## 22.3312 22.6758 23.1908 23.7063 23.9841 24.6917 26.8415 27.7292
## 896.176 496.797 664.601 1152.341 1408.206 502.466 612.447 654.825
## 28.5901 28.6101 30.1652 30.5589 31.2865
## 448.315 465.907 509.872 568.455 369.823
barplot(Salinidad$Biomasa~Salinidad$Zinc, col="pink", xlab= "Niveles zinc", ylab="Biomasa")
En el caso del Zinc, el gráfico nos muestra un aumento notorio en la producción de biomasa cuando los niveles de este elemento son más bien bajos, cercanos a cero. Sin embargo, existen niveles de zinc alrededor de 18 y 22 donde la planta produce biomasa a niveles cercanos a los que produce cuando el zinc es cercano a cero.
Por último, para la variable Salinidad y su impacto en la produccion de biomasa:
tapply(Salinidad$Biomasa, Salinidad$Salinidad, mean)
## 24 25 26 27 28 29 30 31
## 1895.9420 1280.2735 1126.5058 875.8515 916.2477 1259.1950 1148.9489 583.5335
## 32 33 34 35 36 37 38
## 827.6860 975.6047 615.0910 1486.3912 856.7250 777.4740 1306.4940
plot(Salinidad$Biomasa~Salinidad$Salinidad, col="blue", xlab= "Niveles Salinidad", ylab="Biomasa")
Según el gráfico generado, podemos inferir que la variable salinidad no tiene ninguna influencia en la producción de biomasa, pues está muy dispersa en el gráfico.