Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

load("/Users/sabm/Downloads/Salinidad.RData")

La base de datos muestra 5 variables, niveles de biomasa, pH, salinidad, Zinc y Potasio. Todas las variable son de tipo cuantitativas.

Para los cálculos de los niveles de biomasa.

mean(Salinidad[,1]) 
## [1] 1082.173
median(Salinidad[,1])
## [1] 991.829
min(Salinidad[,1])
## [1] 369.823
max(Salinidad[,1])
## [1] 2337.326
sd(Salinidad[,1])
## [1] 546.2874

En el calculo anterior podemos ver entonces que la media y la mediana tienen valores similares para la variable biomasa, y que los valores minimos y maximos son 396.8 y 2337.32, respectivamente. La desviación estandar de 546.28 indica una variación relativamente grande entre los datos de la muestra.

Ahora, para la variable pH:

mean(Salinidad[,2]) 
## [1] 4.608889
median(Salinidad[,2])
## [1] 4.45
min(Salinidad[,2])
## [1] 3.2
max(Salinidad[,2])
## [1] 7.45
sd(Salinidad[,2])
## [1] 1.254731

En el caso de esta variable, la media y la mediana son diferentes, indicando una distribución asimétrica en la muestra. El pH minimos registrado es de 3.2 y el pH máximo es de 7.45; este dato nos permite inferir que aunque las condiciones cambien, el nivel de pH nunca será mayor a 7.5. Por último, con la desviación estándar en este valor, podemos inferir que la variación entre los datos de la muestra es bastante pequeña, siendo que todos están en un rango bastante cercano.

Para la variable de los niveles de salinidad:

mean(Salinidad[,3]) 
## [1] 30.26667
median(Salinidad[,3])
## [1] 30
min(Salinidad[,3])
## [1] 24
max(Salinidad[,3])
## [1] 38
sd(Salinidad[,3])
## [1] 3.719726

La media y la mediana no son iguales, sin embargo, podemos notar que los valores son bastante cercanos, indicando que la asimetría es poca en la distribución de los datos. El valor máximo de salinidad es 38, y el mínimo es 24. La desviación estandar en esta variable, de 3.71, indica una baja variación de los datos, y esto lo podemos notar en la diferencia que hay entre los datos maximos y minimos, que no es mas de 14.

Para la variable que indica los niveles de zinc:

mean(Salinidad[,4]) 
## [1] 17.8308
median(Salinidad[,4])
## [1] 19.242
min(Salinidad[,4])
## [1] 0.2105
max(Salinidad[,4])
## [1] 31.2865
sd(Salinidad[,4])
## [1] 8.274169

En el caso de esta variable, notamos una diferencia entre la media y la mediana que indica una asimetría en la distribución de los datos. El nivel máximo de Zinc es 31, y el minimo es casi 0; esta es una diferencia significativa que puede inferir en la producción de biomasa. En esta variable, la desviación estándar indica una variación grande los datos, con un valor de 8.2.

Por último, la variable que indica los niveles de potasio:

mean(Salinidad[,5]) 
## [1] 797.3778
median(Salinidad[,5])
## [1] 773.3
min(Salinidad[,5])
## [1] 350.73
max(Salinidad[,5])
## [1] 1441.67
sd(Salinidad[,5])
## [1] 297.576

En el analisis de esta variable notamos una diferencia aún mas significativa entre media y mediana que en las otras variables, lo que nos indica que la distribucion de los datos de esta son muy asimétricos. El nivel minimo es 350.7 y el maximo es 1441.6, indicando una diferencia bastante grande entre el uno y el otro, y que se ve reflejada en el valor de la desviación estandar.

Ahora bien, una vez hemos hecho el analisis de cada de las variables, realizaremos 2 analisis bivariados para conocer: 1. El impacto del nivel del pH en la producción de biomasa. 2. El impacto de los niveles de Zinc en la producción de biomasa. 3. El impacto de los niveles de salinidad en la producción de biomasa.

require(psych)
## Loading required package: psych
tapply(Salinidad$Biomasa, Salinidad$pH, mean)
##       3.2      3.25       3.3      3.35      3.45       3.5       3.7      3.75 
##  538.4607  445.5385  545.5380  555.9440  797.8005  977.5150  612.4470  654.8250 
##      3.95       4.1      4.15       4.2      4.25       4.4      4.45      4.55 
##  568.4550 1198.3955  991.8290  827.6860  821.0690  755.0720 1008.8040 1152.3410 
##       4.6       4.7      4.75      4.85         5       5.2      5.35       5.4 
## 1049.3065  954.0170 1398.8850 1349.1920  765.2800 1331.5390 1346.8800 1137.1930 
##       5.5      5.55       5.6       7.1      7.35       7.4      7.45 
## 1350.4240  896.1760 1895.9420 2270.2940 2332.2200 2337.3260 2192.5595
plot(Salinidad$Biomasa~Salinidad$pH, col="blue", xlab= "Niveles pH", ylab="Biomasa")

En el gráfico podemos observar que a mayor pH hay mayor producción de biomasa, como es el caso de pH>7. Sin embargo, en los datos con menor pH son más comunes, por lo tanto, los niveles de biomasa se mantienen comunmento por debajo de 1500, y raramente sube por encima de 2000.

Ahora bien, para la medicion del impacto de los niveles de Zinc y producción de biomasa:

tapply(Salinidad$Biomasa, Salinidad$Zinc, mean)
##   0.2105   0.2648   0.2703   0.3205   0.3729   9.4058    9.882  11.7566 
## 2337.326 2222.588 2332.220 2162.531 2270.294 1203.568 1193.223 1039.637 
##  12.2778   12.373  13.6826  13.9852  14.3516  14.9302  15.3276  16.4524 
## 1422.836  818.127 1306.494  954.017 1008.804  977.515  827.686  765.280 
##  16.6752  17.3128  17.8225  17.8795  18.5056  18.9875   19.242   19.588 
##  777.474  755.072  821.069  615.091  545.538 1349.192 1137.193 1482.793 
##  19.6531  19.9727  20.1328  20.3295  20.9687  21.3864  21.5699  22.1344 
## 1895.942 1491.276 1145.643 1346.880 1058.976 1254.872  991.829  436.552 
##  22.3312  22.6758  23.1908  23.7063  23.9841  24.6917  26.8415  27.7292 
##  896.176  496.797  664.601 1152.341 1408.206  502.466  612.447  654.825 
##  28.5901  28.6101  30.1652  30.5589  31.2865 
##  448.315  465.907  509.872  568.455  369.823
  barplot(Salinidad$Biomasa~Salinidad$Zinc, col="pink", xlab= "Niveles zinc", ylab="Biomasa")

En el caso del Zinc, el gráfico nos muestra un aumento notorio en la producción de biomasa cuando los niveles de este elemento son más bien bajos, cercanos a cero. Sin embargo, existen niveles de zinc alrededor de 18 y 22 donde la planta produce biomasa a niveles cercanos a los que produce cuando el zinc es cercano a cero.

Por último, para la variable Salinidad y su impacto en la produccion de biomasa:

tapply(Salinidad$Biomasa, Salinidad$Salinidad, mean)
##        24        25        26        27        28        29        30        31 
## 1895.9420 1280.2735 1126.5058  875.8515  916.2477 1259.1950 1148.9489  583.5335 
##        32        33        34        35        36        37        38 
##  827.6860  975.6047  615.0910 1486.3912  856.7250  777.4740 1306.4940
plot(Salinidad$Biomasa~Salinidad$Salinidad, col="blue", xlab= "Niveles Salinidad", ylab="Biomasa")

Según el gráfico generado, podemos inferir que la variable salinidad no tiene ninguna influencia en la producción de biomasa, pues está muy dispersa en el gráfico.