En un análisis de suelos se ha obtenido el porcentaje de materia orgánica y el contenido de calcio, entre otros parámetros. Para estudiar la forma en que estas dos variables se encuentran asociadas y determinar el grado de asociación se utiliza la medida de covarianza y el coeficiente de correlación momento-producto de Pearson para mostrar, respectivamente, el grado de intensidad de la relación y el grado de asociación lineal entre dos variables. En el ejemplo se calcula el coeficiente de correlación de Pearson.
Los datos de la variable “porcentaje de materia orgániga” se incluyen en un objeto de tipo vector identificado como “MO”, a través de la función concatenar.
MO<-c(2.82,3.04,3.91,4.39,4.61,7.03,7.03,7.25,7.47,7.47,7.61,7.69,8.57,8.91,8.92,9.10,
9.88,10.00,10.00,10.43,10.43,10.43,10.87,11.46,11.74,12.09,12.35,12.78,13.41,13.97,
14.14,15.38,16.10,16.41,17.17,21.28)El mismo procedimiento se sigue para la variable de “contenido de calcio” expresada en miliequivalentes/100g. Es importante verificar las dimensionales.
Ca<-c(10.28,14.96,9.98,18.09,8.42,10.30,18.72,13.73,11.23,20.28,13.09,18.09,18.20,26.19,
19.97,15.91,15.60,23.71,26.82,19.33,22.45,26.82,31.80,24.96,22.13,23.40,26.20,21.53,24.02,
23.71, 26.83, 23.40, 25.58, 24.33, 26.19, 24.32)En el diagrama de dispersión se presta atención si la relación es directa, inversa o aleatoria. En la construcción del gráfico, la asignación de las variables en los ejes es indistinta y no afecta el análisis.
par(mfrow=c(1,2),cex.main=1) #La función par() permite dividir la sección de gráficos en los espacios necesarios, en este caso se divide en 1 fila y 2 columnas
plot(MO,Ca,xlab="Contenido de materia orgánica",ylab="Contenido de calcio en el suelo", col="green")
plot(Ca,MO,ylab="Contenido de materia orgánica",xlab="Contenido de calcio en el suelo", col="red")En los diagramas anteriores se observa una tendencia lineal directamente proporcional, sin importar la asignación de variables en los ejes.
Para obtener el coeficiente de correlación lineal de Pearson, incluyendo el valor de P (P value) que evalúa su significancia, se emplea la función:
cor.test(MO, Ca,alternative= "two.sided", method="pearson",conflevel=0.95)##
## Pearson's product-moment correlation
##
## data: MO and Ca
## t = 5.8578, df = 34, p-value = 1.317e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.4955884 0.8413606
## sample estimates:
## cor
## 0.7087298
Observe que se trata de una prueba de hipótesis alternativa bilateral (“two.sided”) usando el método de Pearson al tratarse de una correlación paramétrica, en la que ambas variables son cuantitativas continuas. Este método estandariza la magnitud de la covarianza a un rango que oscila entre -1 a 1.
El coeficiente de correlación de Pearson de 0.7087298 permite afirmar que existe una alta correlación positiva entre el porcentaje de materia orgánica y el contenido de calcio.
Note que el p-value de 1.317e-06 es inferior al nivel de significancia fijado en 0.05.
Otras alternativas de hipótesis alternativas para la función cor.test:
Para [rho < 0] use “less” y para [rho > 0] use “greater”. Para otros métodos de correlación, utilice method: “kendall”, “spearman” (Correlación no paramétrica).