Correlación con valores en x & y

Objetivo. Determinar el valor de la correlación de Pearson entre las variables x & y del conjunto de datos

Las librerias

library(readr)
library(ggplot2) # Para gráficos mas 'amigables'

Los datos

set.seed(2020)
n <- 50 # Total de la muestra 

x <- sample(60:90, n, replace = TRUE)
y <- sample(80:90, n, replace = TRUE)

Crear el conjunto de datos

datos <- data.frame(x,y)
datos
##     x  y
## 1  87 87
## 2  71 81
## 3  82 80
## 4  81 85
## 5  83 82
## 6  60 88
## 7  76 90
## 8  63 88
## 9  69 84
## 10 65 90
## 11 76 89
## 12 72 85
## 13 83 81
## 14 67 88
## 15 69 82
## 16 77 87
## 17 75 81
## 18 81 80
## 19 88 85
## 20 61 86
## 21 75 87
## 22 62 84
## 23 61 87
## 24 88 81
## 25 83 84
## 26 67 85
## 27 63 83
## 28 77 82
## 29 73 86
## 30 73 83
## 31 71 83
## 32 75 81
## 33 74 89
## 34 73 80
## 35 66 85
## 36 79 88
## 37 77 85
## 38 79 87
## 39 80 86
## 40 79 89
## 41 75 89
## 42 71 89
## 43 86 80
## 44 81 80
## 45 77 80
## 46 69 87
## 47 90 89
## 48 65 81
## 49 74 84
## 50 70 87

Visualizando datos

ggplot(data = datos, aes(x = x, y = y)) + geom_point()

# ggplot (datos,aes(x,y)) + geom_point()

Correlacion

r <- cor(datos$x, datos$y, method = "pearson")
r <- round(r,4)
r
## [1] -0.2073

Tipo de correlación

# **************************************************************************
if (r == 0) 
  significa <- "correlación inexistente entre las variables."
if (r == −1)
  significa <- "correlación negativa perfecta."
if (r == 1)
  significa <- "correlación positiva perfecta."
# **************************************************************************
# Correlaciones negativas
if (r <= -0.90 & r > -1) 
  significa <- "correlación negativa muy fuerte."
if (r <= -0.75 & r > −0.90) 
  significa <- "correlación negativa considerable."
if (r <= -0.50 & r > −0.75) 
  significa <- "correlación negativa media."
if (r <= -0.25 & r > −0.50) 
  significa <- "correlación negativa débil."
if (r <= −0.10 & r > -0.25) 
  significa <- "correlación negativa muy débil."
if (r < 0 & r > -0.10) 
  significa <- "correlación negativa pero - NO - existe correlación."
# **************************************************************************
# Correlaciones positivas
if (r > 0 & r < 0.10 ) 
  significa <- "correlación positiva pero - NO - existe correlación."
if (r >= 0.10 & r < 0.25 ) 
  significa <- "correlación positiva muy débil."
if (r >= 0.25 & r < 0.50 ) 
  significa <- "correlación positiva débil."
if (r >= 0.50 & r < 0.75 ) 
  significa <- "correlación positiva media"
if (r >= 0.75 & r < 0.90 ) 
  significa <- "correlación positiva considerable."
if (r >= 0.90 & r < 1 ) 
  significa <- "correlación positiva muy fuerte."

#  ` = ascii 096 (ALT + 096) 

Interpretación

El valor del coeficiente de correlación en los datos de las variables x & y es de -0.2073 que representa una correlación negativa muy débil.