Objetivo. Determinar el valor de la correlación de Pearson entre las variables x & y del conjunto de datos
library(readr)
library(ggplot2) # Para gráficos mas 'amigables'
set.seed(2020)
n <- 50 # Total de la muestra
x <- sample(60:90, n, replace = TRUE)
y <- sample(80:90, n, replace = TRUE)
datos <- data.frame(x,y)
datos
## x y
## 1 87 87
## 2 71 81
## 3 82 80
## 4 81 85
## 5 83 82
## 6 60 88
## 7 76 90
## 8 63 88
## 9 69 84
## 10 65 90
## 11 76 89
## 12 72 85
## 13 83 81
## 14 67 88
## 15 69 82
## 16 77 87
## 17 75 81
## 18 81 80
## 19 88 85
## 20 61 86
## 21 75 87
## 22 62 84
## 23 61 87
## 24 88 81
## 25 83 84
## 26 67 85
## 27 63 83
## 28 77 82
## 29 73 86
## 30 73 83
## 31 71 83
## 32 75 81
## 33 74 89
## 34 73 80
## 35 66 85
## 36 79 88
## 37 77 85
## 38 79 87
## 39 80 86
## 40 79 89
## 41 75 89
## 42 71 89
## 43 86 80
## 44 81 80
## 45 77 80
## 46 69 87
## 47 90 89
## 48 65 81
## 49 74 84
## 50 70 87
ggplot(data = datos, aes(x = x, y = y)) + geom_point()
# ggplot (datos,aes(x,y)) + geom_point()
r <- cor(datos$x, datos$y, method = "pearson")
r <- round(r,4)
r
## [1] -0.2073
# **************************************************************************
if (r == 0)
significa <- "correlación inexistente entre las variables."
if (r == −1)
significa <- "correlación negativa perfecta."
if (r == 1)
significa <- "correlación positiva perfecta."
# **************************************************************************
# Correlaciones negativas
if (r <= -0.90 & r > -1)
significa <- "correlación negativa muy fuerte."
if (r <= -0.75 & r > −0.90)
significa <- "correlación negativa considerable."
if (r <= -0.50 & r > −0.75)
significa <- "correlación negativa media."
if (r <= -0.25 & r > −0.50)
significa <- "correlación negativa débil."
if (r <= −0.10 & r > -0.25)
significa <- "correlación negativa muy débil."
if (r < 0 & r > -0.10)
significa <- "correlación negativa pero - NO - existe correlación."
# **************************************************************************
# Correlaciones positivas
if (r > 0 & r < 0.10 )
significa <- "correlación positiva pero - NO - existe correlación."
if (r >= 0.10 & r < 0.25 )
significa <- "correlación positiva muy débil."
if (r >= 0.25 & r < 0.50 )
significa <- "correlación positiva débil."
if (r >= 0.50 & r < 0.75 )
significa <- "correlación positiva media"
if (r >= 0.75 & r < 0.90 )
significa <- "correlación positiva considerable."
if (r >= 0.90 & r < 1 )
significa <- "correlación positiva muy fuerte."
# ` = ascii 096 (ALT + 096)
El valor del coeficiente de correlación en los datos de las variables x & y es de -0.2073 que representa una correlación negativa muy débil.