Objetivo. Determinar el valor de la correlación de Pearson entre las variabels x & y del conjunto de datos
library(readr)
library(ggplot2)
set.seed(2020)
n <- 50 # Total de la muestra
x <- sample(50:100, n, replace = TRUE)
y <- sample(80:90, n, replace = TRUE)
datos <- data.frame(x,y)
datos
## x y
## 1 77 80
## 2 93 85
## 3 72 82
## 4 71 88
## 5 73 90
## 6 50 88
## 7 66 84
## 8 85 90
## 9 91 89
## 10 55 85
## 11 98 81
## 12 94 88
## 13 57 82
## 14 91 87
## 15 99 81
## 16 65 80
## 17 78 85
## 18 83 86
## 19 97 87
## 20 52 84
## 21 51 87
## 22 78 81
## 23 89 84
## 24 53 85
## 25 99 83
## 26 63 82
## 27 63 86
## 28 61 83
## 29 97 83
## 30 96 81
## 31 63 89
## 32 56 80
## 33 69 85
## 34 67 88
## 35 70 85
## 36 97 87
## 37 93 86
## 38 67 89
## 39 59 89
## 40 80 89
## 41 55 80
## 42 96 80
## 43 92 80
## 44 62 87
## 45 81 89
## 46 73 81
## 47 62 84
## 48 94 87
## 49 51 83
## 50 80 83
ggplot(data = datos, aes(x = x, y = y)) +
geom_point()
r <- cor(datos$x, datos$y, method = "pearson")
r <- round(r, 4)
r
## [1] -0.0306
if (r == 0)
significa <- "No existe correlación alguna entre las variables."
if (r == −1)
significa <- "Correlación negativa perfecta."
if (r == 1)
significa <- "Correlación positiva perfecta."
# Negativas
if (r < -0.90 & r > -1)
significa <- "Correlación negativa muy fuerte."
if (r < -0.75 & r >= −0.90)
significa <- "Correlación negativa considerable."
if (r < -0.50 & r >= −0.75)
significa <- significa <- "Correlación negativa media."
if (r < -0.25 & r >= −0.50)
significa <- "Correlación negativa débil."
if (r < −0.10 & r >= -0.25)
significa <- "Correlación negativa muy débil."
if (r < 0 & r > -0.10)
significa <- "Negativa pero No existe correlación."
# Positivas
if (r > 0 & r < 0.10 )
significa <- "Positiva pero No existe correlación."
if (r > 0.10 & r <= 0.25 )
significa <- "Correlación positiva muy débil."
if (r > 0.25 & r <= 0.50 )
significa <- "Correlación positiva débil."
if (r > 0.50 & r <= 0.75 )
significa <- "Correlación positiva media"
if (r > 0.75 & r <= 0.90 )
significa <- "Correlación positiva considerable."
if (r > 0.90 & r < 1 )
significa <- "Correlación positiva muy fuerte."
El valor del coeficiente de correlación en los datos de las variables x & y es de -0.0306 , que representa una significación de Negativa pero No existe correlación..