X Variable Independiente Y Variable Dependiente Objetivo. Determinar el valor de la correlación de Pearson entre las variabels x & y del conjunto de datos
library(readr)
library(ggplot2)
datos <- data.frame(women)
datos
## height weight
## 1 58 115
## 2 59 117
## 3 60 120
## 4 61 123
## 5 62 126
## 6 63 129
## 7 64 132
## 8 65 135
## 9 66 139
## 10 67 142
## 11 68 146
## 12 69 150
## 13 70 154
## 14 71 159
## 15 72 164
str(datos)
## 'data.frame': 15 obs. of 2 variables:
## $ height: num 58 59 60 61 62 63 64 65 66 67 ...
## $ weight: num 115 117 120 123 126 129 132 135 139 142 ...
summary(datos)
## height weight
## Min. :58.0 Min. :115.0
## 1st Qu.:61.5 1st Qu.:124.5
## Median :65.0 Median :135.0
## Mean :65.0 Mean :136.7
## 3rd Qu.:68.5 3rd Qu.:148.0
## Max. :72.0 Max. :164.0
datos
## height weight
## 1 58 115
## 2 59 117
## 3 60 120
## 4 61 123
## 5 62 126
## 6 63 129
## 7 64 132
## 8 65 135
## 9 66 139
## 10 67 142
## 11 68 146
## 12 69 150
## 13 70 154
## 14 71 159
## 15 72 164
ggplot(data = datos, aes(x = height, y = weight)) +
geom_point()
#### Correlacion
r <- cor(datos$weight, datos$height, method = "pearson")
r <- round(r, 4)
r
## [1] 0.9955
if (r == 0)
significa <- "No existe correlación alguna entre las variables."
if (r == −1)
significa <- "Correlación negativa perfecta."
if (r == 1)
significa <- "Correlación positiva perfecta."
# Negativas
if (r < -0.90 & r > -1)
significa <- "Correlación negativa muy fuerte."
if (r < -0.75 & r >= −0.90)
significa <- "Correlación negativa considerable."
if (r < -0.50 & r >= −0.75)
significa <- significa <- "Correlación negativa media."
if (r < -0.25 & r >= −0.50)
significa <- "Correlación negativa débil."
if (r < −0.10 & r >= -0.25)
significa <- "Correlación negativa muy débil."
if (r < 0 & r > -0.10)
significa <- "Negativa pero No existe correlación."
# Positivas
if (r > 0 & r < 0.10 )
significa <- "Positiva pero No existe correlación."
if (r > 0.10 & r <= 0.25 )
significa <- "Correlación positiva muy débil."
if (r > 0.25 & r <= 0.50 )
significa <- "Correlación positiva débil."
if (r > 0.50 & r <= 0.75 )
significa <- "Correlación positiva media"
if (r > 0.75 & r <= 0.90 )
significa <- "Correlación positiva considerable."
if (r > 0.90 & r < 1 )
significa <- "Correlación positiva muy fuerte."