Correlación con valores en X & Y

X Variable Independiente Y Variable Dependiente Objetivo. Determinar el valor de la correlación de Pearson entre las variabels x & y del conjunto de datos

Cargar Librerias

library(readr)
library(ggplot2)

Cargar los datos

datos <- data.frame(women)
datos
##    height weight
## 1      58    115
## 2      59    117
## 3      60    120
## 4      61    123
## 5      62    126
## 6      63    129
## 7      64    132
## 8      65    135
## 9      66    139
## 10     67    142
## 11     68    146
## 12     69    150
## 13     70    154
## 14     71    159
## 15     72    164
str(datos)
## 'data.frame':    15 obs. of  2 variables:
##  $ height: num  58 59 60 61 62 63 64 65 66 67 ...
##  $ weight: num  115 117 120 123 126 129 132 135 139 142 ...
summary(datos)
##      height         weight     
##  Min.   :58.0   Min.   :115.0  
##  1st Qu.:61.5   1st Qu.:124.5  
##  Median :65.0   Median :135.0  
##  Mean   :65.0   Mean   :136.7  
##  3rd Qu.:68.5   3rd Qu.:148.0  
##  Max.   :72.0   Max.   :164.0
datos
##    height weight
## 1      58    115
## 2      59    117
## 3      60    120
## 4      61    123
## 5      62    126
## 6      63    129
## 7      64    132
## 8      65    135
## 9      66    139
## 10     67    142
## 11     68    146
## 12     69    150
## 13     70    154
## 14     71    159
## 15     72    164

Visualizacion de datos

ggplot(data = datos, aes(x = height, y = weight)) +
         geom_point() 

#### Correlacion

r <- cor(datos$weight, datos$height, method = "pearson")

r <- round(r, 4)

r
## [1] 0.9955

Tipo de correlacion

if (r == 0) 
  significa <- "No existe correlación alguna entre las variables."
if (r == −1)
  significa <- "Correlación negativa perfecta."
if (r == 1)
  significa <- "Correlación positiva perfecta."

# Negativas
if (r < -0.90 & r > -1) 
  significa <- "Correlación negativa muy fuerte."
if (r < -0.75 & r >= −0.90) 
  significa <- "Correlación negativa considerable."
if (r < -0.50 & r >= −0.75) 
  significa <- significa <- "Correlación negativa media."
if (r < -0.25 & r >= −0.50) 
  significa <- "Correlación negativa débil."
if (r < −0.10 & r >= -0.25) 
  significa <- "Correlación negativa muy débil."
if (r < 0 & r > -0.10) 
  significa <- "Negativa pero No existe correlación."


# Positivas
if (r > 0 & r < 0.10 ) 
  significa <- "Positiva pero No existe correlación."
if (r > 0.10 & r <= 0.25 ) 
  significa <- "Correlación positiva muy débil."
if (r > 0.25 & r <= 0.50 ) 
  significa <- "Correlación positiva débil."
if (r > 0.50 & r <= 0.75 ) 
  significa <- "Correlación positiva media"
if (r > 0.75 & r <= 0.90 ) 
  significa <- "Correlación positiva considerable."
if (r > 0.90 & r < 1 ) 
  significa <- "Correlación positiva muy fuerte."

Es una correlaccion positiva muy fuerte