Covarainza se determina a partir del resultado

entonces:

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.2
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.2
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#se usa la base de datos se abrevia y se manipilan lis nombres para poder manejarlos 

iris <- iris %>% as_tibble() %>% clean_names()

iris
## # A tibble: 150 × 5
##    sepal_length sepal_width petal_length petal_width species
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # … with 140 more rows
iris %>% 
  ggplot(aes(x = petal_length, y = petal_width, colors(petal_length))) + 
  geom_point()

#Por lo que podemos ver en el gráfico, pareciera que lo valores altos de petal_length van con valores altos de petal_width (y viceversa).

Si SXY=0 entonces no existe relación lineal entre X e Y

Si SXY>0 entonces existe una relación lineal directa o positiva entre X e Y. Esto es, a mayores valores de X, en promedio tenemos mayores valores de Y y viceversa.

Si SXY<0 entonces existe una relación lineal inversa o negativa entre X e Y. Esto es, a mayores valores de X, en promedio tenemos menores valores de Y y viceversa.

En R, utilizamos la función cov para calcular la covarianza entre dos vectores o columnas de un data.frame con la librería tidyr

library(tidyr)


iris %>% 
  summarise(
    cov_petal_length__petal_width = cov(petal_length, petal_width),
    cov_petal_length__sepal_width = cov(petal_length, sepal_width)
  )
## # A tibble: 1 × 2
##   cov_petal_length__petal_width cov_petal_length__sepal_width
##                           <dbl>                         <dbl>
## 1                          1.30                        -0.330

la Covarianza existe y es inversamente proporcional dado que el resultado es -0.33 entre el petalo y el sepalo

directamente proporcional entre el ancho y longitud del petalo