Covarainza se determina a partir del resultado
entonces:
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.2
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.2
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#se usa la base de datos se abrevia y se manipilan lis nombres para poder manejarlos
iris <- iris %>% as_tibble() %>% clean_names()
iris
## # A tibble: 150 × 5
## sepal_length sepal_width petal_length petal_width species
## <dbl> <dbl> <dbl> <dbl> <fct>
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## # … with 140 more rows
iris %>%
ggplot(aes(x = petal_length, y = petal_width, colors(petal_length))) +
geom_point()
#Por lo que podemos ver en el gráfico, pareciera que lo valores altos de petal_length van con valores altos de petal_width (y viceversa).
Si SXY=0 entonces no existe relación lineal entre X e Y
Si SXY>0 entonces existe una relación lineal directa o positiva entre X e Y. Esto es, a mayores valores de X, en promedio tenemos mayores valores de Y y viceversa.
Si SXY<0 entonces existe una relación lineal inversa o negativa entre X e Y. Esto es, a mayores valores de X, en promedio tenemos menores valores de Y y viceversa.
En R, utilizamos la función cov para calcular la covarianza entre dos vectores o columnas de un data.frame con la librería tidyr
library(tidyr)
iris %>%
summarise(
cov_petal_length__petal_width = cov(petal_length, petal_width),
cov_petal_length__sepal_width = cov(petal_length, sepal_width)
)
## # A tibble: 1 × 2
## cov_petal_length__petal_width cov_petal_length__sepal_width
## <dbl> <dbl>
## 1 1.30 -0.330
la Covarianza existe y es inversamente proporcional dado que el resultado es -0.33 entre el petalo y el sepalo
directamente proporcional entre el ancho y longitud del petalo