## Warning: package 'ggplot2' was built under R version 4.1.3
En el siguiente grafico podemos observar la relación entre el número medio de habitantes por vivienda (rm) y el precio medio por vivienda (medv); en este caso podemos ver que tiene una alta corelación positiva, a medida que aumenta el numero medio de habitantes por vivienda, aumenta el precio medio por vivienda.
Podemos comprobar en los siguientes graficos que el numero medio de habitantes por vivienda no se distribuye normalmente al igual que el precio medio de la vivienda
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
gracias a esto realizaremos el test de spearman ya que ambas variables no cumplen la caracteristica de normalidad, por lo que el modelo de pearson solo trabaja con variables con condición de la normal.
cor.test(x= datos$rm, y= datos$medv, alternative = "greater", method = "spearman" )
## Warning in cor.test.default(x = datos$rm, y = datos$medv, alternative =
## "greater", : Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: datos$rm and datos$medv
## S = 7911922, p-value < 2.2e-16
## alternative hypothesis: true rho is greater than 0
## sample estimates:
## rho
## 0.6335764
podemos observar que la correlacion es positiva fuerte para estas dos variables y ademas confirmamos que la grafica no es altamente fuerte ya que posee un leve dispercion en su base.
No es valido construir un modelo lineal de regresión simple, porque la ecucacion lineal no se adapta correctamente a nuestra grafica. En este caso un cambio en la viariable dependeinte no implica un cambio en la variable independiente.