## medv rm lstat crim tax
## 22.532806 6.284634 12.653063 3.613524 408.237154
## medv rm lstat crim tax
## 9.1971041 0.7026171 7.1410615 8.6015451 168.5371161
Precio de las viviendas (\(medv\)): El promedio anda por los \(22.5\), pero con una desviación de \(9.2\). Eso nos dice que los precios están súper regados; hay mucha diferencia entre una zona barata y una cara, no es un mercado parejo.Tamaño de las casas (\(rm\)): En promedio, las casas tienen \(6.28\) habitaciones. Aquí la variación es moderada, o sea, la mayoría de las viviendas en Boston se mantienen cerca de ese tamaño estándar.Crimen (\(crim\)) e Impuestos (\(tax\)): Estos dos son un relajo. Tienen una dispersión altísima y están llenos de outliers (valores atípicos). Hay zonas donde el crimen o los impuestos se disparan comparado con el resto, lo que nos ensucia un poco el promedio.
Distribución de lstat: Se ve un sesgo a la derecha súper marcado. La mayoría de las zonas tienen un porcentaje bajo de población con bajo estatus, pero hay una “cola” larga de barrios donde ese número se dispara.
Distribución de medv: La mayoría de las casas andan en el rango medio de precio. Lo que sí brinca a la vista es ese tope en 50 parece que los datos están truncados ahí (como si todas las mansiones de lujo las hubieran redondeado a ese valor).
Distribución de rm: Esta es la más “normalita” o simétrica. Casi todo el mundo en Boston vive en casas de unas 6 habitaciones de promedio; no hay tantos extremos como en las otras variables.
Puntos clave de las gráficas Relación rm vs medv: Los histogramas nos gritan que si una zona tiene más cuartos promedio, el valor de las casas sube sí o sí. Es la variable que más “empuja” el precio hacia arriba.
Relación lstat vs medv: Aquí es al revés. Se ve clarísimo que donde hay más gente de bajo estatus, los precios de las viviendas se desploman. Es una relación negativa que no perdona.
Sobre la normalidad: Ninguna de las variables es una “campana de Gauss” perfecta. Todas tienen sus mañas (sesgos o datos truncados), así que no podemos llegar y aplicar cualquier fórmula sin antes ajustar esos límites y desviaciones.
## Warning: Unknown palette: "set2"
lstat y crim) y estructurales
(rm) influyen directamente en el valor de las viviendas en
Boston.rm es un fuerte predictor positivo de
medv, mientras que crim, lstat y
tax actúan como factores que reducen el valor.Esto nos muestra una realidad de la ciudad: hay una brecha enorme entre barrios. No es solo la casa, es dónde está metida.
Visualmente ya lo tenemos, pero el siguiente paso lógico es aventarnos una regresión para ver exactamente cuánto afecta cada variable y si de verdad son significativas o solo coincidencia.