El conjunto de datos txhousing del paquete ggplot2 contiene información mensual sobre el mercado inmobiliario de distintas ciudades de Texas, Estados Unidos, entre los años 2000 y 2015. Recopilado por el Texas A&M University Real Estate Center, incluye variables como precio mediano de venta, número de ventas, volumen total de ventas, número de viviendas listadas y el inventario disponible. Los datos ya han sido procesados y permiten analizar la evolución del mercado inmobiliario en ese periodo. El dataset cuenta con 9 variables: ciudad, año, mes, ventas, volumen, precio mediano, listados, inventario y precio promedio anunciado.
| Variable | Descripción |
|---|---|
| city | Nombre de la ciudad de Texas donde se registra la observación |
| year | Año en que se registró la observación |
| month | Mes en que se registró la observación (1 = enero, 12 = diciembre) |
| sales | Número de viviendas vendidas en ese mes y ciudad |
| volume | Volumen total de ventas en dólares |
| median | Precio mediano de venta de las viviendas en dólares |
| listings | Número total de viviendas listadas para la venta en ese mes y ciudad |
| inventory | Inventario disponible de viviendas en meses (cuánto duraría el stock actual) |
| advertised | Precio promedio de venta anunciado (disponible solo en algunos registros) |
library(dplyr)
data("txhousing")
ggplot(txhousing, aes(x = median, y = sales)) +
geom_point(alpha = 0.5, color = "steelblue") +
labs(
title = "Relación entre Precio Mediano y Ventas",
x = "Precio mediano de venta (USD)",
y = "Número de ventas"
) +
theme_minimal()
Se grafican las variables median (precio mediano de venta de viviendas en dólares) en el eje X y sales (número de ventas mensuales por ciudad) en el eje Y. Se eligieron estas variables para explorar la posible relación entre el precio de las viviendas y la cantidad de ventas que se realizan.
Se esperaba encontrar que a medida que sube el precio mediano de venta, la cantidad de ventas disminuye. La gráfica muestra precisamente esa tendencia: cuando los precios son bajos (menos de 200,000 USD), existe un rango muy amplio de ventas, mientras que a precios más altos las ventas tienden a ser menores. Esto sugiere que las viviendas más costosas tienen menor volumen de ventas mensuales, lo cual es un patrón habitual en los mercados inmobiliarios.
Se observa que cuando el precio mediano de venta es bajo (menor a 200,000 USD) hay una gran dispersión en las ventas, pero conforme sube el precio, la cantidad de ventas tiende a concentrarse en valores más bajos. Esto sugiere que las viviendas más caras tienden a venderse menos en volumen.
ggplot(txhousing, aes(x = sales)) +
geom_histogram(binwidth = 50, fill = "darkorange", color = "white") +
labs(
title = "Distribución del Número de Ventas",
x = "Número de ventas",
y = "Frecuencia"
) +
theme_minimal()
Se graficó la variable sales, que representa el número de ventas de viviendas por ciudad y mes. Se eligió esta variable para analizar su distribución y conocer qué tan frecuente es cada rango de ventas en el mercado inmobiliario de Texas.
Se esperaba observar que la mayoría de las observaciones tienen un número de ventas relativamente bajo. El histograma confirma esta expectativa: la mayor parte de los valores se concentran entre 0 y 500 ventas mensuales, con muy pocas observaciones que superan las 1000 ventas. Esto indica que altas cantidades de ventas son poco comunes, probablemente por el tamaño de las ciudades, la oferta limitada de viviendas o la estacionalidad del mercado.
La mayoría de las observaciones tienen entre 0 y 500 ventas mensuales por ciudad. Hay muy pocas observaciones con más de 1000 ventas, indicando que ese volumen de transacciones es poco frecuente en el mercado inmobiliario de Texas.