Descripción de los datos

El conjunto de datos txhousing del paquete ggplot2 contiene información mensual sobre el mercado inmobiliario de distintas ciudades de Texas, Estados Unidos, entre los años 2000 y 2015. Recopilado por el Texas A&M University Real Estate Center, incluye variables como precio mediano de venta, número de ventas, volumen total de ventas, número de viviendas listadas y el inventario disponible. Los datos ya han sido procesados y permiten analizar la evolución del mercado inmobiliario en ese periodo. El dataset cuenta con 9 variables: ciudad, año, mes, ventas, volumen, precio mediano, listados, inventario y precio promedio anunciado.

Datos

Variable Descripción
city Nombre de la ciudad de Texas donde se registra la observación
year Año en que se registró la observación
month Mes en que se registró la observación (1 = enero, 12 = diciembre)
sales Número de viviendas vendidas en ese mes y ciudad
volume Volumen total de ventas en dólares
median Precio mediano de venta de las viviendas en dólares
listings Número total de viviendas listadas para la venta en ese mes y ciudad
inventory Inventario disponible de viviendas en meses (cuánto duraría el stock actual)
advertised Precio promedio de venta anunciado (disponible solo en algunos registros)

Visualizaciones de datos

Librerias necesarias

library(dplyr) 

Carga del dataset

data("txhousing")

Grafico 1

ggplot(txhousing, aes(x = median, y = sales)) +
  geom_point(alpha = 0.5, color = "steelblue") +
  labs(
    title = "Relación entre Precio Mediano y Ventas",
    x = "Precio mediano de venta (USD)",
    y = "Número de ventas"
  ) +
  theme_minimal()

¿Qué variables está graficando y por qué?

Se grafican las variables median (precio mediano de venta de viviendas en dólares) en el eje X y sales (número de ventas mensuales por ciudad) en el eje Y. Se eligieron estas variables para explorar la posible relación entre el precio de las viviendas y la cantidad de ventas que se realizan.

¿Qué relación principal se espera obtener?

Se esperaba encontrar que a medida que sube el precio mediano de venta, la cantidad de ventas disminuye. La gráfica muestra precisamente esa tendencia: cuando los precios son bajos (menos de 200,000 USD), existe un rango muy amplio de ventas, mientras que a precios más altos las ventas tienden a ser menores. Esto sugiere que las viviendas más costosas tienen menor volumen de ventas mensuales, lo cual es un patrón habitual en los mercados inmobiliarios.

Interpretacion

Se observa que cuando el precio mediano de venta es bajo (menor a 200,000 USD) hay una gran dispersión en las ventas, pero conforme sube el precio, la cantidad de ventas tiende a concentrarse en valores más bajos. Esto sugiere que las viviendas más caras tienden a venderse menos en volumen.

Grafico 2

ggplot(txhousing, aes(x = sales)) +
  geom_histogram(binwidth = 50, fill = "darkorange", color = "white") +
  labs(
    title = "Distribución del Número de Ventas",
    x = "Número de ventas",
    y = "Frecuencia"
  ) +
  theme_minimal()

¿Qué variables está graficando y por qué?

Se graficó la variable sales, que representa el número de ventas de viviendas por ciudad y mes. Se eligió esta variable para analizar su distribución y conocer qué tan frecuente es cada rango de ventas en el mercado inmobiliario de Texas.

¿Qué información principal se espera obtener?

Se esperaba observar que la mayoría de las observaciones tienen un número de ventas relativamente bajo. El histograma confirma esta expectativa: la mayor parte de los valores se concentran entre 0 y 500 ventas mensuales, con muy pocas observaciones que superan las 1000 ventas. Esto indica que altas cantidades de ventas son poco comunes, probablemente por el tamaño de las ciudades, la oferta limitada de viviendas o la estacionalidad del mercado.

Interpretacion

La mayoría de las observaciones tienen entre 0 y 500 ventas mensuales por ciudad. Hay muy pocas observaciones con más de 1000 ventas, indicando que ese volumen de transacciones es poco frecuente en el mercado inmobiliario de Texas.