Integrantes:
Carrera: Ingeniería Civil
El conjunto de datos contiene 545 muestras y 13 variables, tanto cualitativas como cuantitativas,entre las que están: price, area, bedrooms, bathrooms, stories, mainroad, guestroom, basement, hotwarterheating, airconditioning, parking, prefarea y furnishingstatus.
Estas variables describen distintas características de viviendas y su precio en el mercado, con el propósito de analizar qué factores influyen en el valor de una propiedad. Se observa que el precio promedio de las viviendas es cercano a 4.77 millones, con áreas promedio de 5150 ft². La mayoría de las casas tienen 3 habitaciones, 1 baño y 1 o 2 pisos.
price area bedrooms bathrooms
Min. : 1750000 Min. : 1650 Min. :1.000 Min. :1.000
1st Qu.: 3430000 1st Qu.: 3600 1st Qu.:2.000 1st Qu.:1.000
Median : 4340000 Median : 4600 Median :3.000 Median :1.000
Mean : 4766729 Mean : 5151 Mean :2.965 Mean :1.286
3rd Qu.: 5740000 3rd Qu.: 6360 3rd Qu.:3.000 3rd Qu.:2.000
Max. :13300000 Max. :16200 Max. :6.000 Max. :4.000
stories mainroad guestroom basement hotwaterheating airconditioning
Min. :1.000 no : 77 no :448 no :354 no :520 no :373
1st Qu.:1.000 yes:468 yes: 97 yes:191 yes: 25 yes:172
Median :2.000
Mean :1.806
3rd Qu.:2.000
Max. :4.000
parking prefarea furnishingstatus
Min. :0.0000 no :417 furnished :140
1st Qu.:0.0000 yes:128 semi-furnished:227
Median :0.0000 unfurnished :178
Mean :0.6936
3rd Qu.:1.0000
Max. :3.0000
Medianas sugieren una vivienda de ≈4,600 ft², 3 dormitorios, 1 baño, 2 pisos y sin parqueadero. Esa es la configuración más común alrededor de la cual se concentran los datos.
los mínimos (solo aplica a variables numéricas) • price: 1,750,000 • area: 1,650 ft^2 • bedrooms: 1 • bathrooms: 1 • stories: 1 • parking: 0
En el gráfico de caja se observan algunos valores atípicos hacia la parte superior, correspondientes a viviendas con precios muy elevados. Estos casos representan propiedades de alto valor o lujo, que difieren del comportamiento general de la muestra.
[1] 0.5359973
La gráfica evidencia una relación positiva entre el área de la vivienda y su precio: a medida que aumenta el tamaño del área, el precio tiende a incrementarse. No obstante, la relación no es perfecta, pues existen otros factores que también influyen en el valor de las viviendas.
La matriz de correlación obtenida permite identificar el grado de relación lineal existente entre las variables cuantitativas del conjunto de datos. Los valores de correlación de Pearson oscilan entre -1 y 1, donde los valores cercanos a 1 indican una relación positiva fuerte (ambas variables aumentan o disminuyen juntas), los valores cercanos a -1 señalan una relación negativa fuerte (una variable aumenta mientras la otra disminuye), y los valores cercanos a 0 reflejan una relación débil o inexistente.
Las viviendas ubicadas sobre una carretera principal tienden a tener precios más altos, reflejando la influencia de la ubicación y accesibilidad en el valor del inmueble. En el gráfico se observa que la mediana del precio es mayor para las casas cercanas a una vía principal y que el rango intercuartílico es más amplio, indicando mayor dispersión. Además, se identifican varios valores atípicos en la parte superior, que corresponden a viviendas de lujo o con características especiales. En general, la distribución muestra cómo la ubicación incide en el valor económico de las propiedades.
Las viviendas con sótano suelen tener áreas más amplias, lo que sugiere que la presencia de sótano está asociada a construcciones de mayor tamaño. Se aprecia que la mediana del área es superior en las viviendas con sótano y que el rango intercuartílico es mayor, indicando mayor variabilidad. También se observan valores atípicos hacia la parte superior, que representan propiedades con áreas excepcionalmente grandes.
Las viviendas que cuentan con dormitorio de invitado tienden a tener un mayor número total de cuartos, reflejando un tamaño general más amplio. En el diagrama se observa una mediana más alta y un rango intercuartílico mayor en estas viviendas, lo que indica una mayor variabilidad en la cantidad de habitaciones. También se identifican valores atípicos superiores, correspondientes a casas con muchas habitaciones o diseños más amplios.
Las viviendas que disponen de calentador de agua tienden a contar con más baños, lo que sugiere una mejor dotación de servicios y un mayor nivel de confort. El gráfico evidencia una mediana superior en este grupo, así como una ligera dispersión que refleja diversidad en el número de baños. La presencia de valores atípicos hacia arriba indica inmuebles con múltiples baños, probablemente de mayor tamaño o categoría.
Las viviendas con aire acondicionado muestran una tendencia a tener más pisos, lo que puede relacionarse con un diseño estructural más complejo o de mayor valor. En el diagrama se aprecia una mediana más alta y un rango intercuartílico moderado, lo que indica cierta variabilidad en la cantidad de pisos. Los valores atípicos superiores reflejan edificaciones más grandes o con características especiales.
El diagrama de barras apiladas permite observar la relación entre la presencia de aire acondicionado y la ubicación de la vivienda respecto a una carretera principal. Se aprecia que las casas ubicadas sobre una carretera principal presentan una mayor proporción de viviendas con aire acondicionado, lo que sugiere que estas zonas pueden corresponder a sectores más desarrollados o con mejor infraestructura. En contraste, las viviendas alejadas de la carretera principal muestran una menor frecuencia de este servicio.
A partir de los análisis estadísticos y gráficos realizados, se presentan a continuación las principales conclusiones del estudio.
El conjunto de datos es consistente y completo, sin valores faltantes ni errores de digitación, lo que facilita el análisis estadístico.
Las variables cualitativas como la cercanía a una carretera principal y la presencia de aire acondicionado parecen tener una relación relevante con el precio de las viviendas, asi como la varieble cuantitativa área.
La relación entre el área y el precio confirma la tendencia general del mercado inmobiliario: a mayor tamaño, mayor valor. Sin embargo, los valores atípicos evidencian la existencia de propiedades con características especiales que alteran esta relación.
Los gráficos realizados permiten identificar patrones importantes y posibles líneas de análisis futuras, como evaluar el impacto de los servicios y la ubicación sobre el precio.