Información Datos

Row

Grupo de Trabajo.

Integrantes:

  • Maria Camila Lozano
  • Lauren Escobar
  • Maria de los Ángeles Cabrera
  • Kevin Rengifo

Carrera: Ingeniería Civil

Descripción de los Datos.

El conjunto de datos contiene 545 muestras y 13 variables, tanto cualitativas como cuantitativas,entre las que están: price, area, bedrooms, bathrooms, stories, mainroad, guestroom, basement, hotwarterheating, airconditioning, parking, prefarea y furnishingstatus.

Estas variables describen distintas características de viviendas y su precio en el mercado, con el propósito de analizar qué factores influyen en el valor de una propiedad. Se observa que el precio promedio de las viviendas es cercano a 4.77 millones, con áreas promedio de 5150 ft². La mayoría de las casas tienen 3 habitaciones, 1 baño y 1 o 2 pisos.

Row

Análisis de Precios de la Vivienda.

Análisis Descriptivo

Row

Resumen datos.

     price               area          bedrooms       bathrooms    
 Min.   : 1750000   Min.   : 1650   Min.   :1.000   Min.   :1.000  
 1st Qu.: 3430000   1st Qu.: 3600   1st Qu.:2.000   1st Qu.:1.000  
 Median : 4340000   Median : 4600   Median :3.000   Median :1.000  
 Mean   : 4766729   Mean   : 5151   Mean   :2.965   Mean   :1.286  
 3rd Qu.: 5740000   3rd Qu.: 6360   3rd Qu.:3.000   3rd Qu.:2.000  
 Max.   :13300000   Max.   :16200   Max.   :6.000   Max.   :4.000  
    stories      mainroad  guestroom basement  hotwaterheating airconditioning
 Min.   :1.000   no : 77   no :448   no :354   no :520         no :373        
 1st Qu.:1.000   yes:468   yes: 97   yes:191   yes: 25         yes:172        
 Median :2.000                                                                
 Mean   :1.806                                                                
 3rd Qu.:2.000                                                                
 Max.   :4.000                                                                
    parking       prefarea        furnishingstatus
 Min.   :0.0000   no :417   furnished     :140    
 1st Qu.:0.0000   yes:128   semi-furnished:227    
 Median :0.0000             unfurnished   :178    
 Mean   :0.6936                                   
 3rd Qu.:1.0000                                   
 Max.   :3.0000                                   

Row

Interpretación.

Medianas sugieren una vivienda de ≈4,600 ft², 3 dormitorios, 1 baño, 2 pisos y sin parqueadero. Esa es la configuración más común alrededor de la cual se concentran los datos.

los mínimos (solo aplica a variables numéricas) • price: 1,750,000 • area: 1,650 ft^2 • bedrooms: 1 • bathrooms: 1 • stories: 1 • parking: 0

Imagen.

Análisis Univariado

Row

Gráfico.

Row

Interpretación.

En el gráfico de caja se observan algunos valores atípicos hacia la parte superior, correspondientes a viviendas con precios muy elevados. Estos casos representan propiedades de alto valor o lujo, que difieren del comportamiento general de la muestra.

Análisis Bivariados

Row

Correlación de Pearson.

[1] 0.5359973

Interpretación.

La gráfica evidencia una relación positiva entre el área de la vivienda y su precio: a medida que aumenta el tamaño del área, el precio tiende a incrementarse. No obstante, la relación no es perfecta, pues existen otros factores que también influyen en el valor de las viviendas.

Row

Matriz de Correlación.

Interpretación.

La matriz de correlación obtenida permite identificar el grado de relación lineal existente entre las variables cuantitativas del conjunto de datos. Los valores de correlación de Pearson oscilan entre -1 y 1, donde los valores cercanos a 1 indican una relación positiva fuerte (ambas variables aumentan o disminuyen juntas), los valores cercanos a -1 señalan una relación negativa fuerte (una variable aumenta mientras la otra disminuye), y los valores cercanos a 0 reflejan una relación débil o inexistente.

Análisis Bivariados

Row

Diagrama de Cajas 1: Precio vs Carretera Principal

Interpretación.

Las viviendas ubicadas sobre una carretera principal tienden a tener precios más altos, reflejando la influencia de la ubicación y accesibilidad en el valor del inmueble. En el gráfico se observa que la mediana del precio es mayor para las casas cercanas a una vía principal y que el rango intercuartílico es más amplio, indicando mayor dispersión. Además, se identifican varios valores atípicos en la parte superior, que corresponden a viviendas de lujo o con características especiales. En general, la distribución muestra cómo la ubicación incide en el valor económico de las propiedades.

Row

Diagrama de Cajas 2: Área vs Sótano

Interpretación

Las viviendas con sótano suelen tener áreas más amplias, lo que sugiere que la presencia de sótano está asociada a construcciones de mayor tamaño. Se aprecia que la mediana del área es superior en las viviendas con sótano y que el rango intercuartílico es mayor, indicando mayor variabilidad. También se observan valores atípicos hacia la parte superior, que representan propiedades con áreas excepcionalmente grandes.

Análisis Bivariados

Row

Diagrama de Cajas 3: Cuartos vs Dormitorio de Invitado

Interpretación

Las viviendas que cuentan con dormitorio de invitado tienden a tener un mayor número total de cuartos, reflejando un tamaño general más amplio. En el diagrama se observa una mediana más alta y un rango intercuartílico mayor en estas viviendas, lo que indica una mayor variabilidad en la cantidad de habitaciones. También se identifican valores atípicos superiores, correspondientes a casas con muchas habitaciones o diseños más amplios.

Row

Diagrama de Cajas 4: Baños vs Calentador de Agua

Interpretación

Las viviendas que disponen de calentador de agua tienden a contar con más baños, lo que sugiere una mejor dotación de servicios y un mayor nivel de confort. El gráfico evidencia una mediana superior en este grupo, así como una ligera dispersión que refleja diversidad en el número de baños. La presencia de valores atípicos hacia arriba indica inmuebles con múltiples baños, probablemente de mayor tamaño o categoría.

Análisis Bivariados

Row

Diagrama de Cajas 5: Pisos vs Aire Acondicionado

Interpretación.

Las viviendas con aire acondicionado muestran una tendencia a tener más pisos, lo que puede relacionarse con un diseño estructural más complejo o de mayor valor. En el diagrama se aprecia una mediana más alta y un rango intercuartílico moderado, lo que indica cierta variabilidad en la cantidad de pisos. Los valores atípicos superiores reflejan edificaciones más grandes o con características especiales.

Row

Diagrama de Barras Apiladas.

Interpretación.

El diagrama de barras apiladas permite observar la relación entre la presencia de aire acondicionado y la ubicación de la vivienda respecto a una carretera principal. Se aprecia que las casas ubicadas sobre una carretera principal presentan una mayor proporción de viviendas con aire acondicionado, lo que sugiere que estas zonas pueden corresponder a sectores más desarrollados o con mejor infraestructura. En contraste, las viviendas alejadas de la carretera principal muestran una menor frecuencia de este servicio.

Conclusiones

Row

Conclusiones.

A partir de los análisis estadísticos y gráficos realizados, se presentan a continuación las principales conclusiones del estudio.

  1. El conjunto de datos es consistente y completo, sin valores faltantes ni errores de digitación, lo que facilita el análisis estadístico.

  2. Las variables cualitativas como la cercanía a una carretera principal y la presencia de aire acondicionado parecen tener una relación relevante con el precio de las viviendas, asi como la varieble cuantitativa área.

  3. La relación entre el área y el precio confirma la tendencia general del mercado inmobiliario: a mayor tamaño, mayor valor. Sin embargo, los valores atípicos evidencian la existencia de propiedades con características especiales que alteran esta relación.

  4. Los gráficos realizados permiten identificar patrones importantes y posibles líneas de análisis futuras, como evaluar el impacto de los servicios y la ubicación sobre el precio.

Row

Imagen.

Finalización

Row

¡Muchas gracias por la atención!