Análisis estadístico de propiedades inmobiliarias en Bogotá mediante pruebas de hipótesis

Autor/a

Mauricio Tuberquia- Emily Escudero

1 Resumen

El estudio de las variables inmobiliarias en Bogotá es fundamental para comprender las dinámicas del mercado de vivienda de la ciudad.En este análisis,se trabajó con una base de datos que contiene más de 400 registros de propiedades recopilados en el año 2023.El cuál se centró en explorar aspectos como el estrato, el precio, el tipo de inmueble y si las propiedades estaban remodeladas o no, utilizando pruebas de hipótesis estadísticas para abordar preguntas relevantes sobre estas características. El análisis se centró en evaluar las relaciones entre las variables estudiadas e identificar posibles diferencias significativas en aspectos clave del mercado inmobiliario en Bogotá. A través de este enfoque, se buscó determinar si ciertas suposiciones, como la igualdad de proporciones en los estratos, las diferencias de precios entre tipos de inmueble y las características relacionadas con propiedades remodeladas, podían ser respaldadas o rechazadas con base en los datos. Para ello, se emplearon pruebas t de Student, pruebas F de Fisher y análisis descriptivos de medias y varianzas, permitiendo obtener información fundamentada que contribuya al entendimiento de las tendencias y características del mercado de viviendas en la ciudad. Es importante destacar que las conclusiones están basadas en un conjunto de datos específico y que, aunque las pruebas estadísticas respaldan los hallazgos, siempre existe la posibilidad de sesgos o limitaciones inherentes a la fuente de los datos. Por lo tanto, los resultados deben interpretarse con cautela, considerando el contexto del análisis y las restricciones del estudio.

2 Introducción

El análisis de datos inmobiliarios es fundamental para entender las dinámicas del mercado de viviendas en Bogotá, proporcionando información clave para la toma de decisiones de compradores, vendedores y agentes gubernamentales encargados de políticas de vivienda. Este estudio se enfocó en caracterizar variables esenciales como el precio, estrato, tipo de inmueble y estado de remodelación, con el objetivo de responder a preguntas relevantes sobre el comportamiento del mercado en 2023.

Se plantearon las siguientes hipótesis para guiar el análisis:

Diferencia en el precio promedio según el tipo de inmueble
¿Existe diferencia entre el precio promedio de los diferentes tipos de inmueble (casa, apartamento)?
Proporción de inmuebles remodelados según el estrato
¿Existe diferencia entre la proporción de inmuebles remodelados en distintos estratos socioeconómicos?
Varianza del precio entre inmuebles remodelados y no remodelados
¿Hay alguna diferencia entre la varianza de los precios de inmuebles remodelados y no remodelados?
Proporción de inmuebles remodelados mayor al 30%
¿La proporción de inmuebles que han sido remodelados es mayor al 30%?

Para responder a estas preguntas, se analizó una gran base de datos inmobiliarios recolectados en 2023. Este enfoque permitió evaluar diferencias en medias, varianzas y proporciones, con el fin de aportar una visión detallada y basada en evidencia del mercado inmobiliario en Bogotá.

3 Metodología

Para el estudio de mercado inmobiliario en la ciudad de Bogotá se usaron los estadísticos y gráficos univariados y multivariados. Se usó RStudio (Rstudio?) , Quarto y las librerias ggplot2 (Wickham 2016), modest (Poncet 2019), moments(Komsta y Novomestky 2022).

4 Datos

Para el análisis y estudio se utilizaron las variables estrato, precio, remodeladoy tipo de inmueble. La Tabla 1 muestra la clasificación de estas variables según su tipo y escala de medición.

Tabla 1: Variables y clasificación de acuerdo al tipo y escala de medición

Variable	Tipo	Subtipo	Escala
Estrato	Cuantitativa	Discreta	Ordinal
Precio	Cuantitativa	Continua	Razón
Remodelado	Cualitativa	Binaria	Nominal
Tipo de inmueble	Cualitativa	Nominal	Nominal

5 Resultados

5.1 Análisis descriptivo

5.1.1 Variable cuantitativa precio

A continuación un análisis descriptivo de la variable “precio”:

Medidas de tendencia central

La variable “precio” refleja las siguientes medidas de tendencia central:

Media: La media que tiene un valor de 258437785 es el promedio de los precios observados, mostrando un valor representativo central para la variable.
Mediana: Con un valor de 2.05e+08, es menos afectada por valores extremos, describe el precio que ocupa la posición central de los datos ordenados.
Moda: La moda con un valor de 156717029.79, indica el precio que se repite con mayor frecuencia en los datos, proporcionando una medida intuitiva del valor más común. Medidas de dispersión

Para evaluar la variabilidad en los precios, se calcularon las siguientes medidas de dispersión:

Rango: Diferencia entre el precio más alto y el más bajo, mostrando la amplitud de los datos, para el caso de la variable precio es de [8.5e+07, 1.53e+09]
Desviación estándar: Con un valor de 152880174, mide el grado promedio de dispersión de los precios respecto a la media.
Coeficiente de variación: Con un coeficiente de 59.1555% . Este expresa la dispersión relativa como un porcentaje de la media, permitiendo comparaciones entre variables con distintas escalas.

Análisis gráfico

Se realizaron tres representaciones gráficas para explorar la distribución de los precios. En primer lugar una curva de densidad (Figura 1) mostró una distribución asimétrica hacia la derecha, con una mayor concentración en los precios bajos y una disminución progresiva en las frecuencias para los precios altos. La Figura 2 que se trata de un histograma confirmó la asimetría observada en la curva de densidad. Mientras la última figura Figura 3 que se trata de un QQ-Plot permitió evaluar visualmente el ajuste de la variable a una distribución normal. Si bien algunos puntos cercanos al centro se aproximaron a la línea de referencia, las desviaciones en las colas evidenciaron que la variable no sigue una distribución normal.

Análisis de normalidad

Para confirmar las observaciones gráficas, se realizó la prueba de Shapiro-Wilk, que evalúa si los datos se ajustan a una distribución normal.

Estadístico W: El valor obtenido de 0.808 indica una baja concordancia entre la distribución observada y la normal.
Valor p: Fue extremadamente bajo, p=2.2×10^{-16}, lo que rechaza la hipótesis de normalidad con un nivel de significancia estándar.

En conclusión, aunque visualmente algunos gráficos sugirieron similitudes con la normalidad, los resultados estadísticos confirman que la variable “precio” no sigue una distribución normal. Esto implica que deben considerarse métodos estadísticos no paramétricos o transformaciones de la variable para análisis posteriores.

Figura 1: Análisis de normalidad de la variable precio

Figura 2: Análisis de normalidad de la variable precio

Figura 3: Análisis de normalidad de la variable precio

5.1.2 Variable cuantitativa estrato

A continuación un análisis descriptivo de la variable “estrato”.

Medidas de tendencia central

Media: Con un valor de 3.092, refleja el estrato promedio en la población analizada. Este valor representa el centro de gravedad de los datos.
Mediana: La mediana, igual a 3, indica el punto central de la distribución cuando los datos se ordenan de menor a mayor. Es una medida robusta frente a valores atípicos, lo que la hace adecuada para describir distribuciones ligeramente asimétricas.
¨Moda: Con un valor de 2.69, identifica el estrato más frecuente entre las observaciones, aportando información sobre el valor más representativo.

Medidas de dispersión

Rango: Definido como la diferencia entre el valor máximo y mínimo del estrato, varía entre 1 y 6, mostrando la amplitud de la variable.
Desviación estándar: La desviación estándar de 1.113271 señala que tan dispersos están los valores en torno a la media, indicando una variabilidad moderada en los estratos.
Coeficiente de variación: Con un valor de 36.00205%, expresa la variación relativa de la variable en términos porcentuales. Este valor indica que la dispersión es aproximadamente un 36% del promedio, lo que sugiere una variabilidad considerable.

Análisis de normalidad:

Al analizar la variable “estrato”, se comenzó por inspeccionar su distribución mediante un histograma (Figura 4), el cual mostraba una forma que visualmente podría sugerir similitud con una distribución normal debido a su relativa simetría. Sin embargo, para confirmar esta observación preliminar, se realizó una prueba de normalidad estadística más robusta: la prueba de Shapiro-Wilk.

Los resultados indicaron que la variable “estrato” no se ajusta a una distribución normal. Aquí los resultados:

El estadístico W de Shapiro-Wilk, que mide el grado de ajuste de los datos a la distribución normal, fue de 0,89, lo que sugiere un ajuste insuficiente.
El valor-p asociado a esta prueba fue extremadamente bajo (2.2e-16), indicando una probabilidad prácticamente nula de que los datos provengan de una distribución normal.

Dado que el valor-p es significativamente menor que el nivel de significancia comúnmente usado (α = 0.05), se rechazó la hipótesis nula de normalidad. Esto sugiere que la variable “estrato” no sigue una distribución normal y que su análisis podría requerir métodos no paramétricos si la normalidad es un supuesto relevante

Análisis gráfico

Se elaboraron tres gráficos para facilitar la comprensión de la variable “estrato”. En primer lugar, el histograma Figura 4 muestra la distribución general de la variable, con una tendencia que se asemeja a una distribución normal, aunque presenta desviaciones en las colas. A continuación, la curva de densidad Figura 5 proporciona una representación más suavizada, evidenciando una leve asimetría y posibles discrepancias respecto a la normalidad. Por último, el QQ-Plot Figura 6 permite evaluar visualmente el ajuste de la variable a una distribución normal; los puntos muestran ligeras desviaciones respecto a la línea de referencia, especialmente en las colas, lo que indica que la distribución difiere de una normal.

Figura 4: Análisis de normalidad de la variable estrato

Figura 5: Análisis de normalidad de la variable estrato

Figura 6: Análisis de normalidad de la variable estrato

5.1.3 Variables precio y tipo de inmueble.

Se realizó un análisis descriptivo para explorar la relación entre el tipo de inmueble y el precio, utilizando dos representaciones gráficas: un boxplot (gráfico de cajas y bigotes)(Figura 7) y un diagrama de violín (Figura 8). Estas herramientas permitieron identificar patrones de dispersión, tendencias centrales y comportamientos extremos en los datos.

Boxplot (Figura 7)

El boxplot mostró que los precios de los inmuebles se concentran predominantemente en un rango entre 300 y 400 millones de pesos, lo que representa el valor típico para la mayoría de los inmuebles en la muestra. Sin embargo, se observó que los apartamentos presentan una mayor dispersión en los precios, con algunos valores que alcanzan hasta 1.600 millones de pesos, indicando la presencia de inmuebles de lujo dentro de esta categoría. En contraste, las casas y las casas en conjuntos cerrados mantienen precios más consistentes dentro del rango típico, sin evidenciar grandes fluctuaciones ni valores atípicos extremos.

Diagrama de violín (Figura 8)

El diagrama de violín complementó este análisis al proporcionar una representación más detallada de la densidad de los datos. Este gráfico confirmó que la mayor densidad de precios se encuentra en el rango de 300 a 400 millones, especialmente para los apartamentos, que también mostraron una cola más larga hacia los precios elevados. En el caso de las casas y los conjuntos cerrados, la distribución se mantiene más uniforme y compacta, reafirmando que estas categorías no presentan variaciones tan marcadas como los apartamentos.

En conclusión, el análisis mostró que, aunque los apartamentos pueden alcanzar precios considerablemente altos, la mayoría de los inmuebles, independientemente de su tipo, están agrupados en un rango de precios moderado y accesible. Los gráficos utilizados facilitaron la identificación de estos patrones y ofrecieron una visión más clara de las diferencias en la distribución del precio según el tipo de inmueble.

Figura 7: Análisis comparativo precio y tipo de inmueble

Figura 8: Análisis comparativo precio y tipo de inmueble

5.1.4 Variables precio y remodelado.

Para analizar la relación entre el precio y el estado de remodelación de los inmuebles, se emplearon dos gráficos: un boxplot (Figura 9) y un diagrama de dispersión (Figura 10) . Estos gráficos ayudaron a visualizar la distribución de los precios de los inmuebles en función de si estaban remodelados o no, permitiendo una evaluación clara de cualquier posible impacto de la remodelación en el precio.

Boxplot (Figura 9)

El boxplot mostró que los precios de los inmuebles, tanto remodelados como no remodelados, se concentran en un rango estándar entre 300 y 400 millones de pesos. Este rango abarca la mayoría de los inmuebles en la muestra, independientemente de su estado de remodelación. Sin embargo, también se observaron algunos inmuebles remodelados que presentaban precios excepcionalmente altos, alcanzando cifras cercanas a los 1.600 millones de pesos. Estos valores son atípicos y representan solo una pequeña fracción de la muestra, lo que sugiere que no son representativos de la tendencia general.

Diagrama de dispersión (Figura 10)

El diagrama de dispersión proporcionó una representación visual más detallada de la relación entre el precio y el estado de remodelación. Los puntos en el gráfico mostraron que no existe una relación clara entre la variable remodelado y el precio. Aunque algunos inmuebles remodelados se distribuyen en el rango de precios más altos, la mayoría de los datos no muestran una tendencia consistente, lo que refuerza la observación realizada en el boxplot.

Conclusión:

En conclusión, a partir del análisis realizado con ambos gráficos, podemos afirmar que la remodelación no parece tener un impacto significativo en el precio de los inmuebles dentro de la muestra estudiada. Aunque algunos inmuebles remodelados presentan precios muy altos, estos casos son excepcionales y no alteran la distribución general de precios, la cual se mantiene dentro de un rango estándar. Por lo tanto, se puede concluir que la remodelación no es un factor determinante en la variabilidad de los precios de los inmuebles analizados.

Figura 9: Análisis comparativo precio y remodelado

Figura 10: Análisis comparativo precio y remodelado

5.1.5 Variables estrato y tipo de inmueble.

Se llevó a cabo un análisis descriptivo de las variables “estrato” y “tipo de inmueble” utilizando dos representaciones gráficas: un diagrama de barras apiladas (Figura 11) y un boxplot (gráfico de cajas y bigotes)(Figura 12).

Estas herramientas permitieron explorar la relación entre el tipo de inmueble y el estrato socioeconómico.

Diagrama de barras apiladas (Figura 11)

El diagrama de barras apiladas mostró que la mayoría de los inmuebles en la muestra se concentran en los estratos 2, 3 y 4, que representan los niveles socioeconómicos predominantes. Este gráfico también reveló que los apartamentos son el tipo de inmueble más común en la muestra, seguidos por las casas independientes y, en menor medida, por las casas en conjuntos cerrados. La representación apilada permitió observar la distribución proporcional de los tipos de inmuebles dentro de cada estrato.

Boxplot (gráfico de cajas y bigotes) (Figura 12) El boxplot permitió analizar la dispersión y rangos predominantes del estrato para cada tipo de inmueble. Los principales hallazgos incluyen:

Apartamentos: Este tipo de inmueble es el más representativo y alcanza todos los estratos socioeconómicos, siendo el único que llega al estrato 6. La dispersión es mayor, reflejando una diversidad de opciones en términos de estrato.
Casas: Se concentran exclusivamente en los estratos 2, 3 y 4, lo que las posiciona como opciones más accesibles económicamente dentro de la muestra.
Casas en conjuntos cerrados: Al igual que las casas independientes, están agrupadas entre los estratos 2 y 4, lo que sugiere una similitud en términos de accesibilidad económica.

En conclusión, los resultados obtenidos muestran una fuerte concentración de los inmuebles en estratos medios (2, 3 y 4), con una predominancia clara de los apartamentos, especialmente en los estratos altos. Las casas, tanto independientes como en conjuntos cerrados, están limitadas a los estratos intermedios, reforzando su percepción como opciones más económicas dentro de esta muestra.

Figura 11: Análisis comparativo de estrato y tipo de inmueble

Figura 12: Análisis comparativo de estrato y tipo de inmueble

5.1.6 Variables estrato y remodelado.

Para estudiar la relación entre el estrato socioeconómico y el estado de remodelación de los inmuebles, se emplearon dos representaciones gráficas: un boxplot (Figura 14) y un gráfico de barras apiladas(Figura 13). Ambas herramientas proporcionaron una visión detallada de cómo se distribuyen los inmuebles remodelados y no remodelados en función de los estratos.

Boxplot (Figura 14)

El boxplot mostró que la distribución de los inmuebles remodelados y no remodelados está bastante equilibrada, con aproximadamente la mitad de los inmuebles en cada categoría. Sin embargo, al observar los estratos, se identificó que la mayoría de los inmuebles, tanto remodelados como no remodelados, se concentran en los estratos 2, 3 y 4, lo que refuerza la idea de que estos estratos son los más comunes dentro de la muestra. Además, el boxplot evidenció que los inmuebles remodelados tienden a encontrarse más frecuentemente en los estratos 3 y 4, mientras que los inmuebles no remodelados están distribuidos principalmente entre los estratos 2 y 3.

Gráfico de barras apiladas (Figura 13)

El gráfico de barras apiladas proporcionó una visualización clara de la proporción de inmuebles remodelados y no remodelados dentro de cada estrato. En este gráfico, se observó que en los estratos 2 y 3, la mayoría de los inmuebles no están remodelados, mientras que en el estrato 4, la proporción de inmuebles remodelados es significativamente mayor. Este gráfico facilitó la comparación directa entre los distintos estratos, mostrando cómo los inmuebles remodelados aumentan proporcionalmente en los estratos más altos.

Conclusión:

En resumen, los resultados del análisis muestran que la remodelación de inmuebles es más prevalente en los estratos 3 y 4, mientras que los estratos 2 y 3 albergan una proporción significativa de inmuebles no remodelados. El boxplot permitió visualizar la distribución de remodelaciones en relación con los estratos, mientras que el gráfico de barras apiladas facilitó la comparación directa de las proporciones de inmuebles remodelados y no remodelados en cada estrato. Ambos gráficos coinciden en indicar que los estratos intermedios son los más representativos tanto en términos de la cantidad de inmuebles como en el estado de remodelación.

Figura 13: Análisis comparativo de estrato y remodelado

Figura 14: Análisis comparativo de estrato y remodelado

6 Prueba de hipótesis

6.1 Estrato

6.1.1 Prueba de hipótesis para la media y la varianza

6.1.1.1 Análisis de la prueba de hipótesis para la media.

Planteamiento de hipótesis:

Se llevó a cabo una prueba de hipótesis para analizar la media de la variable cuantitativa estrato.

Las hipótesis formuladas fueron las siguientes:

Hipótesis nula (H0) = La media de la variable estrato es igual al valor hipotético (μ=4).
Hipótesis alternativa (H1)= La media de la variable estrato no es igual al valor hipotético ( μ≠4).

Los resultados arrojados por las pruebas hipótesis estadísticos fueron los siguientes:

Estadístico t: t = −17.809
Grados de libertad: 476.
Valor-p: p <2.2×〖10〗^(-16) (prácticamente 0).
Intervalo de confianza al 95% para la media: [2.992, 3.192]
Media muestral: x ̅=3.092.

Análisis de resultados.

Dado que el valor-p es mucho menor que 0.05, se rechaza la hipótesis nula H0; esto quiere decir que hay evidencia estadísticamente significativa para concluir que la media de la variable estrato no es igual al valor hipotético de 4.
El intervalo de confianza se encuentra entre 2.992 y 3.192, lo cual refuerza la conclusión de que la media verdadera no es igual a 4.
Por último, el estadístico t = -17.809 indica que la media muestral está por debajo del valor hipotético. Este valor es extremadamente alto en magnitud, lo que también sugiere que la media de la población es diferente de 4.

Conclusión: Con base en el análisis se rechaza la hipótesis nula H0. Hay suficiente evidencia para afirmar que la media poblacional de la variable estrato no es igual al valor hipotético de 4. En cambio, los resultados sugieren que la media real está más cerca de 3.092, según la muestra analizada.

6.1.1.2 Análisis de la prueba de hipótesis para la varianza.

Planteamiento de hipótesis:

Se realizó una prueba de hipótesis para analizar la varianza de la variable cuantitativa estrato.

Las hipótesis planteadas fueron las siguientes:

Hipótesis nula (H0) = La varianza de la variable estrato es igual al valor hipotético (σ2=1.5).
Hipótesis alternativa (H1)= La varianza de la variable estrato no es igual al valor hipotético (σ2=1.5).

Resultados obtenidos:

Los resultados de la prueba fueron los siguientes:

Varianza= 1.239372
Estadístico χ2^2: 393.2942
Grados de libertad: 476
Valor-p= 0.00463

Análisis de resultados:

El valor-p obtenido (0.00463) es menor que el nivel de significancia comúnmente utilizado (0.05). Esto indica que hay evidencia estadísticamente significativa para rechazar la hipótesis nula.
El alto valor estadístico χ2^2 sugiere que existe una diferencia notable entre la varianza observada y la hipotética, considerando los grados de libertad de la muestra.
La varianza observada es menor que la varianza hipotética. Esto implica que la variabilidad en la variable estrato es menor de lo esperado según el valor hipotético planteado.

Conclusión:

Dado que el valor-p es menor a 0.05, se rechaza la prueba de hipótesis nula H0. Por lo tanto, existe suficiente evidencia para concluir que la varianza de la variable estrato no es igual al valor hipotético de 1.5. Los resultados sugieren que la varianza verdadera está más cerca de 1.239, de acuerdo a los datos muestrales.

Además, las figuras implementadas (Figura 15) y (Figura 16) refuerzan esta interpretación de los resultados, al proporcionar una visualización clara de cómo se distribuyen los datos en relación con la media. En particular, el gráfico muestra que la media de la variable estrato es de 3.09, lo que significa que la mayoría de los valores observados en la muestra se concentran cerca de este valor. Esta visualización no solo facilita la comprensión de la dispersión y centralidad de los datos, sino que también proporciona una herramienta clave para confirmar la conclusión final de que la varianza de la variable estrato difiere del valor hipotético propuesto.

Este análisis no solo ha permitido validar la hipótesis estadística, sino que también ha ofrecido una mejor comprensión de la distribución de los estratos socioeconómicos, lo que puede ser útil para futuras investigaciones o decisiones basadas en la segmentación del mercado inmobiliario en Bogotá.

Figura 15: Gráficos de la media y desviación estándar de estrato

Figura 16: Gráficos de la media y desviación estándar de estrato

6.1.2 Prueba de hipótesis para la proporción de la variable estrato.

6.1.2.1 Análisis de proporción de la variable estrato.

Planteamiento de hipótesis.

Se realizó una prueba de hipótesis para evaluar se la proporción de inmuebles en el estrato 3 es igual al 30%. Las hipótesis fueron las siguientes:

Hipótesis nula (H0): La proporción de inmuebles en el estrato 3 es igual al 30% (p=0.3).
Hipótesis alternativa (H1): La proporción de inmuebles en el estrato 3 es diferente al 30% (p≠0.3).

Resultados de la prueba de proporciones.

Estadístico X^2= 8.0519
Grados de libertad: 1
Valor-p: 0.004546
Intervalo de confianza al 95% para la proporción: [0.318, 0.406]
Proporción observada: 0.361

Análisis de resultados de proporción

El valor-p obtenido (0.004546) es menor que el nivel de significancia comúnmente utilizado (0.05), esto indica que hay suficiente evidencia estadística para rechazar la hipótesis nula (H0).
El intervalo de confianza al 95% para la proporción de inmuebles en el estrato 3 no incluye el valor propuesto en la hipótesis nula (p=3), lo que refuerza su rechazo.
La proporción estimada de inmuebles en el estrato 3 es aproximadamente 0.361 (36.1%), lo que está fuera del rango esperado bajo la hipótesis nula.

Análisis de las gráficas

La figura (Figura 17), que corresponde a un diagrama de torta, muestra claramente que la mayor parte de la población se concentra en los estratos 2 y 3, con una proporción particularmente destacada para el estrato 3, que representa aproximadamente el 36% del total. Este hallazgo refuerza la idea de que los estratos 2 y 3 son los más representativos dentro de la muestra.

Por otro lado, el diagrama de barras (Figura 18), similar al gráfico anterior, también evidencia que el estrato 3 tiene la mayor proporción. Este gráfico confirma lo observado previamente, respaldando los resultados obtenidos a través de los estadísticos, lo que refuerza la conclusión de que el estrato 3 tiene un porcentaje significativo en la distribución de la muestra.

Conclusión: Con base a los resultados y al análisis anterior, se rechaza la hipótesis nula (H0), debido al valor-p y el intervalo de confianza. Esto implica que la proporción de inmuebles en el estrato 3 es significativamente diferente al 30%. La proporción observada se encuentra en el rango del 31.8% al 40.6%, con un valor estimado de 36.1%.

Figura 17: Gráficos de la proporción de estrato

Figura 18: Gráficos de la proporción de estrato

6.2 Precio y tipo de inmueble

6.2.1 Prueba de hipótesis de diferencia de medias y la razón de varianza.

6.2.1.1 Análisis de la prueba de hipótesis para la media.

Planteamiento de hipótesis:

Se planteó una prueba de hipótesis para comparar las medias de los precios entre los tipos de inmuebles “Casa” y “Apartamento”. Las hipótesis fueron las siguientes:

Hipótesis nula (H0)= La media del precio de las casas es menor que o igual a la media del precio de los apartamentos (μCasas ≤ μApartamentos).
Hipótesis alternativas (H1) = La media del precio de las casas es mayor que la media del precio de los apartamentos (μCasas> μApartamentos).

Resultados de la prueba t de student:

Estadístico t de student: -0.40371.
Grados de libertad: 450.
Valor-p: 0.6866.
Intervalo de confianza al 95% para la diferencia de medias: [-213656825, 140834843]
Media del precio de las casas: 222804333
Media del precio de los apartamentos: 259215324.

Análisis de resultados para las medias.

El valor-p obtenido (0.6866) es considerablemente mayor al nivel de significancia comúnmente usado (0.05), lo que indica que no hay evidencia estadística suficiente para rechazar la hipótesis nula H0. Esto sugiere que no se puede concluir que la media del precio de las casas sea mayor que la de los apartamentos.
El intervalo de confianza incluye el valor 0, lo que refuerza la posibilidad de que la diferencia de medias podría no sea estadísticamente significativa.

Conclusión: Con base en los resultados de la prueba t de Student, no se puede afirmar que exista una diferencia significativa en los precios promedio entre casas y apartamentos. En términos estadísticos, los precios promedio de ambos tipos de inmuebles son similares.

6.2.1.2 Análisis de la prueba de hipótesis para la varianza.

Planteamiento de hipótesis:

Se realizó una prueba de hipótesis para evaluar si las varianzas de los precios de las casas y apartamentos son iguales. Las hipótesis planteadas fueron las siguientes:

Hipótesis nula (HO) = Las varianzas son iguales (σ^2 Casas= σ^2 Apartamentos)
Hipótesis alternativa (H1) = Las varianzas son diferentes (σ^2 Casas≠ σ^2 Apartamentos)

Resultados de la prueba F de Fisher:

Valor-p = 0.839
Estadístico F = 0.5449
Intervalo de confianza al 95% para el cociente de varianzas = [0.146 , 21.505]

Análisis de resultados para las varianzas:

El valor-p obtenido (0.839) es considerablemente mayor al nivel de significancia comúnmente utilizado (0.05). Esto indica que no se dispone de suficiente evidencia estadística para rechazar la hipótesis nula (H0). Por lo tanto, se concluye que no hay diferencias significativas entre las varianzas de los precios de las casas y los apartamentos.
El intervalo de confianza al 95% para el cociente de varianzas incluye el valor 1, lo que refuerza la idea de que las varianzas pueden considerarse iguales en términos estadísticos.

Análisis de la gráfica:

El boxplot utilizado para representar la comparación de precios según el tipo de inmueble (Figura 19) revela que los precios de los inmuebles se agrupan en rangos bastante similares, con la excepción de algunos valores atípicos. Sin embargo, este gráfico confirma la hipótesis de que, en general, los precios de los distintos tipos de inmuebles son similares, lo que se refleja en la estrecha variabilidad de los precios dentro de cada categoría.

Conclusión:

Los resultados sugieren que las varianzas de los precios entre casas y apartamentos son estadísticamente similares. Este hallazgo es consistente con la suposición de igualdad de varianzas utilizada previamente en la prueba t de Student para comparar las medias. La confirmación de esta igualdad refuerza la validez de los resultados obtenidos en ese análisis.

NULL

Figura 19: Boxplot de precios por tipo de inmueble

6.2.2 Prueba de hipótesis para la proporción de los precios según el tipo de inmueble.

6.2.2.1 Análisis de proporción de la proporción de los precios según el tipo de inmueble.

Planteamiento de hipótesis:

Se llevó a cabo una prueba de hipótesis para comparar las proporciones de inmuebles con precio superior al promedio entre los tipos de inmueble “Casa” y “Apartamento”. Las hipótesis con las siguientes:

Hipótesis nula (H0): Las proporciones de inmuebles con precios altos son iguales entre casa y apartamentos (p1 = p2)
Hipótesis alternativas(H1): Las proporciones de inmuebles con precios altos son diferentes entre casas y apartamentos (p1≠p2).

Resultados de la prueba de proporciones.

Estadístico X^2= 1.9799 ×〖10〗^(-30)
Grados de libertad= 1
Valor-p= 1
Intervalo de confianza al 95% para la diferencia de proporciones= [-0.639, 0.535]
Proporciones observadas =
- Casas= p1= 0.3333 (33.33% de las casas tienen precio alto).
- Apartamentos= p2= 0.385 (38.5% de los apartamentos tienen precio alto).

Análisis de resultados:

El valor-p obtenido es 1, mayor al nivel de significancia comúnmente utilizado (0.05). Esto indica que no hay evidencia suficiente para rechazar la hipótesis nula (H0).
El intervalo de confianza incluye el valor 0, lo que refuerza que no se puede concluir una diferencia estadísticamente significativa entre las proporciones de inmueble con precio alto en casas y apartamentos.
A pesar de que la proporción de inmuebles con precio alto es ligeramente mayor en apartamentos (38.5%) que en casas (33.3%). La diferencia no es estadísticamente significativa.
Se emitió un aviso indicando que la aproximación del estadístico χ2 podría no ser precisa debido a tamaños de muestra pequeños o desequilibrios en los datos. Esto sugiere interpretar los resultados con precaución y considerar métodos alternativos para una validación más robusta, como simulaciones o pruebas exactas.

Análisis de la gráfica

El diagrama de barras apiladas (Figura 20) muestra que los precios elevados de apartamentos, casas y casas en conjunto cerrado se encuentran en rangos muy similares. Este hallazgo respalda la conclusión de que no se rechazó la hipótesis nula, ya que los precios de los inmuebles no difieren significativamente según el tipo de propiedad, evidenciando que son comparables en términos de precio independientemente de su clasificación.

Conclusión: De acuerdo al valor-p y al intervalo de confianza, no se rechaza la hipótesis nula (H0). Esto implica que no se encontró evidencia suficiente para concluir que las proporciones de inmuebles con precios altos sean diferentes entre casa y apartamentos. Estadísticamente, ambas proporciones pueden considerarse similares. Esto sugiere que el tipo de inmueble no es un factor determinante para que un inmueble tanga un precio superior al promedio.

Figura 20: Proporciones de precio por tipo de inmueble

7 Conclusiones

El análisis estadístico realizado permitió obtener respuestas precisas y fundamentadas sobre las características de los inmuebles estudiados. En relación con el precio promedio entre casas y apartamentos, los resultados demuestran que no existen diferencias significativas. La prueba de Fisher, con un estadístico F de 0.5449 y un intervalo de confianza para el cociente de varianzas ([0.146, 21.505]), confirma que los precios medios de ambos tipos de inmuebles son comparables, eliminando cualquier percepción inicial de disparidad.

En cuanto a los inmuebles remodelados, se observó que el 44.87% del total han sido remodelados, reflejando una característica importante del mercado inmobiliario. Aunque no se evaluaron diferencias entre estratos socioeconómicos, este porcentaje sugiere una distribución homogénea que podría explorarse con mayor profundidad. Por otro lado, los datos revelan que no hay diferencias significativas en la varianza de los precios entre inmuebles remodelados y no remodelados, lo que indica que el estado de remodelación no influye considerablemente en la dispersión de los precios.

Además, el análisis confirma que la proporción de inmuebles remodelados supera ampliamente el 30%, destacándose con un porcentaje del 44.87%. Este hallazgo subraya la relevancia de las remodelaciones como una tendencia importante en el mercado estudiado.

Finalmente, este trabajo pone en evidencia la importancia de complementar el análisis visual con herramientas estadísticas rigurosas. Mientras que las gráficas iniciales pueden sugerir ciertos patrones o diferencias, las pruebas estadísticas nos permiten validar o refutar estas percepciones con precisión matemática. Este enfoque no solo ayuda a obtener conclusiones más confiables, sino que también evita malinterpretaciones basadas en observaciones superficiales. Así, la combinación de métodos descriptivos, gráficos y estadísticos se consolida como una herramienta indispensable para alcanzar una comprensión profunda y objetiva de cualquier fenómeno.

Referencias

Komsta, Lukasz, y Frederick Novomestky. 2022. «moments: Moments, Cumulants, Skewness, Kurtosis and Related Tests». https://CRAN.R-project.org/package=moments.

Poncet, Paul. 2019. «modeest: Mode Estimation». https://CRAN.R-project.org/package=modeest.

Wickham, Hadley. 2016. «ggplot2: Elegant Graphics for Data Analysis». https://ggplot2.tidyverse.org.