Autor
Francisco Guijarro
Catedrático de Universidad (profesor funcionario a tiempo completo)
Universidad Politécnica de Valencia
Conocer y manejar conceptos como población, muestra, estadísticos descriptivos, función de distribución, análisis de regresión, etc., que deben ser de uso común para el profesional que trabaja en el campo de la valoración.
Profundizar en las técnicas estadísticas de valoración con especial énfasis en los aspectos prácticos y de manejo de herramientas. Aunque no se profundice en sus aspectos matemáticos más rigurosos, se incide en el conocimiento y uso de aquellas técnicas estadísticas que pueden ser soportadas en la práctica profesional y que mejoran la precisión y exactitud de los informes de valoración.
Saber aplicar los diferentes pasos a seguir para aplicar un modelo de valoración econométrico: selección de comparables, identificación de las variables relevantes, transformación de variables, eliminación de outliers, validación de modelos, obtención de modelos de valoración finales.
Desarrollar diferentes ejercicios prácticos sobre casos reales de valoración inmobiliaria, preferentemente en el mercado inmobiliario colombiano y con datos lo más actualizado posible. Considerar el mayor subconjunto de variables explicativas del precio posible para estudiar la importancia relativa de cada una de ellas.
A modo de resumen, éste intenta ser un curso de Estadística para no estadísticos, con un énfasis total al ámbito de la valoración inmobiliaria.
\(~\)
A la hora de aplicar un modelo de valoración econométrico necesitamos cubrir dos elementos básicos:
Datos. Los modelos estadísicos son intensivos en información. Necesitan gran cantidad de datos para extraer la máxima información de la relación existente entre las variables, por lo que es importante tener el máximo número de variables que puedan explicar el precio, así como un número elevado de inmuebles que sirvan como testigos para configurar el modelo econométrico. Ésta es una diferencia muy importante respecto de los métodos tradicionales de valoración inmobiliaria, como el método de homogeneización, donde el precio del activo problema se estima a partir de un número muy limitado de testigos y, por lo general, también de un número limitado de variables explicativas. ¿Cuál de los métodos es mejor?
Software. Aplicar un modelo econométrico no está al alcance de cualqueir software. Por ejemplo, la hoja de cálculo Excel incorpora incorpora algunos elementos de cálculo como el análisis de correlaciones o el modelo de regresión, pero tiene serias limitaciones en otros aspectos como correlaciones pareadas, detección de atípicos, análisis de multicolinealidad, análisis factorial, etc. Los modelos estadísticos se encuentran implementados en diferentes programas, como los que aparecen a continuación:
\(~\)
Excel es la hoja de cálculo más popular, y que tiene múltiples aplicaciones en el ámbio de la valoración. Puede ser, por ejemplo, la herramienta básica para aplicar el método de homogoneización, o realizar una valoración inmobiliaria multicriterio.
También incorpora un número importante de funciones estadísticas y herramientas gráficas que pueden emplearse para calcular algunos estadísticos básicos y representar la distribución de las variables. Incluso puede llevarse a cabo un modelo econométrico a través de la herramienta Análisis de Datos.
Sin embargo, tiene importantes limitaciones que impiden sacar todo el provecho del potencial que incorporan los métodos econométricos.
Por último, el análisis gráfico es muy inferior al ofrecido por otros paquetes de software.
Figura 1. Imagen de la hoja de cálculo Excel. Ejemplo de apartamentos en Bogotá, representación gráfica del valor de venta frente a la superficie construida
\(~\)
SPSS es un software diseñado para el análisis estadístico de datos, con un formato similar al de la hoja de datos Excel, y con una gran variedad de análisis estadísticos accesibles a través del menú.
En la siguiente imagen aparece el visor de datos de SPSS. El ejemplo incluye apartamentos de la ciudad de Bogotá. Vemos cómo los inmuebles se colocan por filas, mientras que las variables aparecen en las columnas (nombre_comun_barrio, nombre_barrio_catastral, estrato, valor_de_venta, area_construida, etc), de forma análoga a como se presentan en una hoja de cálculo.
En la parte superior se encuentra el menú con diferentes opciones tantos estadísticas como gráficas.
Pregunta
1¿Sabes a qué se corresponden las siglas SPSS?
\(~\)
Figura 2. Imagen del visor de datos de SPSS. Ejemplo de apartamentos en Bogotá
\(~\)
Una alternativa a SPSS es Stata, que también sigue un esquema similar en cuanto a presentación de los datos y modelos estadísticos disponibles:
Figura 3. Imagen del visor de datos de Stata
\(~\)
El software RStudio incluye un amplísimo abanico de análisis estadísticos, incluyendo los modelos de inteligencia artificial más recientes.
El principal inconveniente de este software es el grado de dificultad en su manejo. A diferencia de SPSS, los análisis no están disponible a través del menú, sino que el usuario debe programarlos empleando el lenguaje de programación R.
Aunque se trata de un software mucho más potente que SPSS que permite diseñar modelos de valoración automatizados de gran nivel, la dificultad en la programación hace que no sea aconsejable para el valorador profesional, salvo que disponga de conocimientos avanzados de programación.
Sí puede resultar de gran utilidad para las sociedades de tasación, ejerciendo labores de tasador de control, creación de informes automatizados, etc.
Figura 4. Imagen del programa RStudio. Ejemplo de código utilizado para analizar apartamentos
\(~\)
Debemos dedicar tiempo al análisis preliminar de los datos, lo que incluye la depuración de los mismos y la transformación de aquellas variables que puedan ayudar a los modelos a optimizar la búsqueda de la función de valoración.
Algunas de estas tareas previas serán:
Eliminación de aparamentos repetidos.
Transformación de variables tipo texto a variables numéricas, que sí pueden tratarse en un modelo econométrico.
Identificación y eliminación de apartamentos atípicos.
La información que obtengamos sobre la muestra puede dividirse en 3 grandes bloques:
Figura 5. Los 3 grandes bloques en que podremos agrupar la información obtenida sobre los inmuebles
\(~\)
Una de las críticas que se realiza al modelo econométrico es que resulta más complicado en su elaboración que, por ejemplo, el método de homogeneización:
Figura 6. Ejemplo de tabla de homogeneización para la valoración de un inmueble
\(~\)
Sin embargo, el método de homogeneización presenta algunas limitaciones, que podemos repasar a través del anterior ejemplo:
Al emplear muy poco testigos (o muestras en el argot valorativo), el resultado obtenido puede ser muy dependiente de lo acertados o no que hayamos estado a la hora de elegir estos testigos.
También podemos encontranos con mala praxis en la elección de los testigos. Por ejemplo, seleccionar únicamente aquellos que tienen un valor muy similar entre sí. Al combinar sus precios, y precisamente por esa semejanza, obtendremos un valor muy parecido al de los testigos.
La comparación del inmueble a valorar con cada uno de los testigos y para cada una de las variables puede resultar subjetiva. ¿Cómo determinar, de forma objetiva, si los acabados del inmueble problema son peor - igual - mejor que los de un testigo?
También puede resultar subjetiva la distinta importancia que demos a los testigos o a las variables utilizadas en el método.
Entre las ventajas del modelo econométrico está la superación de estos inconvenientes, haciendo que el proceso sea más objetivo y transparente, aún a costa de una mayor complejidad en su obtención.
\(~\)
Obtener un modelo de valoración economético no sólo puede resultar complejo, sino que además puede llevar mucho más tiempo. Desde la obtención de la muestra, que es mucho más amplia que la que emplearíamos en el método de homogeneización, hasta el diseño y validación del propio modelo econométrico.
Por contra, una vez obtenidas las muestras y el modelo de valoración, éste nos puede servir para diferentes valoraciones en el futuro, con lo que el tiempo empleado en la recopilación de datos y diseño del modelo se puede amortizar en el tiempo.
\(~\)
Como se ha comentado con anterioridad, la aplicación de otros métodos de valoración puede llevarse a cabo mediante simples hojas de cálculo.
Sin embargo, para poder obtener todo el potencial de los modelos econométricos resulta aconsejable emplear algún tipo de software estadístico. Muchos de los estadísticos y análisis pueden llevarse a cabo igualmente con Excel, pero el proceso es más largo y tedioso, por lo que resulta recomendable emplear un programa como SPSS o Stata que, en el largo plazo, nos ahorrará mucho tiempo.
\(~\)
Como pasa en muchos otros ámbitos, la incorporación de nuevos paradigmas siempre lleva aparejado la aparición de resistencias. Resulta habitual escuchar argumentos del tipo “siempre se ha hecho de esta otra forma” para seguir defendiendo la utilización de metodologías tradicionales y resistirse a incorporar nuevos métodos y técnicas como los modelos multicriterio, el modelo econométrico o los modelos de valoración basados en la inteligencia artificial.
\(~\)
Ejercicio
2¿Significa lo anterior que debemos dejar de emplear el método de homogeneización?
\(~\)
En el ámbito estadístico nos referimos a la población como al conjunto de todas las observaciones de las que se puede obtener información para su posterior análisis.
La muestra, sin embargo, es un subconjunto de la población.
En ocasiones, no resulta posible obtener el conjunto completo de observaciones de la población, bien por imposibilidad técnica o porque supondría un coste excesivo. En estos casos es cuando resulta adecuado escoger una muestra de los mismos, de forma que sean un número suficiente como para poder aplicar las técnicas estadísticas deseadas y, así mismo, sea representativa de la población de la que se ha extraído.
https://www.idealista.com/venta-viviendas/madrid/barrio-de-salamanca/castellana/mapa-google
Figura 7. Mapa con detalle de la ciudad de Madrid y su oferta inmobiliaria. Fuente: www.idealista.com
\(~\)
Podemos asumir que el conjunto de variables que vamos a incluir en nuestros modelos estadísticos se pueden resumir en 3 grandes grupos:
\(~\)
Se definen a partir de diferentes categorías que no guardan orden entre sí. Habitualmente se emplean para definir atributos cualitativos de las viviendas. Ejemplos: orientación de la vivienda.
| Número de vivienda | Orientación |
|---|---|
| 1 | Este |
| 2 | Norte |
| 3 | Norte |
| 4 | Sur |
| 5 | Norte |
| 6 | Oeste |
\(~\)
Pueden venir representadas tanto por categorías como por valores numéricos, pero en este caso sí existe un orden entre dichas categorías o valores. Ejemplos: calidad acabados, entorno comercial, etc. También es habitual encontrarnos con variables originalmente numéricas, pero que se han transformado en categorías ordenadas (como la antigüedad).
| Número de vivienda | Calidad acabados | Antigüedad |
|---|---|---|
| 1 | Buena | Entre 0 y 5 años |
| 2 | Excelente | Entre 10 y 20 años |
| 3 | Buena | Entre 5 y 10 años |
| 4 | Normal | Entre 0 y 5 años |
| 5 | Excelente | Entre 0 y 5 años |
| 6 | Excelente | Entre 5 y 10 años |
\(~\)
Pregunta
3Siendo las dos variables ordinales, ¿cuál te parece más objetiva?
\(~\)
Son variables que vienen expresadas en forma de número. Ejemplos: superficie, número de dormitorios, número de parqueaderos, etc.
| Número de vivienda | Área construida | Número de parqueaderos |
|---|---|---|
| 1 | 80 | 0 |
| 2 | 100 | 1 |
| 3 | 120 | 2 |
| 4 | 98 | 1 |
| 5 | 220 | 1 |
| 6 | 75 | 2 |
\(~\)
Ejercicio
4Realizar la clasificación de las siguientes variables obtenidas del portal metrocuadrado en los 3 siguientes grupos: variables nominales o categóricas, variables ordinales y variables numéricas:
Valor de venta (ejemplo: $430.000.000)
Nombre del barrio catastral (El Dorado)
Área construida (87 \(m^2\))
Número de habitaciones (3)
Número de piso (3)
Tiempo de construido (entre 5 y 10 años)
Vigilancia (No)
Estudio o biblioteca (Sí)
Conjunto cerrado (No)
\(~\)
La distribución de los datos informa sobre cómo se distribuyen los mismos. En las variables numéricas, la distribución más habitual es la Distribución Normal.
Figura 8. Ejemplo de distribución normal
\(~\)
En el ámbito de la valoración inmobiliaria es habitual encontrarnos con situaciones en las que algunas variables numéricas no siguen una distribución típicamente normal, sino que presentan algunos sesgos.
Por ejemplo, suele ser habitual que el precio de venta, o la variable superficie, tengan colas muy alargadas a la derecha de la distribución, indicando que existen apartamentos con precios y superficies anormalmente grandes, mientras que la cola de la izquierda de la distribución está, como no podía ser de otro modo, acotada por el valor 0.
Figura 9. Distribución del valor de venta en los apartamentos de la ciudad de Bogotá
\(~\)
Figura 10. Distribución de la variable área construida en los aparamentos de la ciudad de Bogotá
\(~\)
Reduce la discrecionalidad. Esto es, evita que el valorador pueda sesgar los resultados de la valoración introduciendo alguna sobrevaloración o subvaloración, como veremos en un ejemplo posterior del método de homogeneización.
Dificultad para capturar relaciones no lineales -> Inteligencia artificial
Resultado más preciso, modelo más ajustado: el tratamiento masivo de datos posibilita una mejor acotación en la precisión de las estimaciones (medir errores).
Posibilidad de conocer la importancia relativa de cada variable en la explicación del precio de los inmuebles.
Sobreoptimización. Un número reducido de comparables, una estructura del modelo demasiado compleja, o la inclusión de variables no correlacionadas con el precio puede hacer que caigamos en la sobreoptimización, uno de los problemas más habituales al diseñar un modelo de de valoración basado en inteligencia artificial.
Figura 11. Ejemplo de sobreoptimización. Cómo ajustar una recta a tres puntos, y cómo ajustar un plano a esos mismos tres puntos
Pregunta
5Cuando pasamos de dos dimensiones (precio-superficie) a 3 dimensiones, ¿importa cuál sea la variable a la hora de hacer que los tres puntos pasen por un plano?
Podemos asumir que el precio de los inmuebles es lineal con la superficie de los mismos. Sin embargo, por lo general nos vamos a encontrar con situaciones donde esta relación no sea estrictamente lineal.
En concordancia con la ley económica de rendimientos marginales decrecientes, podemos pensar que la relación positiva entre precio y superficie tiende a decaer conforme aumenta el tamaño de las viviendas. Simplemente porque un consumidor no siempre va a estar dispuesto a pagar la misma cantidad por un incremento unitario en la superficie de la vivienda, sino que una vez cubierto cierto tamaño en la vivienda, tenderá a a asumir un menor valor por cada metro adicional en que se amplíe la superficie de la misma.
Esta idea viene representada en las siguientes imágenes (los siguientes datos fueron proporcionados por la sociedad de tasación Euroval):
Figura 12. Gráfico de dispersión entre las variables precio y superficie. Muestra construida por 1.900 apartamentos de segunda mano en la ciudad de Valencia, España. Fuente: elaboración propia a partir de datos de Euroval
Figura 13. Hipótesis de relación lineal
Figura 14. Relación no lineal
Figura 15. El precio unitario frente al número de baños
Figura 16. El precio unitario frente al número de baños
Figura 17. El precio unitario frente al número de baños
Figura 18. El precio unitario frente al número de baños