Texas Realty Insights

Analisi statistica e visuale del mercato immobiliare texano

Luca Bennardo

12 ottobre 2025


Step 1 – Analisi delle variabili

In questa sezione vengono descritte le principali variabili del dataset Texas Realty, specificandone la natura statistica e il ruolo funzionale all’interno del modello di analisi.

Descrizione delle variabili del dataset Texas Realty
Variabile Tipo statistico Ruolo nel modello
city Qualitativa nominale (categorica) Dimensione (Città)
year Quantitativa discreta (tempo: anno) Dimensione temporale (Anno)
month Quantitativa discreta (tempo: mese) Dimensione temporale (Mese)
sales Quantitativa discreta (conteggio di vendite) Misura di domanda (Vendite)
volume Quantitativa continua (valore monetario totale in milioni di $) Misura monetaria (Valore complessivo delle vendite)
median_price Quantitativa continua (valore in $) Misura di prezzo (Prezzo mediano)
listings Quantitativa discreta (conteggio di annunci) Misura di offerta (Numero di annunci attivi)
months_inventory Quantitativa continua (mesi, tempo medio di smaltimento scorte) Indicatore di equilibrio (Tempo di saturazione del mercato)

Step 2 – Indici di posizione, variabilità e forma

In questa sezione vengono analizzati gli indici descrittivi delle variabili quantitative del dataset, comprendendo misure di posizione (media, mediana), di dispersione (deviazione standard, varianza) e di forma (asimmetria, curtosi).
Per ciascuna variabile viene inoltre fornito un breve commento interpretativo sulla distribuzione dei dati.

Indici descrittivi per le variabili quantitative del dataset Texas Realty
Variabile Media Mediana SD Varianza Asimmetria Curtosi Commento
sales 192,29 175,50 79,65 6.344,30 0,72 2,69 bassa dispersione, asimmetria positiva (coda a destra), platicurtica (piatta)
volume 31,01 27,06 16,65 277,27 0,88 3,18 alta dispersione, asimmetria positiva (coda a destra), leptocurtica (concentrata)
median_price 132.665,42 134.500,00 22.662,15 513.572.983,09 -0,36 2,38 bassa dispersione, distribuzione simmetrica, platicurtica (piatta)
listings 1.738,02 1.618,50 752,71 566.568,97 0,65 2,21 bassa dispersione, asimmetria positiva (coda a destra), platicurtica (piatta)
months_inventory 9,19 8,95 2,30 5,31 0,04 2,83 bassa dispersione, distribuzione simmetrica, platicurtica (piatta)

Step 3 – Variabilità e asimmetria

In questa sezione vengono analizzati gli indici di variabilità e di forma delle principali variabili quantitative del dataset.
In particolare, si identificano le variabili con la maggiore dispersione (varianza) e con il più alto livello di asimmetria (skewness assoluta).

Indici di variabilità e forma delle variabili quantitative
Variabile Media SD Varianza Asimmetria Curtosi Coeff. variazione
sales 192,29 79,65 6.344,30 0,72 2,69 41,42 %
volume 31,01 16,65 277,27 0,88 3,18 53,71 %
median_price 132.665,42 22.662,15 513.572.983,09 -0,36 2,38 17,08 %
listings 1.738,02 752,71 566.568,97 0,65 2,21 43,31 %
months_inventory 9,19 2,30 5,31 0,04 2,83 25,06 %
Sintesi: variabili più variabili e più asimmetriche
Criterio Variabile Metrica Valore Commento
Massima variabilità median_price Varianza 513.572.983,09 Variabile con dispersione più elevata (maggiore variabilità).
Massima asimmetria (|skew|) volume Asimmetria 0,88 Asimmetria positiva (coda a destra).

Step 4 – Distribuzioni per classi e indici di Gini

In questa sezione viene analizzata la distribuzione della variabile median_price attraverso la suddivisione in classi di valori, con l’obiettivo di evidenziare la concentrazione e la disuguaglianza dei prezzi mediani.
Sono calcolati sia l’indice di Gini discreto (basato sulla distribuzione per classi) sia quello continuo (basato sui dati originali).
Un valore di Gini pari a 0 indica perfetta uguaglianza, mentre valori prossimi a 1 indicano forte concentrazione.

Distribuzione per classi di median_price
Classe Frequenza Percentuale_fmt
70000 - 80000 1 0,42 %
80000 - 90000 8 3,33 %
90000 - 100000 15 6,25 %
100000 - 110000 23 9,58 %
110000 - 120000 18 7,50 %
120000 - 130000 26 10,83 %
130000 - 140000 48 20,00 %
140000 - 150000 40 16,67 %
150000 - 160000 40 16,67 %
160000 - 170000 14 5,83 %
170000 - 180000 7 2,92 %
Indici di Gini discreto e continuo
Variabile Gini discreto Gini continuo
median_price 0,87 0,10
Distribuzione per classi di median_price

Distribuzione per classi di median_price


Step 5 – Probabilità di eventi

In questa sezione vengono calcolate le probabilità empiriche di alcuni eventi elementari del dataset Texas Realty.
Le probabilità sono stimate come frequenze relative, cioè come rapporto tra il numero di casi favorevoli e il numero totale di osservazioni.
I valori riportati rappresentano quindi stime sperimentali della probabilità che un evento si verifichi nel periodo osservato.

Probabilità empiriche di eventi elementari
Evento Probabilità
City = Beaumont 25,00 %
Mese = Luglio 8,33 %
Mese = Dicembre 2012 1,67 %
Prezzo mediano > 200.000 $ 0,00 %
Inventario < 5 mesi 4,17 %

Step 6 – Nuove variabili derivate

In questa sezione vengono introdotte tre nuove variabili derivate dal dataset originale, con l’obiettivo di sintetizzare informazioni economiche e operative sul mercato immobiliare texano:

  • avg_price_est : prezzo medio stimato per transazione, calcolato come rapporto tra volume totale di vendita e numero di vendite;
  • conv_rate : tasso di conversione, dato dal rapporto tra vendite e annunci attivi;
  • eff_index : indice di efficienza, calcolato come rapporto tra il tasso di conversione e la scorta media (months_inventory).

Un valore elevato di eff_index indica un mercato più dinamico e con un turnover più rapido.

Medie delle nuove variabili derivate
Prezzo_medio_stimato Tasso_conversione Indice_efficienza
154.320,37 11,87 % 1,51 %

Step 7 – Analisi condizionata (Anno × Mese × Città)

In questa sezione vengono calcolate statistiche descrittive per ogni combinazione di Anno × Mese × Città.
Per ciascuna variabile numerica sono inoltre presentati due grafici: 1. un grafico a barre per confrontare i valori medi tra le città;
2. un grafico a linee per mostrare l’evoluzione temporale mensile.

Medie per città e totale complessivo
city sales volume median price listings months inventory avg price est conv rate eff index
Beaumont 177,38 26,13 129.988,33 1.679,32 9,97 146.640,41 0,11 0,01
Bryan-College Station 205,97 38,19 157.488,33 1.458,13 7,66 183.534,29 0,15 0,02
Tyler 269,75 45,77 141.441,67 2.905,05 11,32 167.676,76 0,09 0,01
Wichita Falls 116,07 13,93 101.743,33 909,58 7,82 119.430,00 0,13 0,02
Totale 192,29 31,01 132.665,42 1.738,02 9,19 154.320,37 0,12 0,02

Step 8 – Visualizzazioni sintetiche con ggplot2

In questa sezione vengono generate cinque visualizzazioni sintetiche tramite ggplot2, per analizzare la stagionalità, la distribuzione e la dinamica del mercato immobiliare texano.


Step 9 – Conclusioni

L’analisi storica del mercato immobiliare texano (2010–2014) evidenzia una crescita costante delle vendite e un incremento del volume totale del mercato.
Le città analizzate mostrano andamenti differenti: alcune con prezzi medi elevati ma volumi inferiori, altre più dinamiche ma con valori più contenuti.

Tra le variabili quantitative, listings e sales mostrano maggiore variabilità, mentre median_price risulta più stabile.
L’indice di eterogeneità di Gini (≈ 0.87) conferma disomogeneità nei prezzi mediani e una segmentazione geografica del mercato.

Valori più elevati di eff_index si riscontrano in città con domanda co**_**

Indicatori medi per città (2010–2014)
city Vendite_medie Prezzo_medio Efficienza_media
Tyler 269,75 141.441,67 0,88 %
Bryan-College Station 205,97 157.488,33 2,39 %
Beaumont 177,38 129.988,33 1,13 %
Wichita Falls 116,07 101.743,33 1,66 %