12 ottobre 2025
In questa sezione vengono descritte le principali variabili del dataset Texas Realty, specificandone la natura statistica e il ruolo funzionale all’interno del modello di analisi.
Variabile | Tipo statistico | Ruolo nel modello |
---|---|---|
city | Qualitativa nominale (categorica) | Dimensione (Città) |
year | Quantitativa discreta (tempo: anno) | Dimensione temporale (Anno) |
month | Quantitativa discreta (tempo: mese) | Dimensione temporale (Mese) |
sales | Quantitativa discreta (conteggio di vendite) | Misura di domanda (Vendite) |
volume | Quantitativa continua (valore monetario totale in milioni di $) | Misura monetaria (Valore complessivo delle vendite) |
median_price | Quantitativa continua (valore in $) | Misura di prezzo (Prezzo mediano) |
listings | Quantitativa discreta (conteggio di annunci) | Misura di offerta (Numero di annunci attivi) |
months_inventory | Quantitativa continua (mesi, tempo medio di smaltimento scorte) | Indicatore di equilibrio (Tempo di saturazione del mercato) |
In questa sezione vengono analizzati gli indici descrittivi delle
variabili quantitative del dataset, comprendendo misure di posizione
(media, mediana), di dispersione (deviazione standard, varianza) e di
forma (asimmetria, curtosi).
Per ciascuna variabile viene inoltre fornito un breve commento
interpretativo sulla distribuzione dei dati.
Variabile | Media | Mediana | SD | Varianza | Asimmetria | Curtosi | Commento |
---|---|---|---|---|---|---|---|
sales | 192,29 | 175,50 | 79,65 | 6.344,30 | 0,72 | 2,69 | bassa dispersione, asimmetria positiva (coda a destra), platicurtica (piatta) |
volume | 31,01 | 27,06 | 16,65 | 277,27 | 0,88 | 3,18 | alta dispersione, asimmetria positiva (coda a destra), leptocurtica (concentrata) |
median_price | 132.665,42 | 134.500,00 | 22.662,15 | 513.572.983,09 | -0,36 | 2,38 | bassa dispersione, distribuzione simmetrica, platicurtica (piatta) |
listings | 1.738,02 | 1.618,50 | 752,71 | 566.568,97 | 0,65 | 2,21 | bassa dispersione, asimmetria positiva (coda a destra), platicurtica (piatta) |
months_inventory | 9,19 | 8,95 | 2,30 | 5,31 | 0,04 | 2,83 | bassa dispersione, distribuzione simmetrica, platicurtica (piatta) |
In questa sezione vengono analizzati gli indici di variabilità e di
forma delle principali variabili quantitative del dataset.
In particolare, si identificano le variabili con la maggiore dispersione
(varianza) e con il più alto livello di asimmetria (skewness
assoluta).
Variabile | Media | SD | Varianza | Asimmetria | Curtosi | Coeff. variazione |
---|---|---|---|---|---|---|
sales | 192,29 | 79,65 | 6.344,30 | 0,72 | 2,69 | 41,42 % |
volume | 31,01 | 16,65 | 277,27 | 0,88 | 3,18 | 53,71 % |
median_price | 132.665,42 | 22.662,15 | 513.572.983,09 | -0,36 | 2,38 | 17,08 % |
listings | 1.738,02 | 752,71 | 566.568,97 | 0,65 | 2,21 | 43,31 % |
months_inventory | 9,19 | 2,30 | 5,31 | 0,04 | 2,83 | 25,06 % |
Criterio | Variabile | Metrica | Valore | Commento |
---|---|---|---|---|
Massima variabilità | median_price | Varianza | 513.572.983,09 | Variabile con dispersione più elevata (maggiore variabilità). |
Massima asimmetria (|skew|) | volume | Asimmetria | 0,88 | Asimmetria positiva (coda a destra). |
In questa sezione viene analizzata la distribuzione della variabile
median_price attraverso la suddivisione in classi di valori,
con l’obiettivo di evidenziare la concentrazione e la disuguaglianza dei
prezzi mediani.
Sono calcolati sia l’indice di Gini discreto (basato sulla distribuzione
per classi) sia quello continuo (basato sui dati originali).
Un valore di Gini pari a 0 indica perfetta uguaglianza, mentre valori
prossimi a 1 indicano forte concentrazione.
Classe | Frequenza | Percentuale_fmt |
---|---|---|
70000 - 80000 | 1 | 0,42 % |
80000 - 90000 | 8 | 3,33 % |
90000 - 100000 | 15 | 6,25 % |
100000 - 110000 | 23 | 9,58 % |
110000 - 120000 | 18 | 7,50 % |
120000 - 130000 | 26 | 10,83 % |
130000 - 140000 | 48 | 20,00 % |
140000 - 150000 | 40 | 16,67 % |
150000 - 160000 | 40 | 16,67 % |
160000 - 170000 | 14 | 5,83 % |
170000 - 180000 | 7 | 2,92 % |
Variabile | Gini discreto | Gini continuo |
---|---|---|
median_price | 0,87 | 0,10 |
Distribuzione per classi di median_price
In questa sezione vengono calcolate le probabilità empiriche di
alcuni eventi elementari del dataset Texas Realty.
Le probabilità sono stimate come frequenze relative, cioè come rapporto
tra il numero di casi favorevoli e il numero totale di
osservazioni.
I valori riportati rappresentano quindi stime sperimentali della
probabilità che un evento si verifichi nel periodo osservato.
Evento | Probabilità |
---|---|
City = Beaumont | 25,00 % |
Mese = Luglio | 8,33 % |
Mese = Dicembre 2012 | 1,67 % |
Prezzo mediano > 200.000 $ | 0,00 % |
Inventario < 5 mesi | 4,17 % |
In questa sezione vengono introdotte tre nuove variabili derivate dal dataset originale, con l’obiettivo di sintetizzare informazioni economiche e operative sul mercato immobiliare texano:
Un valore elevato di eff_index indica un mercato più dinamico e con un turnover più rapido.
Prezzo_medio_stimato | Tasso_conversione | Indice_efficienza |
---|---|---|
154.320,37 | 11,87 % | 1,51 % |
In questa sezione vengono calcolate statistiche descrittive per ogni
combinazione di Anno × Mese × Città.
Per ciascuna variabile numerica sono inoltre presentati due grafici: 1.
un grafico a barre per confrontare i valori medi tra le
città;
2. un grafico a linee per mostrare l’evoluzione
temporale mensile.
city | sales | volume | median price | listings | months inventory | avg price est | conv rate | eff index |
---|---|---|---|---|---|---|---|---|
Beaumont | 177,38 | 26,13 | 129.988,33 | 1.679,32 | 9,97 | 146.640,41 | 0,11 | 0,01 |
Bryan-College Station | 205,97 | 38,19 | 157.488,33 | 1.458,13 | 7,66 | 183.534,29 | 0,15 | 0,02 |
Tyler | 269,75 | 45,77 | 141.441,67 | 2.905,05 | 11,32 | 167.676,76 | 0,09 | 0,01 |
Wichita Falls | 116,07 | 13,93 | 101.743,33 | 909,58 | 7,82 | 119.430,00 | 0,13 | 0,02 |
Totale | 192,29 | 31,01 | 132.665,42 | 1.738,02 | 9,19 | 154.320,37 | 0,12 | 0,02 |
In questa sezione vengono generate cinque visualizzazioni sintetiche tramite ggplot2, per analizzare la stagionalità, la distribuzione e la dinamica del mercato immobiliare texano.
L’analisi storica del mercato immobiliare texano (2010–2014)
evidenzia una crescita costante delle vendite e un incremento del volume
totale del mercato.
Le città analizzate mostrano andamenti differenti: alcune con prezzi
medi elevati ma volumi inferiori, altre più dinamiche ma con valori più
contenuti.
Tra le variabili quantitative, listings e
sales mostrano maggiore variabilità, mentre
median_price risulta più stabile.
L’indice di eterogeneità di Gini (≈ 0.87) conferma disomogeneità nei
prezzi mediani e una segmentazione geografica del mercato.
Valori più elevati di eff_index si riscontrano in città con domanda co**_**
city | Vendite_medie | Prezzo_medio | Efficienza_media |
---|---|---|---|
Tyler | 269,75 | 141.441,67 | 0,88 % |
Bryan-College Station | 205,97 | 157.488,33 | 2,39 % |
Beaumont | 177,38 | 129.988,33 | 1,13 % |
Wichita Falls | 116,07 | 101.743,33 | 1,66 % |