setwd("~/Desktop/STATISTICA/R- project")
library(readr)
dati <- read_csv("Real Estate Texas.csv")
## Rows: 240 Columns: 8
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (1): city
## dbl (7): year, month, sales, volume, median_price, listings, months_inventory
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dim(dati)
## [1] 240 8
str(dati)
## spc_tbl_ [240 × 8] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ city : chr [1:240] "Beaumont" "Beaumont" "Beaumont" "Beaumont" ...
## $ year : num [1:240] 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
## $ month : num [1:240] 1 2 3 4 5 6 7 8 9 10 ...
## $ sales : num [1:240] 83 108 182 200 202 189 164 174 124 150 ...
## $ volume : num [1:240] 14.2 17.7 28.7 26.8 28.8 ...
## $ median_price : num [1:240] 163800 138200 122400 123200 123100 ...
## $ listings : num [1:240] 1533 1586 1689 1708 1771 ...
## $ months_inventory: num [1:240] 9.5 10 10.6 10.6 10.9 11.1 11.7 11.6 11.7 11.5 ...
## - attr(*, "spec")=
## .. cols(
## .. city = col_character(),
## .. year = col_double(),
## .. month = col_double(),
## .. sales = col_double(),
## .. volume = col_double(),
## .. median_price = col_double(),
## .. listings = col_double(),
## .. months_inventory = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
summary(dati)
## city year month sales
## Length:240 Min. :2010 Min. : 1.00 Min. : 79.0
## Class :character 1st Qu.:2011 1st Qu.: 3.75 1st Qu.:127.0
## Mode :character Median :2012 Median : 6.50 Median :175.5
## Mean :2012 Mean : 6.50 Mean :192.3
## 3rd Qu.:2013 3rd Qu.: 9.25 3rd Qu.:247.0
## Max. :2014 Max. :12.00 Max. :423.0
## volume median_price listings months_inventory
## Min. : 8.166 Min. : 73800 Min. : 743 Min. : 3.400
## 1st Qu.:17.660 1st Qu.:117300 1st Qu.:1026 1st Qu.: 7.800
## Median :27.062 Median :134500 Median :1618 Median : 8.950
## Mean :31.005 Mean :132665 Mean :1738 Mean : 9.193
## 3rd Qu.:40.893 3rd Qu.:150050 3rd Qu.:2056 3rd Qu.:10.950
## Max. :83.547 Max. :180000 Max. :3296 Max. :14.900
Struttura: 240 osservazioni e 8 variabili. Variabile city: qualitativa su scala nominale (4 modalità). Variabili year e month: quantitative discrete; creo nuova colonna “datetime”. Variabile sales: quantitativa discreta. Variabile volume: quantitativa continua Variabile median price: quantitativa continua. Variabile listings: quantitativa discreta. Variabile month inventory: quantitativa discreta.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
dati_new <- dati %>%
mutate(datetime= paste(dati$year,dati$month, sep = "-", collapse = NULL, recycle0 = FALSE))
attach(dati_new)
Calcolo indici solo per variabili quantitative. Per la variabile city genero tabella con distribuzione di frequenze e individuo il valore modale, se presente.
table(city)
## city
## Beaumont Bryan-College Station Tyler
## 60 60 60
## Wichita Falls
## 60
dim(dati_new)
## [1] 240 9
N=dim(dati_new)[1]
freq_ass <- table(city)
freq_rel <- table(city)/N
distr_freq_city<-cbind(freq_ass,freq_rel)
Variabile city: La variabile city presenta 4 modalità, le quali hanno la stessa frequenza. Quindi la distribuzione non ha un valore modale. Introduco le funzioni relative al Coefficente di Variazione e all’indice di Gini per le variabile quantitative che analizzo di seguito.Infine installo il package moments.
CV <- function(x){
return(sd(x)/mean(x)*100)}
gini.index <- function(x){
ni=table(x)
fi= ni/length(x)
fi2 = fi^2
J = length(table(x))
gini=1-sum(fi2)
gini.norm= gini/((J-1)/J)
return(gini.norm)}
install.packages("moments", repos = "http://cran.us.r-project.org")
##
## The downloaded binary packages are in
## /var/folders/24/tq3k976n3vj3y8z02m0rlr_r0000gn/T//Rtmpn9tiJ4/downloaded_packages
library(moments)
summary(sales)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 79.0 127.0 175.5 192.3 247.0 423.0
range(sales)
## [1] 79 423
IQR(sales)
## [1] 120
boxplot(sales)
var(sales)
## [1] 6344.3
sd(sales)
## [1] 79.65111
CV(sales)
## [1] 41.42203
gini.index(sales)
## [1] 0.998379
plot(density(sales))
skewness(sales)
## [1] 0.718104
kurtosis(sales)
## [1] 2.686824
Variabile Sales(numero totale di vendite):la variabile sales ha un range compreso tra 79 e 423 vendite mensili, un valore mediano di 175.5 e una media di 192.3 . Ha un indice di Gini di 0.99, quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Ha un coefficiente di variazione, e quindi un grado di variabilità dei dati attorno alla media, del 41%. Ha un indice di asimmetria di 0.7, quindi la distribuzione e asimmetrica positiva, e un indice di curtosi di 2.7, quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale.
summary(volume)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 8.166 17.660 27.062 31.005 40.893 83.547
range(volume)
## [1] 8.166 83.547
IQR(volume)
## [1] 23.2335
boxplot(volume)
var(volume)
## [1] 277.2707
sd(volume)
## [1] 16.65145
CV(volume)
## [1] 53.70536
gini.index(volume)
## [1] 0.9999484
plot(density(volume))
skewness(volume)
## [1] 0.884742
kurtosis(volume)
## [1] 3.176987
Variabile Volume(valore totale delle vendite):la variabile volume ha un range compreso tra 8.166 e 83.547 milioni di dollari , un valore mediano di 27.062 e una media di 31.005. Ha un indice di Gini di 0.99 , quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Ha un coefficiente di variazione, e quindi un grado di variabilità dei dati attorno alla media, del 54%. Ha un indice di asimmetria di 0.9, quindi la distribuzione e asimmetrica positiva, e un indice di curtosi di 3.2 , quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale.
summary(median_price)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 73800 117300 134500 132665 150050 180000
range(median_price)
## [1] 73800 180000
IQR(median_price)
## [1] 32750
boxplot(median_price)
var(median_price)
## [1] 513572983
sd(median_price)
## [1] 22662.15
CV(median_price)
## [1] 17.08218
gini.index(median_price)
## [1] 0.9992672
plot(density(median_price))
skewness(median_price)
## [1] -0.3645529
kurtosis(median_price)
## [1] 2.377038
Variabile median_price (prezzo mediano di vendita):la variabile median price ha un range compreso tra 73800 e 180000 dollari, un valore mediano di 134500 e una media di 132665. Ha un indice di Gini di 0.99 , quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Ha un coefficiente di variazione del 17%, quindi i suoi dati sono più concentrati attorno alla media rispetto alle altre variabili. Ha un indice di asimmetria di -0.4, quindi la distribuzione è asimmetrica negativa, e un indice di curtosi di 2.4, quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale.
summary(listings)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 743 1026 1618 1738 2056 3296
range(listings)
## [1] 743 3296
IQR(listings)
## [1] 1029.5
boxplot(listings)
var(listings)
## [1] 566569
sd(listings)
## [1] 752.7078
CV(listings)
## [1] 43.30833
gini.index(listings)
## [1] 0.9996201
plot(density(listings))
skewness(listings)
## [1] 0.6494982
kurtosis(listings)
## [1] 2.20821
Variabile listings (numero totale di annunci attivi): La variabile listings ha un range compreso tra 743 e 3296 annunci attivi mensili, un valore mediano di 1618 e una media di 1738. Ha un indice di Gini di 0.99 , quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Ha un coefficiente di variazione, e quindi un grado di variabilità dei dati attorno alla media, del 43%. Ha un indice di asimmetria di 0.6, quindi la distribuzione e asimmetrica positiva, e un indice di curtosi di 2.2, quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale. —
summary(months_inventory)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.400 7.800 8.950 9.193 10.950 14.900
range(months_inventory)
## [1] 3.4 14.9
IQR(months_inventory)
## [1] 3.15
boxplot(months_inventory)
var(months_inventory)
## [1] 5.306889
sd(months_inventory)
## [1] 2.303669
CV(months_inventory)
## [1] 25.06031
gini.index(months_inventory)
## [1] 0.9944444
plot(density(months_inventory))
skewness(months_inventory)
## [1] 0.04097527
kurtosis(months_inventory)
## [1] 2.825552
Variabile months inventory (quantità di tempo necessaria per vendere tutte le inserzioni correnti):la variabile months inventory ha un range compreso tra 3 e 15 mesi , un valore mediano e una media di 9 mesi. Ha un indice di Gini di 0.99 , quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Ha un coefficiente di variazione del 25%, quindi una bassa variabilità dei dati rispetto alla media. Ha un indice di asimmetria di 0.04, quindi la distribuzione è approssimativamente simmetrica (considendo anche la la prossimità dei valori di media e mediana), e un indice di curtosi di 2.8, quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale.
La variabile con la più alta variabilità è la variabile volume con un Coefficente di Variazione del 54%. La variabile con la distribuzione più asimmetrica è la variabile volume con un indice di asimmetria di 0.9.
volume_cl <- cut(dati_new$volume,
breaks = c(8.000,20.000,40.000,60.000,85.000))
freq_ass <- table(volume_cl)
freq_rel <- table(volume_cl)/N
NI <- cumsum(freq_ass)
FI <- NI/N
distr_freq_volumecl<-cbind(freq_ass,freq_rel, NI, FI)
Commento: Osservando la distribuzione di frequenze della variabile volume divisa in 4 classi, i valori si concentrano per il 74% nelle prime 2 classi e la classe modale è la seconda classe (20.000-40.000) la quale contiene il 41% delle osservazioni totali.
library(ggplot2)
ggplot(data= dati_new)+
geom_bar(
aes(x=volume_cl),
stat = "count",
col="black",
fill= "pink")+
labs(title= "Distribuzione delle classi di volume",
x="Volume in classi, mln $",
y="Frequenze assolute")+
theme_classic()
ggplot(data= dati_new)+
geom_bar(aes(x=volume_cl,
fill=city),
position = "fill",
stat = "count",
col="pink")+
labs(title= "Distribuzione delle classi di volume per città, normalizzato",
x="Volume in classi, mln $",
y="Frequenze relative")+
theme_classic()
v1 <- volume_cl
v2 <- city
frq_volumexcity <-table(v1,v2)
frq_volumexcity_tot <-addmargins(frq_volumexcity)
print(frq_volumexcity_tot)
## v2
## v1 Beaumont Bryan-College Station Tyler Wichita Falls Sum
## (8,20] 12 7 0 59 78
## (20,40] 45 30 23 1 99
## (40,60] 3 14 27 0 44
## (60,85] 0 9 10 0 19
## Sum 60 60 60 60 240
gini.index(volume_cl)
## [1] 0.9124537
Commento: la variabile ha un indice di Gini di 0.91 quindi un livello molto alto di concentrazione, quasi al limite della massima disuguaglianza. Introducendo poi la variabile city, osserviamo nel dettaglio la distribuzione delle città all’interno delle classi di volume. Beaumont ha come classe modale la seconda classe con il 75% delle osservazioni e il restante 20% nella prima classe di volume. Bryan-College Station ha una distribuzione più equilibrata con una classe modale, la seconda, in cui si concentrano il 50% delle osservazioni. Tyler è distribuita tra le ultime 3 classi di volume, con la seconda classe al 38% e la terza classe al 45%. Wichita Falls rientra al 98% nella prima classe 8-20 (con 59 osservazioni su 60).
frequenze <- table(city)
print(frequenze)
## city
## Beaumont Bryan-College Station Tyler
## 60 60 60
## Wichita Falls
## 60
prob_beaumont <- frequenze["Beaumont"] / length(city)
print(prob_beaumont)
## Beaumont
## 0.25
Commento: La probabilità di estrarre la modalità “Beaumont” è del 25%.
frequenze <- table(month)
print(frequenze)
## month
## 1 2 3 4 5 6 7 8 9 10 11 12
## 20 20 20 20 20 20 20 20 20 20 20 20
prob_luglio <- frequenze["7"] / length(month)
print(prob_luglio)
## 7
## 0.08333333
Commento: La probabilità di estrarre la modalità “luglio” è del 8%.
frequenze <- table(datetime)
print(frequenze)
## datetime
## 2010-1 2010-10 2010-11 2010-12 2010-2 2010-3 2010-4 2010-5 2010-6 2010-7
## 4 4 4 4 4 4 4 4 4 4
## 2010-8 2010-9 2011-1 2011-10 2011-11 2011-12 2011-2 2011-3 2011-4 2011-5
## 4 4 4 4 4 4 4 4 4 4
## 2011-6 2011-7 2011-8 2011-9 2012-1 2012-10 2012-11 2012-12 2012-2 2012-3
## 4 4 4 4 4 4 4 4 4 4
## 2012-4 2012-5 2012-6 2012-7 2012-8 2012-9 2013-1 2013-10 2013-11 2013-12
## 4 4 4 4 4 4 4 4 4 4
## 2013-2 2013-3 2013-4 2013-5 2013-6 2013-7 2013-8 2013-9 2014-1 2014-10
## 4 4 4 4 4 4 4 4 4 4
## 2014-11 2014-12 2014-2 2014-3 2014-4 2014-5 2014-6 2014-7 2014-8 2014-9
## 4 4 4 4 4 4 4 4 4 4
prob_dicembre2012 <- frequenze["2012-12"] / length(datetime)
print(prob_dicembre2012)
## 2012-12
## 0.01666667
Commento: La probabilità di estrarre la modalità “dicembre 2012” è dell’ 2%.
library(dplyr)
dati_new <- dati_new %>%
mutate(med_price_new = (volume/sales)*1000000)
Commento: ho creato una nuova colonna che calcoli il prezzo medio degli immobili disponibili.
dati_new <- dati_new %>%
mutate(list_efficiency = ((months_inventory/listings)*100)*100)
attach(dati_new)
## The following objects are masked from dati_new (pos = 5):
##
## city, datetime, listings, median_price, month, months_inventory,
## sales, volume, year
summary(list_efficiency)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 30.37 42.38 56.80 58.81 71.52 93.60
CV(list_efficiency)
## [1] 31.28903
plot(density(list_efficiency))
skewness(list_efficiency)
## [1] 0.4230854
kurtosis(list_efficiency)
## [1] 1.931897
#1. boxplot list_efficiency
boxplot(list_efficiency, main="Boxplot Efficacia annunci di vendita", xlab="Efficacia annunci, in %")
#2. boxplot list_efficiency & city
ggplot(dati_new)+
geom_boxplot(aes(
x=city,
y=list_efficiency))+
labs(title= "Distribuzione dell'efficienza annunci di vendita per città ",
x="Città",
y="Efficacia annunci, in %")+
theme_bw()
#3. boxplot list_efficiency & year
boxplot(list_efficiency~year, main="Boxplot Efficacia annunci di vendita per anno", xlab="Anno", ylab="Efficacia annunci, in %")
#4. boxplot city & listings
ggplot(dati_new)+
geom_boxplot(aes(
x=city,
y=listings))+
labs(title= "Distribuzione degli annunci attivi di vendita per città",
x="Città",
y="Annunci attivi di vendita")+
theme_bw()
#5. boxplot city & median price
ggplot(dati_new)+
geom_boxplot(aes(
x=city,
y=median_price))+
labs(title= "Distribuzione del prezzo mediano per città",
x="Città",
y="Prezzo mediano, in $")+
theme_bw()
#boxplot listings & year
boxplot(listings~year, main="Boxplot annunci attivi di vendita per anno", xlab="Anno", ylab="Annunci")
Commento: la variabile mostra un un minimo del 30% e un massimo del 93% di efficacia degli annunci, con il valore della media e della mediana molto prossimi tra il 57% e il 59%; ha un coefficiente di variazione, e quindi un grado di variabilità dei dati attorno alla media, del 31%. Inoltre, ha un indice di asimmetria di 0.4, quindi la distribuzione e asimmetrica positiva, e un indice di curtosi di 1.9, quindi è Leptocurtica, con una maggiore presenza di valori estremi e una forma più appuntita rispetto alla normale. Tuttavia guardando ai valori della media e della mediana, i quali sono molto prossimi, possiamo considerare la distribuzione approssimativamente simmetrica.
Introducendo la variabile city osserviamo che la variabilità in termini di efficacia degli annunci varia notevolmente, soprattutto per le città di Tyler e di Wichita Falls che si collocano ai due opposti (la prima con un valore mediano di circa il 40%, la seconda con un valore mediano di circa l’85%), mentre le altre due città si collocano intorno ai valori mediani della variabile (Bryan-College Station intorno al 52% circa e Beaumont intorno al 62% circa). Osservando però poi come gli annunci sono distribuiti sulle 4 città (variabile listings), si nota che la città di Tyler è la capofila per numero di annunci attivi con un valore mediano di circa 2875 annunci, mentre la città di Wichita Falls è l’ultima con un valore mediano inferiore ai 1000 annunci. Inoltre, osservando anche la variabile median_price per città, abbiamo la conferma della variabilità del prezzo mediano per città: Tyler ha un prezzo mediano di circa 140.000$ contro i 105.000$ circa di Wichita Falls. Dunque l’indice di efficacia riferito alla città di Wichita Falls potrebbe essere influenzato dal numero minore di annunci e dal prezzo medio minore rispetto alle altre 4 città, ma sarebbero necessarie ulteriori ricerche in merito.
Guardando invece alla variazione della variabile negli anni 2010-2014, vediamo un valore mediano che è passato dal 60% circa nel 2010 al 40% circa del 2014. Analizzando poi la variazione in termini di numeri di annunci nello stesso arco temporale, notiamo un trend di diminuzione degli annunci.
A. ANALISI PREZZO MEDIO PER CITTA’
ggplot(dati_new)+
geom_boxplot(aes(
x=city,
y=med_price_new))+
labs(title= "Distribuzione del prezzo medio per città",
x="Città",
y="Prezzo medio, in $")+
theme_bw()
Commento: in ordine decrescente, la capofila è la città di Bryan-College Station con un valore mediano di poco oltre 180.000$ e un valore massimo che supera i 210.000\(, segue la città di Tyler con un valore mediano di circa 170.000\) e un valore massimo di quasi 195.000\(; in terza posizione la città di Beaumont con un valore mediano di circa 145.000\), mentre a chiudere la distribuzione troviamo la città di Wichita Falls con un valore mediano di 120.000$.
B. ANALISI VENDITE PER CITTA’ E PER MESI
ggplot(data = dati_new)+
geom_col(aes(x=month,
y= sales,
fill=city))+
labs(title= "Analisi andamento vendite per mese (periodo 2010-2014)",
x="Mesi",
y="Vendite totali, per mese")
ggplot(data = dati_new)+
geom_col(aes(x=month,
y= sales,
fill=city),
position = "fill")+
labs(title= "Analisi andamento vendite per mese, per città",
x="Mesi",
y="Vendite, frequenze relative")
Commento: in termini assoluti sul periodo in esame, dal 2010 al 2014, si evidenzia un trend di crescita delle vendite graduale nei primi due mesi dell’anno, più pronunciata dal mese di marzo fino a raggiungere il picco nei mesi tra maggio e agosto. Successivamente si osserva un declino delle vendite che si mantiene relativamente stabile fino a dicembre. Il valore minimo si registra a gennaio con circa 2500 vendite, mentre il valore massimo si registra a giugno con circa 4800 vendite (il totale vendite mensile rappresentato in questo grafico è la somma degli anni 2010-2014).
Il trend è confermato analizzando le singole città, con l’eccezione di Wichita Falls che ha un andamento più lineare; dall’analisi degli annunci per città abbiamo però già osservato che la suddetta ha un numero minore di annunci rispetto alle altre 3 città texane. La prima città per numero di vendite è Tyler, seguita da Brain-College Station che nei mesi di picco ha vendite molto simili alla prima. Come già visto in precedenza, Tyler è la città con il maggior numero di annunci. Segue la città di Beaumont con un incremento nei mesi estivi ma con un piccolo decremento su luglio. In ultima posizione la città di Wichita Falls.
C. ANALISI ANDAMENTO VARIABILE SALES DURANTE GLI ANNI
ggplot(dati_new)+
geom_boxplot(aes(
x=sales,
y=datetime))+
labs(title= "Andamento vendite mensile dal 2010 al 2014",
x= "Vendite mensili",
y= "Data")+
theme_linedraw()
boxplot(sales~year, main="Boxplot andamento vendite per anno", xlab="Anno", ylab="Vendite mensili")
boxplot(volume~year, main="Boxplot volume vendite per anno", xlab="Anno", ylab="Volume vendite, in mln $")
Commento: è identificabile un trend generale di crescita nel periodo in studio, cioè tra il 2010 e il 2014 sia in termini di vendite mensili, sia in termini di volumi di vendita in milioni di dollari ed è confermato l’andamento stagionale delle vendite, con un incremento nei mesi tra maggio e luglio. In particolare, vi è un incremento da un valore mediano di circa 160 vendite mensili nel 2010 ad un valore mediano di circa 210 vendite mensili nel 2014, con un incremento anche dei valori massimi nei 5 anni. Guardando invece ai volumi di vendite in milioni di dollari, osserviamo un incremento da un valore mediano di circa 25 milioni di dollari del 2010 ad un valore mediano di quasi 40 milioni di dollari nel 2014, con un incremento dei valori massimi come per la variabile precedente.
L’analisi svolta ha permesso di identificare un generale trend di crescita nel periodo in studio in termini di vendite e volumi di vendita in milioni di dollari. In particolare si evidenzia un andamento stagionale delle vendite, con un in incremento nei mesi tra maggio e luglio. Vi è stato infatti un incremento delle vendite mensili da un valore mediano di circa 160 vendite mensili nel 2010 ad un valore mediano di circa 210 vendite mensili nel 2014, con un incremento anche dei valori massimi nei 5 anni. Guardando invece ai volumi di vendite in milioni di dollari, osserviamo un incremento da un valore mediano di circa 25 milioni di dollari del 2010 ad un valore mediano di quasi 40 milioni di dollari nel 2014, con un incremento dei valori massimi come per la variabile precedente. Segnaliamo però una diminuzione dell’efficacia degli annunci di vendita, con un valore mediano che è passato dal 60% circa nel 2010 al 40% circa del 2014, e una lieve decrescita degli annunci attivi nello stesso arco temporale.
Per quanto riguarda l’efficacia delle strategie di marketing delle inserzioni immobiliari, l’efficacia media degli annunci attivi è del 59% e un range che va dal 30% al 93%. Tale indice di efficacia varia molto in base alla città selezionata: la città di Tyler ha un valore mediano del 40%, seguita da Bryan-College Station con il 52% circa, Beaumont con il 62% circa e infine Wichita Falls con il valore mediano più alto, circa l’85%. Analizzando in particolare le due città che si collocano ai poli opposti, è bene riportare che esse sono differenti sia per numero di annunci attivi che per prezzo medio e mediano degli immobili. In particolare, Wichita Falls ha un valore mediano inferiore ai 1000 annunci, nettamente inferiore alle altre tre città, e il numero di annunci ha un impatto diretto sull’indice di efficacia degli annunci di vendita.
Le 4 città, quindi, si differenziano in termini di prezzo medio, mediano, numero di annunci attivi e quindi anche volume di vendita. Se volessimo ordinarle in ordine crescente in base ai risultanti ottenuti partiremmo dalla città di Wichita Falls che presenta il numero minore di annunci attivi (valore mediano di circa 1000 annunci attivi), il prezzo medio e mediano più basso (rispettivamente 120.000$ e 105.000$ circa), e che in termini di volumi di vendita si posiziona al 98% nella prima classe, ovvero tra 8 e 20 milioni di dollari. Segue la città di Beaumont con un valore mediano di 1700 annunci attivi (tecnicamente in seconda posizione se ordinassimo le città in base ai valori mediani di annunci attivi) ma con un prezzo medio e mediano di rispettivamente 145.000$ e 133.000$ circa e un posizionamento prevalente nella seconda classe di volume, ovvero tra 20 e 40 milioni di dollari, con il 75% delle osservazioni mensili. Nelle prime due posizioni le città di Tyler e Brian-College Station con valori simili e prossimi in termini di prezzo medio e mediano: Tyler ha un prezzo medio di 170.000$ e mediano di 140.000$ circa, mentre la seconda ha un prezzo medio di 180.000$ e mediano di 155.000$ circa. Tuttavia la città di Tyler è la prima in termini di numero di annunci attivi (valore mediano di 2875 annunci attivi contro i 1500 di Bryan-College Station). In termini di volumi di vendita, invece, la città di Tyler si conferma capofila con il 45% delle osservazione nella terza classe di volume, tra i 40 e 60 milioni, e il 38% nella seconda classe, tra 20 e 40 milioni, mentre Bryan-College registra il 50% delle osservazioni mensili nella seconda classe di volume. Guardando però all’efficacia degli annunci di vendita, la città di Bryan-College Station con un valore mediano del 52% circa, contro un 40% della città di Tyler. In conclusione la città di Tyler è capofila in termini di annunci attivi e volume di vendite, mentre Bryan-College Station lo è in termini di prezzo medio e mediano, nonché di efficacia degli annunci di vendita.