tendenze del mercato immobiliare in Texas utilizzando i dati storici delle vendite, fornendo insight statistici e visivi utili a decisioni strategiche.
# open packages
library(readxl)
library(ggplot2)
library(pROC)
library(ROCR)
library(dplyr)
library(tidyverse)
library(knitr)
library(tidyverse)
library(ggplot2)
library(dplyr)
library(moments)
data <- read.csv("C:\\Users\\Trasciati\\Downloads\\realestate_texas.csv")
str(data)
## 'data.frame': 240 obs. of 8 variables:
## $ city : chr "Beaumont" "Beaumont" "Beaumont" "Beaumont" ...
## $ year : int 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
## $ month : int 1 2 3 4 5 6 7 8 9 10 ...
## $ sales : int 83 108 182 200 202 189 164 174 124 150 ...
## $ volume : num 14.2 17.7 28.7 26.8 28.8 ...
## $ median_price : num 163800 138200 122400 123200 123100 ...
## $ listings : int 1533 1586 1689 1708 1771 1803 1857 1830 1829 1779 ...
## $ months_inventory: num 9.5 10 10.6 10.6 10.9 11.1 11.7 11.6 11.7 11.5 ...
summary
## function (object, ...)
## UseMethod("summary")
## <bytecode: 0x0000016ac3f5be58>
## <environment: namespace:base>
Descrittive
## sales_mean sales_median sales_sd sales_skew volume_mean volume_median
## 1 192.2917 175.5 79.65111 0.718104 31.00519 27.0625
## volume_sd volume_skew price_mean price_median price_sd price_skew
## 1 16.65145 0.884742 132665.4 134500 22662.15 -0.3645529
## listings_mean listings_median listings_sd listings_skew months_inventory_mean
## 1 1738.021 1618.5 752.7078 0.6494982 9.1925
## months_inventory_median months_inventory_sd months_inventory_skew
## 1 8.95 2.303669 0.04097527
Frequenze
##
## Beaumont Bryan-College Station Tyler
## 60 60 60
## Wichita Falls
## 60
##
## 1 2 3 4 5 6 7 8 9 10 11 12
## 20 20 20 20 20 20 20 20 20 20 20 20
Coefficienti variazione
## $cv_sales
## [1] 0.4142203
##
## $cv_price
## [1] 0.1708218
Classi e frequenze
##
## Basso Medio-basso Medio Medio-alto Alto
## 18 40 73 84 25
Indice Gini
## [1] 0.09678765
Probabilità
## $prob_beaumont
## [1] 0.25
##
## $prob_july
## [1] 0
##
## $prob_dec_2012
## [1] 0
Nuove variabili
## Rows: 240
## Columns: 11
## $ city <chr> "Beaumont", "Beaumont", "Beaumont", "Beaumont", …
## $ year <int> 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, …
## $ month <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 1, 2, 3, …
## $ sales <int> 83, 108, 182, 200, 202, 189, 164, 174, 124, 150,…
## $ volume <dbl> 14.162, 17.690, 28.701, 26.819, 28.833, 27.219, …
## $ median_price <dbl> 163800, 138200, 122400, 123200, 123100, 122800, …
## $ listings <int> 1533, 1586, 1689, 1708, 1771, 1803, 1857, 1830, …
## $ months_inventory <dbl> 9.5, 10.0, 10.6, 10.6, 10.9, 11.1, 11.7, 11.6, 1…
## $ price_class <fct> Alto, Medio-alto, Medio, Medio, Medio, Medio, Me…
## $ avg_price_per_listing <dbl> 9238.095, 11153.846, 16992.895, 15701.991, 16280…
## $ effectiveness <dbl> 0.05414220, 0.06809584, 0.10775607, 0.11709602, …
## `summarise()` has grouped output by 'city', 'year'. You can override using the
## `.groups` argument.
## # A tibble: 240 × 7
## # Groups: city, year [20]
## city year month avg_sales sd_sales avg_price sd_price
## <chr> <int> <int> <dbl> <dbl> <dbl> <dbl>
## 1 Beaumont 2010 1 83 NA 163800 NA
## 2 Beaumont 2010 2 108 NA 138200 NA
## 3 Beaumont 2010 3 182 NA 122400 NA
## 4 Beaumont 2010 4 200 NA 123200 NA
## 5 Beaumont 2010 5 202 NA 123100 NA
## 6 Beaumont 2010 6 189 NA 122800 NA
## 7 Beaumont 2010 7 164 NA 124300 NA
## 8 Beaumont 2010 8 174 NA 136800 NA
## 9 Beaumont 2010 9 124 NA 121100 NA
## 10 Beaumont 2010 10 150 NA 138500 NA
## # ℹ 230 more rows
## **Tyler e Bryan-College Station** hanno avuto le vendite medie più alte, in particolare nel **2013 e 2014**.
## **Wichita Falls** ha registrato vendite significativamente più basse rispetto alle altre città.
## **Bryan-College Station ha i prezzi più alti (il prezzo mediano è il più alto tra le città dello studio). al contrario Wichita Falls, che nonostante l'outlier indichi la presenza di case con prezzi significativamente più alti rispetto alla media, ha il valore mediano più basso. Beaumont e Tyler sono intermedi, la seconda ha una vrainza maggiore**
## `summarise()` has grouped output by 'month'. You can override using the
## `.groups` argument.
## **c'è un picco nell'andamento delle vendite nei mesi primaverili/estivi, poi compare una graduale diminuzione. Tyler sembra contirbuire in modo significativo al totale delle vendite in ogni mese, similmente a Beaumont e in modo più marcato rispetto a Wichita Falls. Bryan-College Station rimane abbastanza costante durante l'anno.**
## **mentre per Bryan-College Station e Tyler c'è un aumento nel tempo, seppur molto altalenante, Beaumont e Witcha Falls rimangono più costanti nel nella varianza in termini di sales, in particolare, l'ultima menzionata.**