Introduzione

tendenze del mercato immobiliare in Texas utilizzando i dati storici delle vendite, fornendo insight statistici e visivi utili a decisioni strategiche.

# open packages
library(readxl)
library(ggplot2)
library(pROC)
library(ROCR)
library(dplyr)
library(tidyverse)
library(knitr)

Caricamento dei Dati

library(tidyverse)
library(ggplot2)
library(dplyr)
library(moments)
data <- read.csv("C:\\Users\\Trasciati\\Downloads\\realestate_texas.csv")
str(data)
## 'data.frame':    240 obs. of  8 variables:
##  $ city            : chr  "Beaumont" "Beaumont" "Beaumont" "Beaumont" ...
##  $ year            : int  2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
##  $ month           : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ sales           : int  83 108 182 200 202 189 164 174 124 150 ...
##  $ volume          : num  14.2 17.7 28.7 26.8 28.8 ...
##  $ median_price    : num  163800 138200 122400 123200 123100 ...
##  $ listings        : int  1533 1586 1689 1708 1771 1803 1857 1830 1829 1779 ...
##  $ months_inventory: num  9.5 10 10.6 10.6 10.9 11.1 11.7 11.6 11.7 11.5 ...
summary
## function (object, ...) 
## UseMethod("summary")
## <bytecode: 0x0000016ac3f5be58>
## <environment: namespace:base>

Descrittive

##   sales_mean sales_median sales_sd sales_skew volume_mean volume_median
## 1   192.2917        175.5 79.65111   0.718104    31.00519       27.0625
##   volume_sd volume_skew price_mean price_median price_sd price_skew
## 1  16.65145    0.884742   132665.4       134500 22662.15 -0.3645529
##   listings_mean listings_median listings_sd listings_skew months_inventory_mean
## 1      1738.021          1618.5    752.7078     0.6494982                9.1925
##   months_inventory_median months_inventory_sd months_inventory_skew
## 1                    8.95            2.303669            0.04097527

Frequenze

## 
##              Beaumont Bryan-College Station                 Tyler 
##                    60                    60                    60 
##         Wichita Falls 
##                    60
## 
##  1  2  3  4  5  6  7  8  9 10 11 12 
## 20 20 20 20 20 20 20 20 20 20 20 20

Coefficienti variazione

## $cv_sales
## [1] 0.4142203
## 
## $cv_price
## [1] 0.1708218

Classi e frequenze

## 
##       Basso Medio-basso       Medio  Medio-alto        Alto 
##          18          40          73          84          25

Indice Gini

## [1] 0.09678765

Probabilità

## $prob_beaumont
## [1] 0.25
## 
## $prob_july
## [1] 0
## 
## $prob_dec_2012
## [1] 0

Nuove variabili

## Rows: 240
## Columns: 11
## $ city                  <chr> "Beaumont", "Beaumont", "Beaumont", "Beaumont", …
## $ year                  <int> 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, …
## $ month                 <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 1, 2, 3, …
## $ sales                 <int> 83, 108, 182, 200, 202, 189, 164, 174, 124, 150,…
## $ volume                <dbl> 14.162, 17.690, 28.701, 26.819, 28.833, 27.219, …
## $ median_price          <dbl> 163800, 138200, 122400, 123200, 123100, 122800, …
## $ listings              <int> 1533, 1586, 1689, 1708, 1771, 1803, 1857, 1830, …
## $ months_inventory      <dbl> 9.5, 10.0, 10.6, 10.6, 10.9, 11.1, 11.7, 11.6, 1…
## $ price_class           <fct> Alto, Medio-alto, Medio, Medio, Medio, Medio, Me…
## $ avg_price_per_listing <dbl> 9238.095, 11153.846, 16992.895, 15701.991, 16280…
## $ effectiveness         <dbl> 0.05414220, 0.06809584, 0.10775607, 0.11709602, …
## `summarise()` has grouped output by 'city', 'year'. You can override using the
## `.groups` argument.
## # A tibble: 240 × 7
## # Groups:   city, year [20]
##    city      year month avg_sales sd_sales avg_price sd_price
##    <chr>    <int> <int>     <dbl>    <dbl>     <dbl>    <dbl>
##  1 Beaumont  2010     1        83       NA    163800       NA
##  2 Beaumont  2010     2       108       NA    138200       NA
##  3 Beaumont  2010     3       182       NA    122400       NA
##  4 Beaumont  2010     4       200       NA    123200       NA
##  5 Beaumont  2010     5       202       NA    123100       NA
##  6 Beaumont  2010     6       189       NA    122800       NA
##  7 Beaumont  2010     7       164       NA    124300       NA
##  8 Beaumont  2010     8       174       NA    136800       NA
##  9 Beaumont  2010     9       124       NA    121100       NA
## 10 Beaumont  2010    10       150       NA    138500       NA
## # ℹ 230 more rows

## **Tyler e Bryan-College Station** hanno avuto le vendite medie più alte, in particolare nel **2013 e 2014**.  
## **Wichita Falls** ha registrato vendite significativamente più basse rispetto alle altre città.

## **Bryan-College Station ha i prezzi più alti (il prezzo mediano è il più alto tra le città dello studio). al contrario Wichita Falls, che nonostante l'outlier indichi la presenza di case con prezzi significativamente più alti rispetto alla media, ha il valore mediano più basso. Beaumont e Tyler sono intermedi, la seconda ha una vrainza maggiore**
## `summarise()` has grouped output by 'month'. You can override using the
## `.groups` argument.

## **c'è un picco nell'andamento delle vendite nei mesi primaverili/estivi, poi compare una graduale diminuzione. Tyler sembra contirbuire in modo significativo al totale delle vendite in ogni mese, similmente a Beaumont e in modo più marcato rispetto  a Wichita Falls. Bryan-College Station rimane abbastanza costante durante l'anno.**

## **mentre per Bryan-College Station e Tyler c'è un aumento nel tempo, seppur molto altalenante, Beaumont e Witcha Falls rimangono più costanti nel nella varianza in termini di sales, in particolare, l'ultima menzionata.**