Introdução

O problema a ser estudado diz respeito à Easton Imobiliária. Resumidamente, cabe aqui verificar se a mesma realizou uma subvalorização intencional frente ao preço de mercado das outras corretoras. Após isto, deve-se observar se duas casas de dois clientes em questão estão com um valor notavelmente inferior.

Nomenclaturas

Base_Easton = Base criada do banco de dados
Easton = Banco de dados somente com informações da Easton Imobiliária
Outras = Banco de dados somente com informações das outras corretoras
Vendas_Fort = Vendas de todas as corretoras em Fort Worth
Vendas_Redor = Vendas de todas as corretoras nos arredores dos EUA

2° -> Importar o banco de dados

library(readxl)
Base_Easton <- read_excel("C:/Users/labccet/Downloads/BaseEaston.xlsx")

Nome do Banco de dados: BaseEaston.xlsx

Nome da Base: Base_Easton

Tipo de Arquivo: Excel

3° -> Separando os bancos de dados da Corretora Easton com as demais corretoras

Easton <- subset(Base_Easton, subset=Corretora== 1)

Outras <- subset(Base_Easton, subset=Corretora== 0)

4° -> Gerar um gráfico comparativo entre o Preço x Vendas de ambas as imobiliárias e um dado sobre preço das vendas

library(ggplot2)

ggplot(Outras) +
  aes(x = Preco, y = Tamanho) +
  geom_line(size = 1.3, colour = "gold1") +
  labs(x = "Preço", y = "Tamanho", title = "Outras - Preço x Tamanho") +
  theme_minimal()

ggplot(Easton) +
  aes(x = Preco, y = Tamanho) +
  geom_line(size = 1.56, colour = "tomato") +
  labs(x = "Preço", y = "Tamanho", title = "Easton - Preço x Tamanho") +
  theme_minimal()

library(psych)

describeBy(Outras$Preco)
##    vars   n     mean       sd median  trimmed      mad   min    max range
## X1    1 415 141066.1 22239.58 139950 140549.1 26242.02 99000 190650 91650
##    skew kurtosis     se
## X1 0.15    -0.95 1091.7
describeBy(Easton$Preco)
##    vars  n   mean       sd median  trimmed     mad   min    max range skew
## X1    1 46 130950 19097.96 128100 129422.4 15456.1 99450 176550 77100 0.75
##    kurtosis      se
## X1     0.04 2815.84

Gráfico gerado no ggplot 2

Vemos uma leve diferenciação no preço de vendas da Easton (média de US$ 130.950,00 ), o que a priori demonstra um preço realmente inferior a das demais corretoras (média de US$ 141.066,00 ). Mas existem outros elementos a serem considerados

5° -> Verificar possíveis elementos explicativos

describeBy(Easton)
##             vars  n      mean       sd    median   trimmed      mad
## Mes            1 46      4.61     1.16      5.00      4.63     1.48
## Preco          2 46 130950.00 19097.96 128100.00 129422.37 15456.10
## Tamanho        3 46    177.47    24.67    179.02    176.98    22.24
## Quartos        4 46      3.20     0.54      3.00      3.21     0.00
## Idade          5 46      6.15     2.05      6.00      6.08     1.48
## Localizacao    6 46      2.17     0.68      2.00      2.21     0.00
## Corretora      7 46      1.00     0.00      1.00      1.00     0.00
##                  min       max    range  skew kurtosis      se
## Mes             3.00      6.00     3.00 -0.13    -1.49    0.17
## Preco       99450.00 176550.00 77100.00  0.75     0.04 2815.84
## Tamanho       120.59    238.76   118.17  0.16     0.16    3.64
## Quartos         2.00      4.00     2.00  0.12    -0.19    0.08
## Idade           2.00     11.00     9.00  0.31    -0.40    0.30
## Localizacao     1.00      3.00     2.00 -0.21    -0.90    0.10
## Corretora       1.00      1.00     0.00   NaN      NaN    0.00
describeBy(Outras)
##             vars   n      mean       sd    median   trimmed      mad
## Mes            1 415      4.40     1.11      4.00      4.38     1.48
## Preco          2 415 141066.14 22239.58 139950.00 140549.10 26242.02
## Tamanho        3 415    173.04    28.19    168.71    172.12    28.24
## Quartos        4 415      3.10     0.61      3.00      3.13     0.00
## Idade          5 415      6.14     2.08      6.00      6.14     2.97
## Localizacao    6 415      1.69     0.78      1.00      1.62     0.00
## Corretora      7 415      0.00     0.00      0.00      0.00     0.00
##                  min       max   range  skew kurtosis      se
## Mes             3.00      6.00     3.0  0.11    -1.33    0.05
## Preco       99000.00 190650.00 91650.0  0.15    -0.95 1091.70
## Tamanho        99.31    266.82   167.5  0.34    -0.02    1.38
## Quartos         2.00      4.00     2.0 -0.05    -0.34    0.03
## Idade           1.00     13.00    12.0  0.06    -0.31    0.10
## Localizacao     1.00      3.00     2.0  0.60    -1.13    0.04
## Corretora       0.00      0.00     0.0   NaN      NaN    0.00
boxplot(Easton$Preco, Outras$Preco, main = "Preço x Corretora", col = c("darkgoldenrod", "royalblue4"), ylab = "Preço", xlab = "Corretoras", names = c("Easton", "Outras"))

Base_Easton$Corretora <- as.factor (Base_Easton$Corretora)

plot(Base_Easton$Corretora, col = c("mistyrose4", "paleturquoise2"), main = "Vendas por corretoras", ylab = "Vendas", xlab = "Corretora", names = c("Outras", "Easton"))

Base_Easton$Mes <- as.factor(Base_Easton$Mes)

plot(Base_Easton$Mes, col = c("yellow4", "seagreen4", "steelblue", "violet"), names = c("Março","Abril","Maio","Junho"), main = "Vendas x Mês", ylab = 'Vendas', xlab = 'Mês')

boxplot(Easton$Mes, col = "Blue", main = "Vendas da Easton por Mês", xlab = "Vendas", ylab = "Mês")

describeBy(Easton$Mes)
##    vars  n mean   sd median trimmed  mad min max range  skew kurtosis   se
## X1    1 46 4.61 1.16      5    4.63 1.48   3   6     3 -0.13    -1.49 0.17
boxplot(Outras$Mes, col = "red", main = "Vendas das Outras corretoras por Mês", xlab = "Venda", ylab = "Mês")

describeBy(Outras$Mes)
##    vars   n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 415  4.4 1.11      4    4.38 1.48   3   6     3 0.11    -1.33 0.05
boxplot(Easton$Idade, Outras$Idade, main = "Idade das casas x Corretora", col = c("Yellow", "Purple"), ylab = "Idade", xlab = "Corretoras", names = c("Easton","Outras"))

describeBy(Easton$Idade)
##    vars  n mean   sd median trimmed  mad min max range skew kurtosis  se
## X1    1 46 6.15 2.05      6    6.08 1.48   2  11     9 0.31     -0.4 0.3
describeBy(Outras$Idade)
##    vars   n mean   sd median trimmed  mad min max range skew kurtosis  se
## X1    1 415 6.14 2.08      6    6.14 2.97   1  13    12 0.06    -0.31 0.1
Base_Easton$Localizacao <- as.factor(Base_Easton$Localizacao)

plot(Base_Easton$Localizacao, col = c("orangered1", "tan3", "ivory3"), main = ("Vendas x Região"), ylab = "Vendas", xlab = "Mês", names = c("Dallas", "Fort Worth", "Redondezas")) 

boxplot(Easton$Tamanho, Outras$Tamanho, col = c("indianred", "khaki"), main = "Tamanho x Corretoras", ylab = "Tamanho (m²)", xlab = "Corretoras", names = c("Easton", "Outras") )

describeBy(Easton$Tamanho)
##    vars  n   mean    sd median trimmed   mad    min    max  range skew
## X1    1 46 177.47 24.67 179.02  176.98 22.24 120.59 238.76 118.17 0.16
##    kurtosis   se
## X1     0.16 3.64
describeBy(Outras$Tamanho)
##    vars   n   mean    sd median trimmed   mad   min    max range skew
## X1    1 415 173.04 28.19 168.71  172.12 28.24 99.31 266.82 167.5 0.34
##    kurtosis   se
## X1    -0.02 1.38
Easton teve um preço menor que as demais corretoras
Easton teve quase 10% de casas vendidas em comparação com as demais corretoras
Vemos que em decorrência da crise as vendas foram diminuindo gradativamente ao longo dos meses
Eston tem as casas com uma média de idade quase que igual a das casas vendidas pelas outras corretoras (6,15 anos x 6,14 anos)
Easton (177.47 m²) vende casas com tamanhos maiores que as demais corretoras (173.04 m²)
Easton tendeu a vender mais casas na transição de Abril pra Maio, enquanto que as outras venderam majoritariamente em Abril
obs: nos gráficos de boxplot relativos a vendas por mês, devemos considerar o 3 como Março, o 4 como Abril, o 5 como Maio e o 6 como Junho

5° -> Subvalorização da casa de Arlington?

Vendas_Redor<- subset(Base_Easton, subset=Localizacao== 3)

describeBy(Vendas_Redor)
##              vars  n      mean       sd    median   trimmed      mad
## Mes*            1 97      2.45     1.03      3.00      2.44     1.48
## Preco           2 97 128546.91 16448.43 125850.00 127387.97 15567.30
## Tamanho         3 97    185.89    28.03    182.37    184.73    25.34
## Quartos         4 97      3.32     0.57      3.00      3.34     0.00
## Idade           5 97      6.14     1.84      6.00      6.14     1.48
## Localizacao*    6 97      3.00     0.00      3.00      3.00     0.00
## Corretora*      7 97      1.15     0.36      1.00      1.08     0.00
##                   min       max    range  skew kurtosis      se
## Mes*             1.00      4.00     3.00 -0.02    -1.18    0.10
## Preco        99450.00 177750.00 78300.00  0.69     0.16 1670.08
## Tamanho        130.44    266.82   136.38  0.48    -0.03    2.85
## Quartos          2.00      4.00     2.00 -0.11    -0.69    0.06
## Idade            1.00     13.00    12.00  0.28     1.57    0.19
## Localizacao*     3.00      3.00     0.00   NaN      NaN    0.00
## Corretora*       1.00      2.00     1.00  1.88     1.55    0.04
describeBy(Vendas_Redor$Tamanho)
##    vars  n   mean    sd median trimmed   mad    min    max  range skew
## X1    1 97 185.89 28.03 182.37  184.73 25.34 130.44 266.82 136.38 0.48
##    kurtosis   se
## X1    -0.03 2.85
Casa de Arlington tem 4 anos, 203 m² de tamanho e foi vendida por 88.500 dólares
A média das casas em Arlington tem 6,1 anos, 185 m² e são vendidas por aproximadamente US$ 128.546,91
Concluo que HÁ CLARAMENTE SUBVALORIZAÇÃO!

6° -> Subvalorização em West Fort?

Vendas_Fort<- subset(Base_Easton, subset=Localizacao==2)
describeBy(Vendas_Fort)
##              vars   n      mean       sd    median   trimmed      mad
## Mes*            1 147      2.44     1.12      2.00      2.42     1.48
## Preco           2 147 129485.71 19261.30 124350.00 127995.38 18013.59
## Tamanho         3 147    175.92    28.12    168.15    174.44    24.93
## Quartos         4 147      3.17     0.61      3.00      3.21     0.00
## Idade           5 147      6.37     2.09      6.00      6.37     2.97
## Localizacao*    6 147      2.00     0.00      2.00      2.00     0.00
## Corretora*      7 147      1.16     0.37      1.00      1.08     0.00
##                   min       max    range  skew kurtosis      se
## Mes*             1.00      4.00     3.00  0.07    -1.38    0.09
## Preco        99000.00 184800.00 85800.00  0.67    -0.36 1588.65
## Tamanho        120.59    256.13   135.55  0.51    -0.42    2.32
## Quartos          2.00      4.00     2.00 -0.11    -0.49    0.05
## Idade            1.00     11.00    10.00 -0.02    -0.67    0.17
## Localizacao*     2.00      2.00     0.00   NaN      NaN    0.00
## Corretora*       1.00      2.00     1.00  1.80     1.26    0.03
describeBy(Vendas_Fort$Tamanho)
##    vars   n   mean    sd median trimmed   mad    min    max  range skew
## X1    1 147 175.92 28.12 168.15  174.44 24.93 120.59 256.13 135.55 0.51
##    kurtosis   se
## X1    -0.42 2.32
describeBy(Vendas_Fort$Idade)
##    vars   n mean   sd median trimmed  mad min max range  skew kurtosis
## X1    1 147 6.37 2.09      6    6.37 2.97   1  11    10 -0.02    -0.67
##      se
## X1 0.17
ggplot(Vendas_Fort) +
 aes(x = Idade, y = Tamanho) +
 geom_line(size = 1L, colour = "#ff7f00") +
 labs(x = "Idade (a)", y = "Tamanho (m²)", title = "Idade por Tamanho ", subtitle = "Em Fort Worth") +
 theme_bw()

A casa em West Fort tem 9 anos, 172 m² e foi vendida por 79.500 dólares
A média das casas em West Fort tem 6.37 anos, 256.13 m² e são vendidas por aproximadamente US$ 184.800,00
Concluo que HÁ SUBVALORIZAÇÃO

Conclusões sobre o caso Easton

Com os dados e gráficos gerados podemos constatar que a corretora Easton de fato tende a vender as casas dela com um valor abaixo da média do mercado (US$ 130.950,00 contra US$ 141.066,00), possuem vendas com idade média levemente maior (4,61 anos contra 4,40 anos) e têm um tamanho médio maior (177.47 m² contra 173.04 m²). Com relação às casas mencionadas há - precisamente - um destoamento com relação aos demais vendas, onde caberia um processo judicial. Já com relação às vendas como um todo da Easton Imobiliária, é complicado processá-la por Subvalorização proposital.