Introdução
O problema a ser estudado diz respeito à Easton Imobiliária. Resumidamente, cabe aqui verificar se a mesma realizou uma subvalorização intencional frente ao preço de mercado das outras corretoras. Após isto, deve-se observar se duas casas de dois clientes em questão estão com um valor notavelmente inferior.
Nomenclaturas
Base_Easton = Base criada do banco de dados
Easton = Banco de dados somente com informações da Easton Imobiliária
Outras = Banco de dados somente com informações das outras corretoras
Vendas_Fort = Vendas de todas as corretoras em Fort Worth
Vendas_Redor = Vendas de todas as corretoras nos arredores dos EUA
2° -> Importar o banco de dados
library(readxl)
Base_Easton <- read_excel("C:/Users/labccet/Downloads/BaseEaston.xlsx")
Nome do Banco de dados: BaseEaston.xlsx
Nome da Base: Base_Easton
Tipo de Arquivo: Excel
4° -> Gerar um gráfico comparativo entre o Preço x Vendas de ambas as imobiliárias e um dado sobre preço das vendas
library(ggplot2)
ggplot(Outras) +
aes(x = Preco, y = Tamanho) +
geom_line(size = 1.3, colour = "gold1") +
labs(x = "Preço", y = "Tamanho", title = "Outras - Preço x Tamanho") +
theme_minimal()

ggplot(Easton) +
aes(x = Preco, y = Tamanho) +
geom_line(size = 1.56, colour = "tomato") +
labs(x = "Preço", y = "Tamanho", title = "Easton - Preço x Tamanho") +
theme_minimal()

library(psych)
describeBy(Outras$Preco)
## vars n mean sd median trimmed mad min max range
## X1 1 415 141066.1 22239.58 139950 140549.1 26242.02 99000 190650 91650
## skew kurtosis se
## X1 0.15 -0.95 1091.7
describeBy(Easton$Preco)
## vars n mean sd median trimmed mad min max range skew
## X1 1 46 130950 19097.96 128100 129422.4 15456.1 99450 176550 77100 0.75
## kurtosis se
## X1 0.04 2815.84
Gráfico gerado no ggplot 2
Vemos uma leve diferenciação no preço de vendas da Easton (média de US$ 130.950,00 ), o que a priori demonstra um preço realmente inferior a das demais corretoras (média de US$ 141.066,00 ). Mas existem outros elementos a serem considerados
5° -> Verificar possíveis elementos explicativos
describeBy(Easton)
## vars n mean sd median trimmed mad
## Mes 1 46 4.61 1.16 5.00 4.63 1.48
## Preco 2 46 130950.00 19097.96 128100.00 129422.37 15456.10
## Tamanho 3 46 177.47 24.67 179.02 176.98 22.24
## Quartos 4 46 3.20 0.54 3.00 3.21 0.00
## Idade 5 46 6.15 2.05 6.00 6.08 1.48
## Localizacao 6 46 2.17 0.68 2.00 2.21 0.00
## Corretora 7 46 1.00 0.00 1.00 1.00 0.00
## min max range skew kurtosis se
## Mes 3.00 6.00 3.00 -0.13 -1.49 0.17
## Preco 99450.00 176550.00 77100.00 0.75 0.04 2815.84
## Tamanho 120.59 238.76 118.17 0.16 0.16 3.64
## Quartos 2.00 4.00 2.00 0.12 -0.19 0.08
## Idade 2.00 11.00 9.00 0.31 -0.40 0.30
## Localizacao 1.00 3.00 2.00 -0.21 -0.90 0.10
## Corretora 1.00 1.00 0.00 NaN NaN 0.00
describeBy(Outras)
## vars n mean sd median trimmed mad
## Mes 1 415 4.40 1.11 4.00 4.38 1.48
## Preco 2 415 141066.14 22239.58 139950.00 140549.10 26242.02
## Tamanho 3 415 173.04 28.19 168.71 172.12 28.24
## Quartos 4 415 3.10 0.61 3.00 3.13 0.00
## Idade 5 415 6.14 2.08 6.00 6.14 2.97
## Localizacao 6 415 1.69 0.78 1.00 1.62 0.00
## Corretora 7 415 0.00 0.00 0.00 0.00 0.00
## min max range skew kurtosis se
## Mes 3.00 6.00 3.0 0.11 -1.33 0.05
## Preco 99000.00 190650.00 91650.0 0.15 -0.95 1091.70
## Tamanho 99.31 266.82 167.5 0.34 -0.02 1.38
## Quartos 2.00 4.00 2.0 -0.05 -0.34 0.03
## Idade 1.00 13.00 12.0 0.06 -0.31 0.10
## Localizacao 1.00 3.00 2.0 0.60 -1.13 0.04
## Corretora 0.00 0.00 0.0 NaN NaN 0.00
boxplot(Easton$Preco, Outras$Preco, main = "Preço x Corretora", col = c("darkgoldenrod", "royalblue4"), ylab = "Preço", xlab = "Corretoras", names = c("Easton", "Outras"))

Base_Easton$Corretora <- as.factor (Base_Easton$Corretora)
plot(Base_Easton$Corretora, col = c("mistyrose4", "paleturquoise2"), main = "Vendas por corretoras", ylab = "Vendas", xlab = "Corretora", names = c("Outras", "Easton"))

Base_Easton$Mes <- as.factor(Base_Easton$Mes)
plot(Base_Easton$Mes, col = c("yellow4", "seagreen4", "steelblue", "violet"), names = c("Março","Abril","Maio","Junho"), main = "Vendas x Mês", ylab = 'Vendas', xlab = 'Mês')

boxplot(Easton$Mes, col = "Blue", main = "Vendas da Easton por Mês", xlab = "Vendas", ylab = "Mês")

describeBy(Easton$Mes)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 46 4.61 1.16 5 4.63 1.48 3 6 3 -0.13 -1.49 0.17
boxplot(Outras$Mes, col = "red", main = "Vendas das Outras corretoras por Mês", xlab = "Venda", ylab = "Mês")

describeBy(Outras$Mes)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 415 4.4 1.11 4 4.38 1.48 3 6 3 0.11 -1.33 0.05
boxplot(Easton$Idade, Outras$Idade, main = "Idade das casas x Corretora", col = c("Yellow", "Purple"), ylab = "Idade", xlab = "Corretoras", names = c("Easton","Outras"))

describeBy(Easton$Idade)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 46 6.15 2.05 6 6.08 1.48 2 11 9 0.31 -0.4 0.3
describeBy(Outras$Idade)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 415 6.14 2.08 6 6.14 2.97 1 13 12 0.06 -0.31 0.1
Base_Easton$Localizacao <- as.factor(Base_Easton$Localizacao)
plot(Base_Easton$Localizacao, col = c("orangered1", "tan3", "ivory3"), main = ("Vendas x Região"), ylab = "Vendas", xlab = "Mês", names = c("Dallas", "Fort Worth", "Redondezas"))

boxplot(Easton$Tamanho, Outras$Tamanho, col = c("indianred", "khaki"), main = "Tamanho x Corretoras", ylab = "Tamanho (m²)", xlab = "Corretoras", names = c("Easton", "Outras") )

describeBy(Easton$Tamanho)
## vars n mean sd median trimmed mad min max range skew
## X1 1 46 177.47 24.67 179.02 176.98 22.24 120.59 238.76 118.17 0.16
## kurtosis se
## X1 0.16 3.64
describeBy(Outras$Tamanho)
## vars n mean sd median trimmed mad min max range skew
## X1 1 415 173.04 28.19 168.71 172.12 28.24 99.31 266.82 167.5 0.34
## kurtosis se
## X1 -0.02 1.38
Easton teve um preço menor que as demais corretoras
Easton teve quase 10% de casas vendidas em comparação com as demais corretoras
Vemos que em decorrência da crise as vendas foram diminuindo gradativamente ao longo dos meses
Eston tem as casas com uma média de idade quase que igual a das casas vendidas pelas outras corretoras (6,15 anos x 6,14 anos)
Easton (177.47 m²) vende casas com tamanhos maiores que as demais corretoras (173.04 m²)
Easton tendeu a vender mais casas na transição de Abril pra Maio, enquanto que as outras venderam majoritariamente em Abril
obs: nos gráficos de boxplot relativos a vendas por mês, devemos considerar o 3 como Março, o 4 como Abril, o 5 como Maio e o 6 como Junho
5° -> Subvalorização da casa de Arlington?
Vendas_Redor<- subset(Base_Easton, subset=Localizacao== 3)
describeBy(Vendas_Redor)
## vars n mean sd median trimmed mad
## Mes* 1 97 2.45 1.03 3.00 2.44 1.48
## Preco 2 97 128546.91 16448.43 125850.00 127387.97 15567.30
## Tamanho 3 97 185.89 28.03 182.37 184.73 25.34
## Quartos 4 97 3.32 0.57 3.00 3.34 0.00
## Idade 5 97 6.14 1.84 6.00 6.14 1.48
## Localizacao* 6 97 3.00 0.00 3.00 3.00 0.00
## Corretora* 7 97 1.15 0.36 1.00 1.08 0.00
## min max range skew kurtosis se
## Mes* 1.00 4.00 3.00 -0.02 -1.18 0.10
## Preco 99450.00 177750.00 78300.00 0.69 0.16 1670.08
## Tamanho 130.44 266.82 136.38 0.48 -0.03 2.85
## Quartos 2.00 4.00 2.00 -0.11 -0.69 0.06
## Idade 1.00 13.00 12.00 0.28 1.57 0.19
## Localizacao* 3.00 3.00 0.00 NaN NaN 0.00
## Corretora* 1.00 2.00 1.00 1.88 1.55 0.04
describeBy(Vendas_Redor$Tamanho)
## vars n mean sd median trimmed mad min max range skew
## X1 1 97 185.89 28.03 182.37 184.73 25.34 130.44 266.82 136.38 0.48
## kurtosis se
## X1 -0.03 2.85
Casa de Arlington tem 4 anos, 203 m² de tamanho e foi vendida por 88.500 dólares
A média das casas em Arlington tem 6,1 anos, 185 m² e são vendidas por aproximadamente US$ 128.546,91
Concluo que HÁ CLARAMENTE SUBVALORIZAÇÃO!
6° -> Subvalorização em West Fort?
Vendas_Fort<- subset(Base_Easton, subset=Localizacao==2)
describeBy(Vendas_Fort)
## vars n mean sd median trimmed mad
## Mes* 1 147 2.44 1.12 2.00 2.42 1.48
## Preco 2 147 129485.71 19261.30 124350.00 127995.38 18013.59
## Tamanho 3 147 175.92 28.12 168.15 174.44 24.93
## Quartos 4 147 3.17 0.61 3.00 3.21 0.00
## Idade 5 147 6.37 2.09 6.00 6.37 2.97
## Localizacao* 6 147 2.00 0.00 2.00 2.00 0.00
## Corretora* 7 147 1.16 0.37 1.00 1.08 0.00
## min max range skew kurtosis se
## Mes* 1.00 4.00 3.00 0.07 -1.38 0.09
## Preco 99000.00 184800.00 85800.00 0.67 -0.36 1588.65
## Tamanho 120.59 256.13 135.55 0.51 -0.42 2.32
## Quartos 2.00 4.00 2.00 -0.11 -0.49 0.05
## Idade 1.00 11.00 10.00 -0.02 -0.67 0.17
## Localizacao* 2.00 2.00 0.00 NaN NaN 0.00
## Corretora* 1.00 2.00 1.00 1.80 1.26 0.03
describeBy(Vendas_Fort$Tamanho)
## vars n mean sd median trimmed mad min max range skew
## X1 1 147 175.92 28.12 168.15 174.44 24.93 120.59 256.13 135.55 0.51
## kurtosis se
## X1 -0.42 2.32
describeBy(Vendas_Fort$Idade)
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 147 6.37 2.09 6 6.37 2.97 1 11 10 -0.02 -0.67
## se
## X1 0.17
ggplot(Vendas_Fort) +
aes(x = Idade, y = Tamanho) +
geom_line(size = 1L, colour = "#ff7f00") +
labs(x = "Idade (a)", y = "Tamanho (m²)", title = "Idade por Tamanho ", subtitle = "Em Fort Worth") +
theme_bw()

A casa em West Fort tem 9 anos, 172 m² e foi vendida por 79.500 dólares
A média das casas em West Fort tem 6.37 anos, 256.13 m² e são vendidas por aproximadamente US$ 184.800,00
Concluo que HÁ SUBVALORIZAÇÃO
Conclusões sobre o caso Easton
Com os dados e gráficos gerados podemos constatar que a corretora Easton de fato tende a vender as casas dela com um valor abaixo da média do mercado (US$ 130.950,00 contra US$ 141.066,00), possuem vendas com idade média levemente maior (4,61 anos contra 4,40 anos) e têm um tamanho médio maior (177.47 m² contra 173.04 m²). Com relação às casas mencionadas há - precisamente - um destoamento com relação aos demais vendas, onde caberia um processo judicial. Já com relação às vendas como um todo da Easton Imobiliária, é complicado processá-la por Subvalorização proposital.