Caso Easton

Sam Easton, recebeu duas queixas contra sua imobiliária por ter vendido duas casas abaixo do valor de mercado para acelerar as vendas. As queixas eram baseadas num artigo que apresentava o preço médio e o valor médio das vendas de casa em Dallas-Fort Woth. No citado artigo, o preço médio era 104.250 dólares e o tamanho médio 172m², o que se traduz em um valor de 606,10 dólares/m². O primeiro vendedor queixoso teve sua casa em Arlington de 4 anos, 3 quartos, 203m² vendida por 88.500 dólares (435,96 dólares/m²), 28,1% a menos que o valor sugerido no artigo. O segundo vendedor queixoso teve sua casa em Fort Worth de 9 anos, 3 quartos, 172m² vendida por 79.500 dólares (462,21 dólares/m²), 23,7% a menos que o valor médio noticiado. Para se defender Easton pretende usar o banco de dados de uma avaliadora imobiliária local, que embora não contenha os dados de todas as vendas realizadas, os dados que contém representam toda a população. E tais dados, para cada casa vendida, são: • o mês de venda • o preço • o tamanho da casa • o número de quartos • a idade da casa • a área na DFW • a imobiliária que vendeu

Inicialmente, fez-se uma análise da distribuição dos preços de um modo geral, isto é, sem considerar os fatores Mês, Tamanho, Número de Quartos, Idade ou Imobiliária, com a intenção de verificar aonde os valores de venda das casas dos queixosos se localizavam dentro dessa distribuição. Nesta avaliação os valores encontrados foram: média=140056,7 ; mediana=138600 ; desvio padrão=22136,66 ; mín.=99000 ; máx.=190650 ; cv=0.1581. A média de preços varia então entre 117920 e 162193.

Queixoso1 88.500 Não OK Queixoso2 79.500 Não OK

Já se essa mesma análise fosse feita considerando o preço/m², os valores encontrados nessa distribuição seriam: média=816,36 ; mediana=803,16 ; desvio padrão=119,88 ; mín.=582,23 ; máx.=1146,4 ; cv=0,1468. Nesse caso a média de preços varia entre 696,48 e 936,24.

Queixoso1 435,96 NÃO OK Queixoso2 462,21 NÃO OK

library(Rcmdr)
## Loading required package: splines
## Loading required package: RcmdrMisc
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
## Loading required package: effects
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## A interface gráfica do Rcmdr só é lançada no modo interativo
## 
## Attaching package: 'Rcmdr'
## The following object is masked from 'package:car':
## 
##     Confint
library(corrplot)
## corrplot 0.84 loaded
Easton <- 
  readXL("C:/Users/Mariana/Desktop/Estatística/Base_de_dados-master/Base_de_dados-master/Base de dados - Easton Imobiliária.xlsx",
   rownames=FALSE, header=TRUE, na="", sheet="Banco de Dados", stringsAsFactors=TRUE)
Easton$PrecoPorTamanho <- with(Easton, Preço/ Tamanho)
Easton <- within(Easton, {
  CorretoraFator <- factor(Corretora, labels=c('OutraImobiliaria','Easton'))
})
Easton <- within(Easton, {
  IdadeFator <- factor(Idade, labels=c('Um','Dois','Tres','Quatro','Cinco','Seis','Sete','Oito','Nove','Dez','Onze','Doze','Treze'))
})
Easton <- within(Easton, {
  LocalizacaoFator <- factor(Localização, labels=c('Dallas','FortWorth','RegiaoMetropolitana'))
})
Easton <- within(Easton, {
  MesFator <- factor(Mês, labels=c('Marco','Abril','Maio','Junho'))
})
Easton <- within(Easton, {
  QuartosFator <- factor(Quartos, labels=c('DoisQuartos','TresQuartos','QuatroQuartos'))
})
ApenasEaston <- subset(Easton, subset=Corretora=="1")
ApenasOutrasImobiliarias <- subset(Easton, subset=Corretora=="0")

library(abind, pos=16)
library(e1071, pos=17)
numSummary(Easton[,"Preço", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##      mean       sd   IQR    0%    25%    50%    75%   100%   n
##  140056.7 22136.66 35400 99000 121800 138600 157200 190650 461
numSummary(Easton[,"PrecoPorTamanho", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##      mean       sd      IQR       0%      25%      50%      75%   100%   n
##  816.3591 119.8829 198.6328 582.2271 711.6927 803.1618 910.3256 1146.4 461
numSummary(Easton[,"PrecoPorTamanho", drop=FALSE], statistics=c("mean", "sd", "quantiles", "cv"), quantiles=c(0,.25,.5,.75,1))
##      mean       sd        cv       0%      25%      50%      75%   100%
##  816.3591 119.8829 0.1468507 582.2271 711.6927 803.1618 910.3256 1146.4
##    n
##  461
par(bg="lightgreen")
with(ApenasEaston, Barplot(MesFator, xlab="Mês", ylab="CasasVendidasPelaEaston",col="darkred"))

x11()
par(bg="lightyellow")
with(ApenasOutrasImobiliarias, Barplot(MesFator, xlab="Mês", ylab="CasasVendidasPorOutras Imobiliarias",col="orange"))

x11()
par(bg="lightgreen")
Boxplot(Preço~MesFator, data=ApenasEaston, id=list(method="y"), xlab="Mês", main="DistribuicaoDosPrecosEaston",col="darkred")

## [1] "406"
x11()
par(bg="lightyellow")
Boxplot(Preço~MesFator, data=ApenasOutrasImobiliarias, id=list(method="y"), xlab="Mês", main="DistribuicaoDosPrecosOutrasImobiliarias",col="orange")

Tendência dos preços ao longo dos meses

Dos gráficos de barras, observa-se que a tendência de vendas da Easton não é a mesma das outras imobiliárias. Junho, mês de maior quantidade de vendas da Easton, é o mês em que as outras imobiliárias menos venderam. Dos gráficos de barra e dos boxplots pode-se concluir que: Para as Outras Imobiliárias, conforme a frequência de vendas diminuiu os preços também tenderam a diminuir,vide a mediana. Porém a dispersão se manteve praticamente constante. Já para Easton ocorreu o oposto, quando as vendas diminuíram os preços tenderam a aumentar. A dispersão não obedeceu um padrão bem definido, estando bem reduzida no mês de junho, onde as vendas se concentraram nos valores mais baixos.

##Matriz de Correlação Easton

x11()
MC<-cor(ApenasEaston[,c("Preço","Tamanho","Quartos","Idade")], use="complete")
corrplot(MC,method="number")

Para a Easton os coeficientes de correlação encontrados foram em ordem decrescente: 0,65 para o tamanho 0,30 para o número de quartos -0,16 para a idade da casa O maior valor de correlação foi para Tamanho, indicando que essa é a variável de maior peso na definição do preço. Logo depois vem o Número de Quartos, com menos da metade do peso da variável anterior. E por último a correlação negativa indicando que a relação é inversa entre o Preço e a Idade, quanto mais velha a casa menor é o preço.

##Matriz de Correlação Outras Imobiliária

x11()
MC<-cor(ApenasOutrasImobiliarias[,c("Preço","Tamanho","Quartos","Idade")], use="complete")
corrplot(MC,method="number")

Para as outras imobiliárias os coeficientes de correlação encontrados foram em ordem decrescente: 0,59 para o tamanho 0,34 para o número de quartos 0,02 para a idade da casa A ordem de influência no peso das variáveis é a mesma que na Easton, entretanto a influência da Idade é praticamente nula.

##Número de Quartos

x11()
par(bg="lightyellow")
Boxplot(Preço~QuartosFator, data=ApenasOutrasImobiliarias, id=list(method="y"), xlab="NumeroDeQuartos", main="DistribuicaoDoPrecoPorNumeroDeQuartosOutrasImobiliarias",col="orange")

## [1] "74"
x11()
par(bg="lightgreen")
Boxplot(Preço~QuartosFator, data=ApenasEaston, id=list(method="y"), xlab="NumeroDeQuartos",
   main="DistribuicaoDoPrecoPorNumeroDeQuartosEaston",col="darkred")

## [1] "177" "254" "255" "269"

Em todos os grupos (Dois, Três ou Quatro Quartos) a mediana das Outras Imobiliárias é maior que a da Imobiliária Easton . Também em todos os grupos a dispersão da Easton é menor. Para os imóveis de dois quartos, o valor máximo de venda da Easton é menor que a mediana das demais imobiliárias, evidenciando valores muito baixos em relação aos preços praticados. Para os imóveis de três quartos há três outliers e os preços deles apareceriam normalmente na distribuição das demais imobiliárias. Isto é, valores considerados excepcionais dentro da Easton, seriam valores comuns praticados na venda dos imóveis. Para os imóveis de quatro quartos, na Easton observa-se um ligeiro deslocamento da mediana para cima, mostrando uma concentração das vendas com valores mais altos dentro dos próprios valores da Easton. Observa-se também bem poucas vendas realizadas no primeiro quartil, isto é, com os valores mais baixos.

Idade

x11()
par(bg="lightyellow")
Boxplot(Preço~IdadeFator, data=ApenasOutrasImobiliarias, id=list(method="y"), xlab="Idade", 
  main="PrecoPorIdadeOutrasImobiliarias",col="orange")

x11()
par(bg="lightgreen")
Boxplot(Preço~IdadeFator, data=ApenasEaston, id=list(method="y"), xlab="Idade", 
  main="PrecoPorIdadeEaston",col="darkred")

## [1] "269" "343"

Tal qual mostrado na Matriz de Correlação, a correlação entre Preço e Idade é pequena em ambos os bancos de dados. Sendo pouco maior na Easton, onde é possível observar os valores de mediana dos preços diminuindo conforme a idade aumenta e é possível observar que há excessões, observadas nas idades de cinco, oito e onze, a correlação é fraca (-0,16). Para as demais Imobiliárias não é possível observar uma tendência, o que está de acordo com a correlação quase nula, informada na Matriz de Correlação. O principal porém é perceber que a maioria das medianas da Easton está abaixo das medianas das outras imobiliárias e a dispersão dela é bem menos padronizada, sendo muito grande para algumas idades e muito pequena para outras. Isso se traduz em valores mais baixos e menos previsíveis.

##Localizacao

x11()
par(bg="lightyellow")
Boxplot(Preço~LocalizacaoFator, data=ApenasOutrasImobiliarias, id=list(method="y"), 
  xlab="Localizacao", main="DistribuicaoDosPrecosPorLocalizacaoOutrasImobiliarias",col="orange")

## [1] "331" "333"
x11()
par(bg="lightgreen")
Boxplot(Preço~LocalizacaoFator, data=ApenasEaston, id=list(method="y"), xlab="Localizacao",
   main="DistribuicaoDosPrecosPorLocalizacaoEaston",col="darkred")

## [1] "254"

Dos boxplots acima observa-se que Dallas é a Localização mais valorizada. Nessa região a mediana da Easton (160.950) é maior que a das Outra Imobiliárias(152.475), já as variâncias são próximas. FortWorth e a Região Metropolitana têm entre si valores parecidos de mediana ( 126.675 e 124.950, respectivamente) nas vendas realizadas pela Easton e (124.200 e 126.375) nas vendas realizadas pelas Outras Imobiliárias. Resumidamente, nota-se que em FortWorth a Easton a Easton consegue vender com preços maiores tal qual ocorre em Dallas, mas diferente do que ocorre na Região Metropolitana. Considerando que em todas as avaliações anteriores os preços praticados pela Easton foram menores que os praticados no Mercado Imobiliário, tentou-se verificar quais as causas do comportamento anômalo apresentado no estudo Preços x Localização. Essa foi a única análise em que a Easton não apareceu com valores tão muito abaixo das demais, tendo até assumido a liderança em duas das regiões. Lembrando que a correlação Preço x Tamanho era a maior em todas as imobiliárias, repetiu-se a análise anterior porém com a variável PreçoPorTamanho em vez da variável Preço.

##Preço por tamanho de acordo com a localização

x11()
par(bg="lightgreen")
Boxplot(PrecoPorTamanho~LocalizacaoFator, data=ApenasEaston, id=list(method="y"), 
  xlab="Localizacao", main="DistribuicaoDosPrecosPorTamanhoLocalizacaoEaston",col="darkred")

x11()
par(bg="lightyellow")
Boxplot(PrecoPorTamanho~LocalizacaoFator, data=ApenasOutrasImobiliarias, id=list(method="y"),main="DistribuicaoDosPrecosPorTamanhoLocalizacaoOutrasImobiliarias",col="orange")

## [1] "7"   "98"  "203" "184"
numSummary(ApenasEaston[,"Preço", drop=FALSE], groups=ApenasEaston$LocalizacaoFator, 
  statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##                         mean       sd   IQR     0%    25%    50%    75%
## Dallas              156942.9 20334.77 22800 118200 149325 160950 172125
## FortWorth           127387.5 15190.67 15300 100050 119025 126675 134325
## RegiaoMetropolitana 124520.0 14565.99 17475  99450 113325 124950 130800
##                       100% Preço:n
## Dallas              176550       7
## FortWorth           173850      24
## RegiaoMetropolitana 156450      15
numSummary(ApenasOutrasImobiliarias[,"Preço", drop=FALSE], 
  groups=ApenasOutrasImobiliarias$LocalizacaoFator, statistics=c("mean", "sd", "IQR", "quantiles"), 
  quantiles=c(0,.25,.5,.75,1))
##                         mean       sd     IQR     0%      25%    50%
## Dallas              152210.0 19626.27 28537.5 101550 138637.5 152475
## FortWorth           129895.1 19986.06 30150.0  99000 115125.0 124200
## RegiaoMetropolitana 129283.5 16746.03 21262.5 102150 117675.0 126375
##                          75%   100% Preço:n
## Dallas              167175.0 190650     210
## FortWorth           145275.0 184800     123
## RegiaoMetropolitana 138937.5 177750      82
numSummary(ApenasEaston[,"PrecoPorTamanho", drop=FALSE], 
  groups=ApenasEaston$LocalizacaoFator, statistics=c("mean", "sd", "IQR", "quantiles"), 
  quantiles=c(0,.25,.5,.75,1))
##                         mean       sd      IQR       0%      25%      50%
## Dallas              909.1954 50.13044 55.67423 856.7637 877.0554 893.2084
## FortWorth           729.1349 55.45550 59.83727 649.8913 692.2490 720.0224
## RegiaoMetropolitana 686.3464 45.57419 51.17777 620.5469 655.6196 685.1506
##                          75%     100% PrecoPorTamanho:n
## Dallas              932.7296 994.8260                 7
## FortWorth           752.0863 846.8381                24
## RegiaoMetropolitana 706.7974 775.5933                15
numSummary(ApenasOutrasImobiliarias[,"PrecoPorTamanho", drop=FALSE], groups=ApenasOutrasImobiliarias$LocalizacaoFator, statistics=c("mean", "sd", 
  "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##                         mean       sd      IQR       0%      25%      50%
## Dallas              922.6521 73.05767 95.41631 761.8183 870.1312 917.6219
## FortWorth           741.6039 57.53143 73.18565 623.0297 703.2794 738.0106
## RegiaoMetropolitana 697.6651 57.21552 87.92746 582.2271 650.6417 697.8012
##                          75%      100% PrecoPorTamanho:n
## Dallas              965.5475 1146.4002               210
## FortWorth           776.4650  904.0302               123
## RegiaoMetropolitana 738.5692  871.4490                82

O preço por metro quadrado já segue a seguinte tendência: Easton com os menores valores de mediana para as regiões de Dallas e Região Metropolitana, ou seja, Easton com preços menores nessas duas regiões . E em FortWorth com valores semelhantes de mediana para todas as imobiliárias (sendo de 720,0 para a Easton e 738,01 para as Outras). Em todos as localizações a Easton apresentou menor preço por metro quadrado. Dos dois gráficos acima é possível afirmar que: Em Dallas e FortWorth, embora em valores absolutos a Easton tenha superado as outras, os valores de venda poderiam ser ainda maiores se o tamanho das casas fosse considerado. Observação: Os valores numéricos só foram indicados no texto quando o gráfico não permitia uma comparação visual.

###Conclusão1 Todas as variáveis disponíveis para a comparação entre a Easton e as demais Imobiliárias foram usadas no presente estudo, mesmo aquelas de baixa correlação indicadas na Matriz de Coorelação. Com a ajuda do software R, análises estatísticas foram realizadas para cada uma delas. Em todas as análises, a Easton apresentou uma tendência a vender os imóveis por valores mais baixos que os praticados pelas imobiliárias concorrentes.

##Segunda parte da Análise

OutrasImobiliariasMaisQueixosos <- 
  readXL("C:/Users/Mariana/Desktop/Estatística/Base_de_dados-master/Base_de_dados-master/Base de dados - Outras Imobiliária - Mais Dois Reclamantes.xlsx",
   rownames=FALSE, header=TRUE, na="", sheet="Banco de Dados", stringsAsFactors=TRUE)

OutrasImobiliariasMaisQueixosos$precoPorTamanho <- with(OutrasImobiliariasMaisQueixosos, Preço/ Tamanho)
OutrasImobiliariasMaisQueixosos <- within(OutrasImobiliariasMaisQueixosos, {
  LocalizacaoFator <- factor(Localização, labels=c('Dallas','FortWorth','RegiaoMetropolitana'))
})


QueixososEmOutra <- subset(OutrasImobiliariasMaisQueixosos, subset=Corretora=="0")

x11()
par(bg="lightyellow")
Boxplot(Preço~LocalizacaoFator, data=QueixososEmOutra, id=list(method="y"),col=c("orange"))

## [1] "331" "333"
x11()
par(bg="lightyellow")
Boxplot(precoPorTamanho~LocalizacaoFator, data=QueixososEmOutra, id=list(method="y"),col=c("orange"))

## [1] "7"   "98"  "203" "463" "184" "462" "168"

##Conclusão2 A segunda parte do estudo consiste em averiguar quanto a subvalorização dos imóveis dos vendedores queixosos. Para tal, na base de dados foram incluídos os dados referentes aos vendedores queixosos como se as vendas referentes a eles não tivessem sido realizadas pela Easton .Foram montados os gráficos abaixo. Os gráficos ilustram a distribuição da variável Preço e Preço/Tamanho para as Outras Imobiliárias.

No primeiro gráfico, onde apenas o preço é considerado,os reclamantes não apareceram como outliers indicando assim que o preço absoluto da venda das casas estaria dentro da distribuição normal dos preços praticada. O segundo gráfico, onde a variável Preço/Tamanho é analisada, ambos os queixosos aparecem como outliers (indicados pelos números 462 e 463). Pode-se dizer que os reclamantes tiveram suas casas subvalorizadas , visto que características como Tamanho não foram consideradas na hora de avaliar esses dois imóveis.