Apresentação

O caso Easton retrata a ocorrência de duas reclamações que foram feitas por dois clientes que contraram o serviço da imobiliária Easton para venda de seus imóveis. O período em questão é marcado de problemas econômicos de diversas fontes que contribuíram para um aumento do número de casas à venda no mercado imobiliário, gerando assim uma dificuldade de venda de imóveis. Em suma, duas casas de clientes da Easton foram vendidas aparentemente por um preço bem abaixo do mercado, estratégia que, embora antiética (corretores devem sempre agir no melhor interesse do vendedor), é usada por alguns comerciantes de imóveis para vendas mais rápidas. As casas referidas possuem as seguintes características:

A análise a seguir tem por objetivo esclarecer o ocorrido e verificar se de fato os imóveis dos clientes em questão foram subvalorizados ou não, em relação aos imóveis vendidos na região e, por fim, constatar se tais reclamações são verdadeiras ou falsas.

Análise

Etapa 1 - Verificação de Subvalorização dos Imóveis da Easton em Relação ao Mercado

Para realização desta etapa, carregou-se o banco de dados referente ao preço do imóveis da região nos últimos quatro meses e que, apesar de não conter todas as informações de vendas de casa da área referida, este representava toda a população. Logo após o carregamento, estudou-se o mesmo e em seguida construiu-se uma matriz de correlação das variáveis da amostra para identificar o grau de correlação entre as mesmas.

No banco de dados em questão, verificou-se que os imóveis dos clientes A e B, com exatamente as mesmas características, encontravam-se registrados no banco de dados disponibilizado com valor de USD 132750 e USD 119250 respectivamente. Diante disto optou-se por realizar a análise mediante os valores registrados no banco de dados.

A matriz de correlação entre as variáveis é apresentada a seguir.

Analisando a matriz de correlação, é válido mencionar que o coeficiente de correlação de Pearson (r) sempre apresenta como resultado um valor entre -1 e 1. Se a correlação for positiva tem-se r>0, neste caso à medida que uma variável x, cresce, a outra y, também cresce. Porém, se a correlação for negativa, tem-se r<0, ou seja, à medida que x diminui, y também decresce. A seguir esta um guia de como esta correlação entre variáveis pode ser interpretada.

Também foi construído um modelo de regressão linear múltipla entre as variáveis para identificar seus graus de relevância na amostra através do p-valor. Em termos gerais, se o p-valor entre as variáveis analisadas for maior do que 0,05 (5% de nível de significância), indica então não ser relevante, podendo ser desprezada da análise. O resumo numérico do modelo de regressão linear mencionado é exposto adiante.

## 
## Call:
## lm(formula = Preco ~ Corretora + Idade + Localizacao + Mes + 
##     Quartos + Tamanho, data = BD1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -21039.4  -6735.3    269.9   6600.0  26901.7 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  88957.95    3416.94  26.034   <2e-16 ***
## Corretora    -2705.23    1436.95  -1.883   0.0604 .  
## Idade         -400.26     204.84  -1.954   0.0513 .  
## Localizacao -19072.44     572.39 -33.321   <2e-16 ***
## Mes          -4639.82     380.88 -12.182   <2e-16 ***
## Quartos       1292.25     892.95   1.447   0.1485    
## Tamanho        596.59      19.41  30.739   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9075 on 454 degrees of freedom
## Multiple R-squared:  0.8341, Adjusted R-squared:  0.832 
## F-statistic: 380.6 on 6 and 454 DF,  p-value: < 2.2e-16

A partir do resumo verifica-se que três variáveis podem ser descartadas da amostra, pois seu grau de relevância na análise não é significante, sendo estas “Idade” (p-valor: 0.0513), “Corretora” (p-valor: 0.0604) e “Quartos” (p-valor: 0.1485), todas com p-valor superior a 5%.

Conclusão Referente a Etapa 1

Como o primeiro interesse desta análise é verificar se a corretora Easton tem realmente subvalorizado seus imóveis em relação ao mercado (concorrentes), conclui-se então que, como a variável “Corretora” não é significativa para variação nos preços dos imóveis dentro da amostra, isto significa dizer que, para qualquer uma das variáveis corretoras, Easton e concorrentes, o valor do preço dos imóveis tende a ser o mesmo, não havendo uma variação significativa entre o preço de ambas. Portanto, a Easton Imobiliária não subvaloriza seus imóveis.

Etapa 2 - Verificação de Subvalorização das Casas em Questão

Para execução desta etapa, primeiramente excluiu-se da amostra as variáveis “Idade” e “Quartos”, como também os valores referentes a imobiliária Easton, para examinar somente os dados do mercado imobiliário (concorrentes). Depois, acrescentou-se na amostra uma nova variável “Preco.m2” referente ao preço do imóvel por m², não havendo assim a necessidade de manter as variáveis “Preço” e “Tamanho”. Em seguida, construiu-se uma nova matriz de correlação conforme apresentado abaixo:

De posse da nova matriz de correlação entre as variáveis restantes e com base no guia de interpretação de “r”, percebe-se que as variáveis “Preco.m2” e “Localizacao” possuem um grau de relacionamento de 0,8 (grau bom ou excelente). Isto é um bom indicador para dizer que, uma reta gerada a partir do diagrama de dispersão entre ambas variáveis representa, com precisão aceitavel, o comportamento dos dados. Entretanto, para averiguar essa informação é preciso calcular coefiente de determinação “R²” para verificar se o modelo é explicativo. Em linhas gerais, quanto maior o “R²” (0<=R²<=1) mais explicativo será o modelo adotado. O diagrama de dispersão, bem como o resumo da regressão linear, seguem abaixo:

## 
## Call:
## lm(formula = Preco.m2 ~ Localizacao, data = BD)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -161.428  -49.815   -5.125   48.620  239.387 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1029.570      8.142  126.45   <2e-16 ***
## Localizacao -122.556      4.268  -28.72   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 71.76 on 459 degrees of freedom
## Multiple R-squared:  0.6424, Adjusted R-squared:  0.6416 
## F-statistic: 824.7 on 1 and 459 DF,  p-value: < 2.2e-16

Com o resumo numérico da regressão linear em mãos, nota-se que o valor do coeficiente “R²” é de 0.6424. Normalmente, trabalha-se com modelos com R² de 0,7 ou mais, porém como a variável “Localizacao” é mais relevante na amostra do que a variável “Mes”, optou-se por trabalhar com o valor de R² encontrado.

Do resumo também pôde-se construir a equação que representa a reta, onde 1029.570 representa o coeficiente linear e -122.556 representa o coeficiente angular, assim a equação da reta é dada por:

                                                   y = -122.556x + 1029.57

De posse da equação da reta, foi possível calcular os erros entre os preços da amostra, que será utilizado para corrigir todos os valores de “Preco.m²” com relação a uma localização apenas, isto é, determinar quanto seria o preço/m² dos imóveis de Fort Worth e Dallas em Arlington, por exemplo. O cálculo para se encontrar o valor dos erros é ilustrado a seguir:

                                   y1 = -122.556(1) + 1029.57 => y1 = 907.014(dólares)/m²

                                   y2 = -122.556(2) + 1029.57 => y2 = 784.458(dólares)/m²
                                   
                                   y3 = -122.556(3) + 1029.57 => y3 = 661.902(dólares)/m²
                                   
                                 e13 = 661.902 - 907.014 = -245.112 (erro região 1 para 3)
                                   
                                 e23 = 784.458 - 907.014 = -122.556 (erro região 2 para 3)

Com os erros determinados, corrigiu-se os valores da seguinte forma, para valores da região 1 (Dallas) somou-se -245.112 e para valores da região 2 (Fort Worth), somou-se -122.556. Como a região estabelecida como parâmetro para correção foi a região de Arlington, os valores de seus imovéis por m² permanecem os mesmos. Uma tabela com os preços/m² corrigidos foi construída conforme é apresentado a seguir:

Tabela Valores Corrigidos

Mes Preco.m2.Cor
3 751.5836
3 668.8396
3 673.7642
3 718.6269
3 822.5048
3 893.9309
3 795.0373
3 602.1506
3 705.8764
3 760.9902
3 808.4253
3 807.9912
3 616.6218
3 727.3974
3 689.2789
3 741.5091
3 621.6584
3 720.4319
3 622.7456
3 815.3255
3 639.2807
3 742.5057
3 769.7681
3 673.5811
3 685.7246
3 700.3931
3 693.5792
3 730.6682
3 751.2116
3 739.4847
3 713.0808
3 723.5799
3 633.1222
3 604.9902
3 714.4027
3 622.2507
3 689.5383
3 664.3497
3 692.9566
3 782.8583
3 651.0839
3 755.7639
3 662.6247
3 652.9519
3 799.8827
3 617.5873
3 558.0040
3 665.1368
3 741.7412
3 586.5308
3 691.1031
3 727.5398
3 629.5905
3 691.0869
3 764.6354
3 732.0370
3 685.5249
3 583.5941
3 715.3371
3 655.3492
3 712.1211
3 796.2738
3 580.1764
3 769.9559
3 674.7628
3 743.9134
3 765.3438
3 611.8639
3 801.8739
3 696.8632
3 623.8793
3 788.1680
3 682.7536
3 680.6618
3 645.2860
3 752.6704
3 765.0656
3 638.5729
3 589.1927
3 734.3072
3 703.8382
3 740.5095
3 576.4383
3 654.7537
3 747.5010
3 712.9110
3 623.5066
3 722.1642
3 901.4002
3 667.4780
3 606.6681
3 737.7489
3 737.5985
3 680.0173
3 630.5570
3 622.2425
3 618.8058
3 692.3613
3 767.7937
3 671.4076
3 774.3556
3 752.6075
3 804.3812
3 730.8285
3 651.2316
3 759.7526
3 601.6501
3 839.9053
3 648.2394
3 603.2485
3 622.6302
3 659.7178
3 580.1667
3 688.8536
3 612.1782
4 629.0509
4 708.9930
4 752.0478
4 683.5016
4 676.7767
4 628.4509
4 738.6806
4 766.2908
4 624.4167
4 614.2552
4 769.2675
4 603.8582
4 589.9575
4 755.4792
4 654.6568
4 705.9279
4 718.0867
4 668.1431
4 606.3249
4 659.2460
4 645.0009
4 616.7562
4 603.1776
4 672.2542
4 663.6069
4 729.9918
4 665.3256
4 722.8595
4 573.3413
4 736.9595
4 736.4351
4 786.7871
4 715.4501
4 666.7781
4 740.4284
4 679.5743
4 728.9194
4 756.6648
4 779.6201
4 871.4490
4 748.6994
4 600.5179
4 780.7343
4 596.0235
4 624.7786
4 601.0676
4 612.1897
4 696.9083
4 698.7391
4 555.1051
4 671.7718
4 724.5258
4 776.3576
4 781.5302
4 676.2617
4 841.6844
4 683.0100
4 702.5004
4 619.3458
4 745.0593
4 657.4583
4 700.3343
4 708.3749
4 676.6158
4 651.0013
4 662.7524
4 658.4103
4 653.5997
4 725.5218
4 686.6873
4 875.7940
4 579.3427
4 654.0094
4 620.6939
4 646.4747
4 712.1738
4 698.6414
4 609.3021
4 673.1306
4 644.3749
4 677.8673
4 641.5454
4 711.6192
4 674.4173
4 647.8343
4 655.0697
4 564.1632
4 680.6576
4 728.4221
4 717.6930
4 710.5213
4 642.5485
4 630.4056
4 652.5808
4 582.2271
4 579.8272
4 776.7305
4 572.7435
4 673.9031
4 658.0020
4 596.4612
4 656.8890
4 658.3122
4 588.0704
4 674.1124
4 682.5116
4 760.4985
4 711.5006
5 609.6966
5 677.2845
5 580.8432
5 624.9956
5 589.7522
5 703.6115
5 581.1330
5 613.1114
5 672.9897
5 573.2335
5 586.9285
5 649.4918
5 826.4927
5 643.7632
5 650.5338
5 619.8544
5 590.7515
5 615.8434
5 666.0782
5 680.8949
5 680.1604
5 726.7247
5 658.2588
5 585.3441
5 546.2815
5 721.2154
5 516.8183
5 746.5987
5 668.6328
5 586.8296
5 630.4906
5 606.7318
5 636.2793
5 626.5646
5 730.9552
5 635.3671
5 627.7643
5 663.8554
5 571.2061
5 678.0308
5 699.1562
5 696.3419
5 740.6875
5 584.8427
5 729.1417
5 673.5132
5 679.7015
5 656.2136
5 640.1748
5 671.8874
5 648.6512
5 562.9204
5 856.0604
5 720.9039
5 662.0373
5 657.7392
5 686.8948
5 695.6015
5 536.1442
5 761.0508
5 627.5570
5 720.5860
5 650.5219
5 628.3040
5 606.0253
5 732.2142
5 690.0295
5 857.3729
5 640.9061
5 765.7547
5 682.0890
5 736.9634
5 699.9807
5 601.3777
5 583.1486
5 626.0109
5 689.3286
5 701.8944
5 700.3239
5 654.0665
5 645.3849
5 633.0664
5 584.4707
5 580.4257
5 653.0831
5 625.4389
5 693.8590
5 627.2912
5 574.8619
5 593.3159
5 650.2474
5 603.7652
5 637.0591
5 701.9941
5 556.8975
5 625.0411
5 542.2825
5 553.7797
5 665.8153
5 600.2198
5 634.8028
5 726.4003
5 530.2460
6 620.7865
6 528.6919
6 605.8871
6 677.7858
6 606.9225
6 613.2247
6 599.1867
6 827.6115
6 657.1273
6 618.6160
6 637.7955
6 621.7479
6 593.5950
6 526.9274
6 625.4015
6 671.5510
6 653.2683
6 538.7649
6 596.3918
6 576.0062
6 659.5220
6 548.3293
6 514.0562
6 602.6476
6 556.4778
6 679.0177
6 500.5297
6 616.1613
6 620.2558
6 687.1324
6 536.2515
6 569.1785
6 681.0435
6 535.0743
6 573.8640
6 530.6116
6 743.9333
6 610.0960
6 622.4108
6 551.1399
6 569.3438
6 609.9493
6 671.6685
6 648.7163
6 643.3233
6 618.1446
6 625.4415
6 626.9361
6 612.1419
6 642.3607
6 579.1240
6 524.0864
6 543.6232
6 519.5674
6 700.2484
6 624.6106
6 719.9429
6 641.9281
6 637.5586
6 659.2125
6 654.8001
6 504.2928
6 566.2833
6 710.8002
6 568.3972
6 655.3913
6 538.5590
6 607.4391
6 710.7767
6 702.3865
6 595.7562
6 630.8868
6 645.7021
6 615.3401
6 657.2966
6 783.7929
6 792.2185
6 620.9134
6 665.6702
6 615.5106
6 589.0009
6 622.1617
6 614.6433
6 576.8532
6 633.6056
6 626.1866
6 598.9110
6 556.9372
6 574.8274

É importante ressaltar que a coluna “Localizacao” foi excluída da análise pois todos os valores de preço/m² ficaram estabelecidos para uma região apenas, Arlington. Portanto, a região onde imóvel se encontra não importa mais na análise.

Com a tabela de valores corrigidos em mãos, calculou-se o valor de R² entre as variaveis restantes “Mes” e “Preco.m2.Cor”, porém seu valor era muito baixo para para que o modelo da reta fosse considerado explicativo para a amostra. Optou-se então por analisar a média de preços/m² do mercado no último mês, antecedente a reclamação, junho. Uma tabela com os valores referente ao mês de junho foi então construída e a mesma é apresentada adiante.

Tabela Valores Corrigidos Mês de Junho

Mes Preco.m2.Cor
6 620.7865
6 528.6919
6 605.8871
6 677.7858
6 606.9225
6 613.2247
6 599.1867
6 827.6115
6 657.1273
6 618.6160
6 637.7955
6 621.7479
6 593.5950
6 526.9274
6 625.4015
6 671.5510
6 653.2683
6 538.7649
6 596.3918
6 576.0062
6 659.5220
6 548.3293
6 514.0562
6 602.6476
6 556.4778
6 679.0177
6 500.5297
6 616.1613
6 620.2558
6 687.1324
6 536.2515
6 569.1785
6 681.0435
6 535.0743
6 573.8640
6 530.6116
6 743.9333
6 610.0960
6 622.4108
6 551.1399
6 569.3438
6 609.9493
6 671.6685
6 648.7163
6 643.3233
6 618.1446
6 625.4415
6 626.9361
6 612.1419
6 642.3607
6 579.1240
6 524.0864
6 543.6232
6 519.5674
6 700.2484
6 624.6106
6 719.9429
6 641.9281
6 637.5586
6 659.2125
6 654.8001
6 504.2928
6 566.2833
6 710.8002
6 568.3972
6 655.3913
6 538.5590
6 607.4391
6 710.7767
6 702.3865
6 595.7562
6 630.8868
6 645.7021
6 615.3401
6 657.2966
6 783.7929
6 792.2185
6 620.9134
6 665.6702
6 615.5106
6 589.0009
6 622.1617
6 614.6433
6 576.8532
6 633.6056
6 626.1866
6 598.9110
6 556.9372
6 574.8274

Com a tabela de valores corrigidos no mês de junho, construiu-se o resumo numérico da variável “Preco.m2.Cor” para identificar assim a média de preço/m² bem como o desvio padrão da mesma. O resumo é apresentado a seguir.

Resumo Numérico

##     mean       sd        cv       0%      25%      50%      75%     100%
##  617.846 63.05215 0.1020516 500.5297 574.8274 618.1446 653.2683 827.6115
##   n
##  89

Sabe-se que os valores dos imóveis dos clientes A e B, registrados no banco de dados, é de 132750 USD e 119250 USD respectivamente e, que o tamanho dos mesmos é de 203m² para a residência do cliente A e 172m² para o imóvel do cliente B. Com isso, tem-se o valor por m² dos imóveis como 653.94 USD/m² para o imóvel do cliente A e 693.31 USD/m² para a residência do cliente B.

Com base no resumo numérico, observa-se que o desvio padrão da média dos preços/m² no mês de junho foi de 63.05215 USD/m² para mais e para menos e, como a média dos preços é dada por 617.846 USD/m², tem-se os valores de mínimo e máximo, respectivamente, como 554.79 USD/m² e 680.90 USD/m². Verifica-se portanto que o valor dos imóveis cobrados pela Easton não foram subvalorizados, pois estão dentro de um desvio padrão da média o que é totalmente aceitável. Vale ressaltar que, um dos imóveis foi até um pouco supervalorizado quando comparado ao desvio padrão máximo da média.

Conclusão

Conclui-se então que, para os valores dos imóveis dos clientes A e B registrados no banco de dados, não houve subvalorização em relação ao mercado. Entretanto, pede-se que se busque a veracidade das informações de valores fornecidas pelos clientes para verificar se de fato seus imóveis foram vendidos pelos preços de 88500 USD (435.96USD/m²) para o cliente A, e 79500 USD (462.21USD/m²) para o cliente B.

Caso as informações sejam constatadas, então realmente houve uma subvalorização por parte da Easton imobiliária, caso contrário permanece a conclusão chegada nesta análise.