Zad 1. Korzystając z danych house_prices_2.dta zbuduj model regresji liniowej, w którym zmienną objaśnianą będzie cena domu. Oszacuj model w R za pomocą metody najmniejszych kwadratów. Przyjmij poziom istotności alfa= 0.05.
A) Model regresji prostej
Dodajemy attach, żeby za każdym razem nie musieć odnosić się do nazwy pliku przy wywoływaniu danych.
```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) library library(haven) library(car) house_prices_2 <- read_dta(“C:/Users/maria/Downloads/house_prices_2.dta”) View(house_prices_2)
attach (house_prices_2)
**Postać modelu teoretyczna:** price_i = beta_0+beta_1\*sqm)living_i + epsilon_i
**Postać modelu po oszacowaniu:** \^price_i = -12802,34 + 2600,35\*sqm_living_i
**Interpretacja:** ceteris paribus wzrost metrażu o 1m2 powoduje średnio wzrost ceny o 2600.35 USD +/- 27,79 USD
beta jest istotna statystycznie na poziomie 0,05
**Analiza dobroci dopasowania:** nasz model wyjasnia około 44,5% (R-kwadrat), zmienności cen, czyli nie wyjaśniliśmyy 55,5% (1- R- kwadrat) zmienności cen. Wartości teoretyczne różnią się od wartości empirycznych średnio o 206100\$ (odchylenie standardowe), co stanoi około 39% średniej ceny (odchylenie standardowe/średnia wartość).
```{r}
summary(price)
hist(price)
cor(house_prices_2, method = "spearman")
model1= lm(price ~ sqm_living)
summary(model1)
206100/529733
Poprawność modelu: występuje problem heteroskedastyczności oraz brak rozkładu normalnego reszt.
plot(sqm_living, price)
abline(model1, col="red")
plot(model1)
B) Model regresji wielorakiej.
Używamy innych dostępnych zmiennych, aby objaśnić zmienność cen.
Postać modelu teoretyczna: price_i = beta_0+beta_1*sqm_living_i + beta_2*bathrooms_i + beta_3*condition_i+ beta_4*year_built_i +beta_5*epsilon_i
Postać modelu po oszacowaniu: price_i = -1494000 +2357*sqm_living_i + 49390*bathrooms_i + 28700*condition_i+662,1*year_built_i
Wszystkie zmienne objaśniające są statystycznie istone na poziomie istotności 0.05.
Interpretacja:
W warunkach ceteris paribus, wzrost metrażu o 1m2 powoduje średnio wzrost ceny o 2357 USD +/- 36 USD.
W warunkach ceteris paribus, każda łazienka w domu więcej to cena wyższa średnio o 49390 USD +/- 4914 USD.
W warunkach ceteris paribus, im lepszy stan domu o jeden stopień to średnio cena jest wyższa o 28700 USD +/- 4758 USD.
W warunkach ceteris paribus, dla budynku młodszego o 1 rok cena będzie wyższa średnio o 662,1 USD +/- 187,9 USD.
Analiza wykresów: Możemy podejrzewać
Analiza dopasowania:
VIF - sprawdzamy czy mamy problem współliniowości, liczony jest jako (1-R2_i) z pomocniczego modelu, najlepiej kiedy VIF<10 lub VIF<5v
model2=lm(price ~ sqm_living + bathrooms + condition + year_built)
summary(model2)
avPlots(model2)
vif(model2)
Spróbuj przewidzieć wielkość popytu na komunikację autobusową przy konkretnych wartościach zmiennych objaśniających: oblicz samodzielnie na podstawie równania modelu, a następnie sprawdź wynik korzystając z komendy predict.lm(). Można tez podstawić konkretne wartości (liczbę lazienek, metraz) do oszacowanej postaci modelu.
przyklad = data.frame(sqm_living = 200)
predict.lm(model1, przyklad)
przyklad2=data.frame(sqm_living=200, bathrooms=2, condition =4, year_built=2011)
predict.lm(model2, przyklad)
Jak poprawić stastysyki? Przykładowo można zlogarytmowac wartości i stworzyć modeł wykładniczy. Model wykładniczy posiada już inną interpretację. Zmiana o jedną jednostkę zm. objaśniającej powoduje zmianę procentową. (exp(beta-1)*1
house_prices_2$logprice=log(price)
attach(house_prices_2)
hist(logprice)
LS0tDQp0aXRsZTogIk1pa3JvZWtvbm9taWEgMTUuMTAuMjAyMyINCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQoNCiMjICoqWmFkIDEuIEtvcnp5c3RhasSFYyB6IGRhbnljaCBob3VzZV9wcmljZXNfMi5kdGEgemJ1ZHVqIG1vZGVsIHJlZ3Jlc2ppIGxpbmlvd2VqLCB3IGt0w7NyeW0gem1pZW5uxIUgb2JqYcWbbmlhbsSFIGLEmWR6aWUgY2VuYSBkb211LiBPc3phY3VqIG1vZGVsIHcgUiB6YSBwb21vY8SFIG1ldG9keSBuYWptbmllanN6eWNoIGt3YWRyYXTDs3cuIFByenlqbWlqIHBvemlvbSBpc3RvdG5vxZtjaSBhbGZhPSAwLjA1LioqDQoNCioqKkEpIE1vZGVsIHJlZ3Jlc2ppIHByb3N0ZWoqKioNCg0KRG9kYWplbXkgYXR0YWNoLCDFvGVieSB6YSBrYcW8ZHltIHJhemVtIG5pZSBtdXNpZcSHIG9kbm9zacSHIHNpxJkgZG8gbmF6d3kgcGxpa3UgcHJ6eSB3eXdvxYJ5d2FuaXUgZGFueWNoLg0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCmxpYnJhcnkNCmxpYnJhcnkoaGF2ZW4pDQpsaWJyYXJ5KGNhcikNCmhvdXNlX3ByaWNlc18yIDwtIHJlYWRfZHRhKCJDOi9Vc2Vycy9tYXJpYS9Eb3dubG9hZHMvaG91c2VfcHJpY2VzXzIuZHRhIikNClZpZXcoaG91c2VfcHJpY2VzXzIpDQogDQphdHRhY2ggKGhvdXNlX3ByaWNlc18yKQ0KYGBgDQoNCioqUG9zdGHEhyBtb2RlbHUgdGVvcmV0eWN6bmE6KiogcHJpY2VfaSA9IGJldGFfMCtiZXRhXzFcKnNxbSlsaXZpbmdfaSArIGVwc2lsb25faQ0KDQoqKlBvc3RhxIcgbW9kZWx1IHBvIG9zemFjb3dhbml1OioqIFxecHJpY2VfaSA9IC0xMjgwMiwzNCArIDI2MDAsMzVcKnNxbV9saXZpbmdfaQ0KDQoqKkludGVycHJldGFjamE6KiogY2V0ZXJpcyBwYXJpYnVzIHd6cm9zdCBtZXRyYcW8dSBvIDFtMiBwb3dvZHVqZSDFm3JlZG5pbyB3enJvc3QgY2VueSBvIDI2MDAuMzUgVVNEICsvLSAyNyw3OSBVU0QNCg0KYmV0YSBqZXN0IGlzdG90bmEgc3RhdHlzdHljem5pZSBuYSBwb3ppb21pZSAwLDA1DQoNCioqQW5hbGl6YSBkb2Jyb2NpIGRvcGFzb3dhbmlhOioqIG5hc3ogbW9kZWwgd3lqYXNuaWEgb2tvxYJvIDQ0LDUlIChSLWt3YWRyYXQpLCB6bWllbm5vxZtjaSBjZW4sIGN6eWxpIG5pZSB3eWphxZtuaWxpxZtteXkgNTUsNSUgKDEtIFItIGt3YWRyYXQpIHptaWVubm/Fm2NpIGNlbi4gV2FydG/Fm2NpIHRlb3JldHljem5lIHLDs8W8bmnEhSBzacSZIG9kIHdhcnRvxZtjaSBlbXBpcnljem55Y2ggxZtyZWRuaW8gbyAyMDYxMDBcJCAob2RjaHlsZW5pZSBzdGFuZGFyZG93ZSksIGNvIHN0YW5vaSBva2/Fgm8gMzklIMWbcmVkbmllaiBjZW55IChvZGNoeWxlbmllIHN0YW5kYXJkb3dlL8WbcmVkbmlhIHdhcnRvxZvEhykuDQoNCmBgYHtyfQ0Kc3VtbWFyeShwcmljZSkNCmhpc3QocHJpY2UpDQpjb3IoaG91c2VfcHJpY2VzXzIsIG1ldGhvZCA9ICJzcGVhcm1hbiIpDQptb2RlbDE9IGxtKHByaWNlIH4gc3FtX2xpdmluZykNCnN1bW1hcnkobW9kZWwxKQ0KMjA2MTAwLzUyOTczMw0KDQpgYGANCg0KKipQb3ByYXdub8WbxIcgbW9kZWx1OioqIHd5c3TEmXB1amUgcHJvYmxlbSBoZXRlcm9za2VkYXN0eWN6bm/Fm2NpIG9yYXogYnJhayByb3prxYJhZHUgbm9ybWFsbmVnbyByZXN6dC4NCg0KYGBge3J9DQpwbG90KHNxbV9saXZpbmcsIHByaWNlKQ0KYWJsaW5lKG1vZGVsMSwgY29sPSJyZWQiKQ0KcGxvdChtb2RlbDEpDQpgYGANCg0KKioqQikgTW9kZWwgcmVncmVzamkgd2llbG9yYWtpZWouKioqDQoNClXFvHl3YW15IGlubnljaCBkb3N0xJlwbnljaCB6bWllbm55Y2gsIGFieSBvYmphxZtuacSHIHptaWVubm/Fm8SHIGNlbi4NCg0KKipQb3N0YcSHIG1vZGVsdSB0ZW9yZXR5Y3puYToqKiBwcmljZV9pID0gYmV0YV8wK2JldGFfMVwqc3FtX2xpdmluZ19pICsgYmV0YV8yXCpiYXRocm9vbXNfaSArIGJldGFfM1wqY29uZGl0aW9uX2krIGJldGFfNFwqeWVhcl9idWlsdF9pICtiZXRhXzVcKmVwc2lsb25faQ0KDQoqKlBvc3RhxIcgbW9kZWx1IHBvIG9zemFjb3dhbml1OioqIHByaWNlX2kgPSAtMTQ5NDAwMCArMjM1N1wqc3FtX2xpdmluZ19pICsgNDkzOTBcKmJhdGhyb29tc19pICsgMjg3MDBcKmNvbmRpdGlvbl9pKzY2MiwxXCp5ZWFyX2J1aWx0X2kNCg0KKipXc3p5c3RraWUgem1pZW5uZSBvYmphxZtuaWFqxIVjZSBzxIUgc3RhdHlzdHljem5pZSBpc3RvbmUgbmEgcG96aW9taWUgaXN0b3Rub8WbY2kgMC4wNS4qKg0KDQoqKkludGVycHJldGFjamE6KioNCg0KLSAgIFcgd2FydW5rYWNoIGNldGVyaXMgcGFyaWJ1cywgd3pyb3N0IG1ldHJhxbx1IG8gMW0yIHBvd29kdWplIMWbcmVkbmlvIHd6cm9zdCBjZW55IG8gMjM1NyBVU0QgKy8tIDM2IFVTRC4NCg0KLSAgIFcgd2FydW5rYWNoIGNldGVyaXMgcGFyaWJ1cywga2HFvGRhIMWCYXppZW5rYSB3IGRvbXUgd2nEmWNlaiB0byBjZW5hIHd5xbxzemEgxZtyZWRuaW8gbyA0OTM5MCBVU0QgKy8tIDQ5MTQgVVNELg0KDQotICAgVyB3YXJ1bmthY2ggY2V0ZXJpcyBwYXJpYnVzLCBpbSBsZXBzenkgc3RhbiBkb211IG8gamVkZW4gc3RvcGllxYQgdG8gxZtyZWRuaW8gY2VuYSBqZXN0IHd5xbxzemEgbyAyODcwMCBVU0QgKy8tIDQ3NTggVVNELg0KDQotICAgVyB3YXJ1bmthY2ggY2V0ZXJpcyBwYXJpYnVzLCBkbGEgYnVkeW5rdSBtxYJvZHN6ZWdvIG8gMSByb2sgY2VuYSBixJlkemllIHd5xbxzemEgxZtyZWRuaW8gbyA2NjIsMSBVU0QgKy8tIDE4Nyw5IFVTRC4NCg0KKipBbmFsaXphIHd5a3Jlc8OzdzoqKiBNb8W8ZW15IHBvZGVqcnpld2HEhw0KDQoqKkFuYWxpemEgZG9wYXNvd2FuaWE6KioNCg0KKipWSUYqKiAtIHNwcmF3ZHphbXkgY3p5IG1hbXkgcHJvYmxlbSB3c3DDs8WCbGluaW93b8WbY2ksIGxpY3pvbnkgamVzdCBqYWtvICgxLVIyX2kpIHogcG9tb2NuaWN6ZWdvIG1vZGVsdSwgbmFqbGVwaWVqIGtpZWR5IFZJRlw8MTAgbHViIFZJRlw8NXYNCg0KYGBge3J9DQptb2RlbDI9bG0ocHJpY2UgfiBzcW1fbGl2aW5nICsgYmF0aHJvb21zICsgY29uZGl0aW9uICsgeWVhcl9idWlsdCkNCnN1bW1hcnkobW9kZWwyKQ0KYXZQbG90cyhtb2RlbDIpDQp2aWYobW9kZWwyKQ0KYGBgDQoNCioqU3Byw7NidWogcHJ6ZXdpZHppZcSHIHdpZWxrb8WbxIcgcG9weXR1IG5hIGtvbXVuaWthY2rEmSBhdXRvYnVzb3fEhSBwcnp5IGtvbmtyZXRueWNoDQp3YXJ0b8WbY2lhY2ggem1pZW5ueWNoIG9iamHFm25pYWrEhWN5Y2g6IG9ibGljeiBzYW1vZHppZWxuaWUgbmEgcG9kc3Rhd2llIHLDs3duYW5pYSBtb2RlbHUsDQphIG5hc3TEmXBuaWUgc3ByYXdkxbogd3luaWsga29yenlzdGFqxIVjIHoga29tZW5keSBwcmVkaWN0LmxtKCkuKiogTW/FvG5hIHRleiBwb2RzdGF3acSHIGtvbmtyZXRuZSB3YXJ0b8WbY2kgKGxpY3pixJkgbGF6aWVuZWssIG1ldHJheikgZG8gb3N6YWNvd2FuZWogcG9zdGFjaSBtb2RlbHUuDQoNCmBgYHtyfQ0KcHJ6eWtsYWQgPSBkYXRhLmZyYW1lKHNxbV9saXZpbmcgPSAyMDApDQpwcmVkaWN0LmxtKG1vZGVsMSwgcHJ6eWtsYWQpDQoNCnByenlrbGFkMj1kYXRhLmZyYW1lKHNxbV9saXZpbmc9MjAwLCBiYXRocm9vbXM9MiwgY29uZGl0aW9uID00LCB5ZWFyX2J1aWx0PTIwMTEpDQpwcmVkaWN0LmxtKG1vZGVsMiwgcHJ6eWtsYWQpDQoNCmBgYA0KDQpKYWsgcG9wcmF3acSHIHN0YXN0eXN5a2k/IFByenlrxYJhZG93byBtb8W8bmEgemxvZ2FyeXRtb3dhYyB3YXJ0b8WbY2kgaSBzdHdvcnp5xIcgbW9kZcWCIHd5a8WCYWRuaWN6eS4gTW9kZWwgd3lrxYJhZG5pY3p5IHBvc2lhZGEganXFvCBpbm7EhSBpbnRlcnByZXRhY2rEmS4gWm1pYW5hIG8gamVkbsSFIGplZG5vc3RrxJkgem0uIG9iamHFm25pYWrEhWNlaiBwb3dvZHVqZSB6bWlhbsSZIHByb2NlbnRvd8SFLiAoZXhwKGJldGEtMSlcKjENCg0KYGBge3J9DQpob3VzZV9wcmljZXNfMiRsb2dwcmljZT1sb2cocHJpY2UpDQphdHRhY2goaG91c2VfcHJpY2VzXzIpDQpoaXN0KGxvZ3ByaWNlKQ0KYGBgDQo=