Lokaverkefni

Hluti 1

b)

Hlöðum inn pökkum:

library(tidyverse)
library(knitr)

c)

Lesum inn gagnaskrá:

kaj <- read.table("https://notendur.hi.is/~ahj/husnaedisverd_2017.csv", sep = ";", header = T)

d)

Búm til nýja breytu fyrir fermetraverð:

kaj <- mutate(kaj, fermetraverd = kaupverd/birtm2)

e)

Búum til nýju breytuna teg_eign_groft byggt á teg_eign:

kaj <- mutate(kaj, teg_eign_groft = fct_recode(teg_eign, Sérbýli = "Einbýlishús", Sérbýli = "Parhús", Sérbýli = "Raðhús", Íbúð = "Íbúðareign"))

f)

Veljum þrjú hverfi úr gagnasafninu sem við notum hér eftir:

hverfi <- c(120, 130, 140)
kaj <- filter(kaj, matssvaedi%in%hverfi)
table(kaj$matssvaedi, kaj$teg_eign_groft)
##      
##       Sérbýli Íbúð
##   120     171  401
##   130     157  893
##   140      34   52

g)

Endurnefnum hverfin með viðeigandi nöfnum:

kaj <- mutate(kaj, teg_eign_groft,  hverfi=factor(matssvaedi))
kaj <- mutate(kaj, teg_eign_groft, matssvaedi = fct_recode(hverfi, GrafarvogurN ="120", GrafarvogurS ="130", GrafarvogurA ="140"))

Hluti 2

h)

Teiknum mynd sem sýnir fjölda eigna eftir hverfum:

ggplot(kaj, aes(x = matssvaedi)) + geom_bar() + labs(x = "Hverfi", y = "Fjöldi eigna") + theme_classic()

i)

Teiknum mynd sem sýnir fjölda eigna eftir hverfum og tegundum:

ggplot(kaj, aes(x = matssvaedi, fill = teg_eign_groft)) + geom_bar(position = "dodge") + labs(x = "Hverfi", y = "Fjöldi eigna", fill = "Tegund eigna")

j)

Teiknum mynd sem er lýsandi fyrir stærð sérbýla eftir hverfum:

filter(kaj, teg_eign_groft == "Sérbýli") %>% ggplot(aes(x = matssvaedi, y = birtm2)) + geom_boxplot() + labs(x = "Hverfi", y = "Stærð (fermetrar)")

k)

Teiknum mynd sem sýnir fermetraverð íbúða eftir hverfum:

filter(kaj, teg_eign == "Íbúðareign") %>% ggplot(aes(x = matssvaedi, y = fermetraverd)) + geom_boxplot() + labs(x = "Hverfi", y = "Fermetraverð")

l)

Teiknum mynd sem sýnir stærð eigna og kaupverð skipt eftir hverfum:

ggplot(kaj, aes(x = birtm2, y = kaupverd)) + geom_point(aes(col=teg_eign_groft)) + facet_grid(~matssvaedi) + labs(x = "Stærð (fermetrar)", y = "Verð (krónur)", col = "Tegund eigna")

Hluti 3

m)

medal <- round(mean(kaj$fermetraverd)*1000)
stadal <- round(sd(kaj$fermetraverd)*1000)

Meðaltal fermetraverðs í þessum hverfum er 261049 kr. og staðalfrávik er 42133.

n)

Búum til töflu sem sýnir fjölda eigna í hverfunum eftir gerð eigna:

table(kaj$matssvaedi, kaj$teg_eign_groft) %>% kable()
Sérbýli Íbúð
GrafarvogurN 171 401
GrafarvogurS 157 893
GrafarvogurA 34 52

o)

Búum til töflu sem sýnir hlutfall sérbýla og íbúða í hverfunum þremur:

round(prop.table(table(kaj$matssvaedi,kaj$teg_eign_groft), margin = 1),3) %>% kable()
Sérbýli Íbúð
GrafarvogurN 0.299 0.701
GrafarvogurS 0.150 0.850
GrafarvogurA 0.395 0.605

p)

Búum til töflu sem sýnir meðaltal, miðgildi, staðalfrávik fermetraverðs og fjölda skipt upp eftir hverfum og tegund eigna:

kaj %>%
  group_by(matssvaedi, teg_eign_groft) %>%
  summarise(meðaltal = mean(fermetraverd), staðalfrávik =sd(fermetraverd), miðgildi = median(fermetraverd), Fjöldi = n()) %>% kable()
matssvaedi teg_eign_groft meðaltal staðalfrávik miðgildi Fjöldi
GrafarvogurN Sérbýli 255.1654 33.01490 255.6818 171
GrafarvogurN Íbúð 257.2225 49.96842 251.2000 401
GrafarvogurS Sérbýli 264.5067 33.02965 266.0377 157
GrafarvogurS Íbúð 262.7283 41.29434 259.3985 893
GrafarvogurA Sérbýli 279.8408 39.08585 278.8000 34
GrafarvogurA Íbúð 258.3274 38.60694 246.4124 52

q)

Teiknum mynd sem sýnir sambandið á milli stærðar og kaupverðs íbúða í hverfunum þremur:

filter(kaj, teg_eign == "Íbúðareign") %>%
  ggplot(aes(x = birtm2, y = kaupverd)) + geom_point(aes()) + labs(x = "Stærð (fermetrar)", y = "Kaupverd") + geom_smooth(method = "lm")

r)

Smíðum einfalt línulegt aðhvarf:

fit <- lm(kaupverd ~ birtm2, data = kaj)
summary(fit)
## 
## Call:
## lm(formula = kaupverd ~ birtm2, data = kaj)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -22634.6  -3096.9   -246.3   3182.8  30980.8 
## 
## Coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept) 3525.958    326.854   10.79 <0.0000000000000002 ***
## birtm2       226.825      2.536   89.46 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4978 on 1706 degrees of freedom
## Multiple R-squared:  0.8243, Adjusted R-squared:  0.8242 
## F-statistic:  8003 on 1 and 1706 DF,  p-value: < 0.00000000000000022

Matið á skurðpunktinum er 3525.96 og matið á hallatölunni er 226.82

Þetta er besta tölfræðilega ágiskunin sem við höfum út frá einungis þessum tveimur breytum. Það er þó ekki skynsamlegt að stóla einungis á þetta þar sem skekkjumörkin geta orðið stór samanber staðalfrávikið

s)

Staðalfrávik þýðis er táknað með \(/sigma\). Staðalfrávik úrtaks reiknast sem: \[ s = \sqrt{\frac{\sum_{i = 1}^n (x_{i}-\bar{x})^2}{n-1}} \]