Lokaverkefni
Hluti 1
c)
Lesum inn gagnaskrá:
e)
Búum til nýju breytuna teg_eign_groft byggt á teg_eign:
Hluti 2
h)
Teiknum mynd sem sýnir fjölda eigna eftir hverfum:
ggplot(kaj, aes(x = matssvaedi)) + geom_bar() + labs(x = "Hverfi", y = "Fjöldi eigna") + theme_classic()i)
Teiknum mynd sem sýnir fjölda eigna eftir hverfum og tegundum:
ggplot(kaj, aes(x = matssvaedi, fill = teg_eign_groft)) + geom_bar(position = "dodge") + labs(x = "Hverfi", y = "Fjöldi eigna", fill = "Tegund eigna")j)
Teiknum mynd sem er lýsandi fyrir stærð sérbýla eftir hverfum:
filter(kaj, teg_eign_groft == "Sérbýli") %>% ggplot(aes(x = matssvaedi, y = birtm2)) + geom_boxplot() + labs(x = "Hverfi", y = "Stærð (fermetrar)")Hluti 3
m)
Meðaltal fermetraverðs í þessum hverfum er 261049 kr. og staðalfrávik er 42133.
n)
Búum til töflu sem sýnir fjölda eigna í hverfunum eftir gerð eigna:
| Sérbýli | Íbúð | |
|---|---|---|
| GrafarvogurN | 171 | 401 |
| GrafarvogurS | 157 | 893 |
| GrafarvogurA | 34 | 52 |
o)
Búum til töflu sem sýnir hlutfall sérbýla og íbúða í hverfunum þremur:
| Sérbýli | Íbúð | |
|---|---|---|
| GrafarvogurN | 0.299 | 0.701 |
| GrafarvogurS | 0.150 | 0.850 |
| GrafarvogurA | 0.395 | 0.605 |
p)
Búum til töflu sem sýnir meðaltal, miðgildi, staðalfrávik fermetraverðs og fjölda skipt upp eftir hverfum og tegund eigna:
kaj %>%
group_by(matssvaedi, teg_eign_groft) %>%
summarise(meðaltal = mean(fermetraverd), staðalfrávik =sd(fermetraverd), miðgildi = median(fermetraverd), Fjöldi = n()) %>% kable()| matssvaedi | teg_eign_groft | meðaltal | staðalfrávik | miðgildi | Fjöldi |
|---|---|---|---|---|---|
| GrafarvogurN | Sérbýli | 255.1654 | 33.01490 | 255.6818 | 171 |
| GrafarvogurN | Íbúð | 257.2225 | 49.96842 | 251.2000 | 401 |
| GrafarvogurS | Sérbýli | 264.5067 | 33.02965 | 266.0377 | 157 |
| GrafarvogurS | Íbúð | 262.7283 | 41.29434 | 259.3985 | 893 |
| GrafarvogurA | Sérbýli | 279.8408 | 39.08585 | 278.8000 | 34 |
| GrafarvogurA | Íbúð | 258.3274 | 38.60694 | 246.4124 | 52 |
q)
Teiknum mynd sem sýnir sambandið á milli stærðar og kaupverðs íbúða í hverfunum þremur:
filter(kaj, teg_eign == "Íbúðareign") %>%
ggplot(aes(x = birtm2, y = kaupverd)) + geom_point(aes()) + labs(x = "Stærð (fermetrar)", y = "Kaupverd") + geom_smooth(method = "lm")r)
Smíðum einfalt línulegt aðhvarf:
##
## Call:
## lm(formula = kaupverd ~ birtm2, data = kaj)
##
## Residuals:
## Min 1Q Median 3Q Max
## -22634.6 -3096.9 -246.3 3182.8 30980.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3525.958 326.854 10.79 <0.0000000000000002 ***
## birtm2 226.825 2.536 89.46 <0.0000000000000002 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4978 on 1706 degrees of freedom
## Multiple R-squared: 0.8243, Adjusted R-squared: 0.8242
## F-statistic: 8003 on 1 and 1706 DF, p-value: < 0.00000000000000022
Matið á skurðpunktinum er 3525.96 og matið á hallatölunni er 226.82
Þetta er besta tölfræðilega ágiskunin sem við höfum út frá einungis þessum tveimur breytum. Það er þó ekki skynsamlegt að stóla einungis á þetta þar sem skekkjumörkin geta orðið stór samanber staðalfrávikið
s)
Staðalfrávik þýðis er táknað með \(/sigma\). Staðalfrávik úrtaks reiknast sem: \[ s = \sqrt{\frac{\sum_{i = 1}^n (x_{i}-\bar{x})^2}{n-1}} \]