library(MASS)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
##
## select
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
eğim (β₁)
kesişim (β₀)
R-kare (R²)
geom_jitter fonksiyonunun kullanım amacı
nedir?names(Boston)
## [1] "crim" "zn" "indus" "chas" "nox" "rm" "age"
## [8] "dis" "rad" "tax" "ptratio" "black" "lstat" "medv"
Boston_tr<-Boston %>%
dplyr::select(medv,rm,lstat,chas,tax)
head(Boston_tr)
## medv rm lstat chas tax
## 1 24.0 6.575 4.98 0 296
## 2 21.6 6.421 9.14 0 242
## 3 34.7 7.185 4.03 0 242
## 4 33.4 6.998 2.94 0 222
## 5 36.2 7.147 5.33 0 222
## 6 28.7 6.430 5.21 0 222
Boston_tr<- Boston_tr %>%
rename(
konut_degeri=medv,
oda_sayisi=rm,
dusuk_sosyoek=lstat,
nehir_kenari=chas,
emlak_vergisi=tax
)
summary(Boston_tr)
## konut_degeri oda_sayisi dusuk_sosyoek nehir_kenari
## Min. : 5.00 Min. :3.561 Min. : 1.73 Min. :0.00000
## 1st Qu.:17.02 1st Qu.:5.886 1st Qu.: 6.95 1st Qu.:0.00000
## Median :21.20 Median :6.208 Median :11.36 Median :0.00000
## Mean :22.53 Mean :6.285 Mean :12.65 Mean :0.06917
## 3rd Qu.:25.00 3rd Qu.:6.623 3rd Qu.:16.95 3rd Qu.:0.00000
## Max. :50.00 Max. :8.780 Max. :37.97 Max. :1.00000
## emlak_vergisi
## Min. :187.0
## 1st Qu.:279.0
## Median :330.0
## Mean :408.2
## 3rd Qu.:666.0
## Max. :711.0
konut değeri için ortalama, medyan ve ranj değerlerini açıklayacak olursam ortalaması 21.20 medyanı 22.53 ve ranjı 50.00
table(Boston_tr$nehir_kenari)
##
## 0 1
## 471 35
prop.table(table(Boston_tr$nehir_kenari))*100
##
## 0 1
## 93.083004 6.916996
Boston_tr %>%
count(nehir_kenari) %>%
mutate(yuzde=round((n/sum(n))* 100,2))
## nehir_kenari n yuzde
## 1 0 471 93.08
## 2 1 35 6.92
glimpse(Boston_tr)
## Rows: 506
## Columns: 5
## $ konut_degeri <dbl> 24.0, 21.6, 34.7, 33.4, 36.2, 28.7, 22.9, 27.1, 16.5, 18…
## $ oda_sayisi <dbl> 6.575, 6.421, 7.185, 6.998, 7.147, 6.430, 6.012, 6.172, …
## $ dusuk_sosyoek <dbl> 4.98, 9.14, 4.03, 2.94, 5.33, 5.21, 12.43, 19.15, 29.93,…
## $ nehir_kenari <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ emlak_vergisi <dbl> 296, 242, 242, 222, 222, 222, 311, 311, 311, 311, 311, 3…
Boston_tr<- Boston_tr|>
select(oda_sayisi, konut_degeri)|>
na.omit()
ggplot(Boston_tr, aes(x=oda_sayisi, y=konut_degeri)) +
geom_point() +
labs(x="oda sayısı (rm)",
y="konut değeri (medv)",
title="oda sayısı ile konut değeri arasındaki ilişki")
ggplot(Boston_tr, aes(x=oda_sayisi, y=konut_degeri)) +
geom_point() +
geom_smooth(method="lm", se= FALSE, color="red")+
labs(x="oda sayısı (rm)",
y="konut değeri (medv)",
title="basit doğrusal regresyon çizgisi")
## `geom_smooth()` using formula = 'y ~ x'
geom_jitter fonksiyonun kulalnım amacı regresyondaki noktaları dağıtmak içindir.