library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
  1. aşağıdaki geom_jitter fonksiyonunun kullanım amacını araştırın.

Cevap: Grafikte üst üste gelen noktaları sağa,sola veya yukarı,aşağı olacak şekilde hareket ettirerek o noktaların üst üste gelmesini engeller.

  1. theme_classic fonksiyonunun alternatiflerini bulun ve deneyin.

Cevap: Klasik sade bir tema oluşturur. Gray,minimal,light,dark gibi çeşitli alternatif temalar bulunur ve bu temalar gri,çok daha sade,açık renkli ve koyu arkaplanlar oluşturur. Aşağıda theme_dark temasını denedim.

ggplot(mtcars, aes(x=wt, y=mpg)) +
  geom_point(color="white") +
  theme_dark()

  1. bu ders notlarında yer alan palmerpenguins’teki penguins veri seti gibi bir veri üzerinde (örn. midiPISA) regresyon denklemi kurun ve tüm kodları kendi veri setinize uygulayarak çalıştırın.
data(mtcars)
names(mtcars)
##  [1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear"
## [11] "carb"
odev <- mtcars |>
  select(mpg, wt) |>
  na.omit()
ggplot(odev, aes(x=mpg,y=wt)) +
  geom_point()+
  labs(x="Araç Yakıtı",
       y="Araç Ağırlığı",
       title="Araç Ağırlığı İle Yakıt Tüketim İlişkisi")

Belirgin bir şekilde negatif bir ilişki olup, araç ağırlığı arttıkça yakıt kullanımı azaldığını görüyoruz.

  1. Kendi seçtiğiniz veri seti üzerinde regresyon modeli kurma, saçılım diyagramı oluşturma, grafiğe regresyon çizgisi ekleme, eğim, kesişim ve R-squared katsayılarını yorumlama gibi tüm adımları yapın ve açıklamalarını yazın.
odev1 <-lm(mpg ~ wt, data = odev)
summary(odev1)
## 
## Call:
## lm(formula = mpg ~ wt, data = odev)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

Eğim(wt-araç ağırlığı katsayısı) -5.34 Araç ağırlığı 1 birim arttıkça yakıt kullanımı (mpg) 5.34 birim azalır. Negatif yönlü ilişki olduğu çıkarımını yapıyoruz.

Kesişim(Intercept) 37.29 Araç ağırlığı 0 olsaydı yakıt kullanımının nasıl olacağını gösterir.Mantıklı değil fakat başlangıç noktası olarak seçmemiz için gerekli bir istatistik.

Residual Standard Error 3.05 Tahmin hatasının büyüklüğünü gösterir.

R-squared 0.75 Araç ağırlığının artıp azalmasının, araç yakıtının kullanımının yüzde kaçını etkilediğini söyler. Bu veride %75’ini etkilediğini görüyoruz.

coef(odev1)
## (Intercept)          wt 
##   37.285126   -5.344472

Yine yukarıda belirttiğimiz gibi intercept araç ağırlığını (wt) 0 alsaydık aracın beklenen yakıt tüketimini gösterirken, wt ise araç ağırlığı 1 birim arttığında yakıt ortalama olarak ne kadar azalmış onu gösterir.

ggplot(odev, aes(x=mpg,y=wt)) +
  geom_point() +
  geom_smooth(method ="lm",se =FALSE, color="red") +
  labs(x="Araç Yakıtı",
       y="Araç Ağırlığı",
       title="Basit Doğrusal Regresyon Çizgisi")
## `geom_smooth()` using formula = 'y ~ x'

Noktalar aracın gerçek verilerini gösterirken, kırmızı çizgi ise basit doğrusal regresyon çizgisini gösterir. Aşağı doğru eğimli olması bu grafiği negatif olan bir grafik yaparken regresyon katsayısı (-5.34) ile regresyon çizgisi uyumludur.

odev2 <- data.frame(wt = 3)
predict(odev1, newdata = odev2)
##        1 
## 21.25171

Aracın tahmini ağırlığı (wt) 3 olduğunda yani (değinmek istediğim nokta bu veri setinde ağırlık pound ile yakıt ise galon ile ölçülmüş olup bu değerleri ton ve litreye çevirip verdim) 1.36 tonluk bir araç 100 kilometre gidebilmek için 11.2 litre yakıt harcar.