SSB 201 – Sosyal Bilimler İçin İstatistik I

Final Sınavı

library(MASS) library(dplyr) library(ggplot2)


### **Soru 1 – Veri Setini İnceleme ve Düzenleme**

#### **1.a) Boston veri setindeki değişken isimlerini ve veri türlerini inceleyiniz.**

library(dplyr)
library(MASS)
data("Boston")
names(Boston)
head(Boston)



#### **1.b) Aşağıdaki değişkenleri seçerek boston_tr isimli yeni bir veri seti oluşturunuz:**

-   konut_degeri (medv)
-   dusuk_sosyoek (Istat)
-   nehir_kenari (chas)
-   emlak_vergisi (tax)

veri1 <- boston %>% dplyr::select(medv, rm, Istat, chas, tax)


1.c) Bu yeni veri setindeki değişken adlarını Türkçeleştiriniz ve boston_tr üzerine kaydediniz.



 veri2 <- veri1 &>&
  rename(konut_degeri = medv,
         oda_sayisi = rm,
         dusuk_sosyoek = Istat,
         nehir_kenari = chas,
         emlak_vergisi = tax)

Soru 2 – Betimsel İstatistikler

2.a) boston_tr veri seti için summary() fonksiyonunu kullanarak genel özeti elde ediniz.

summary(veri2)



#### **2.b) Konut değeri değişkeninin ortalama, medyan ve ranj değerlerini açıklayınız.**

### **Soru 3 – Frekans ve Yüzde Tablosu**

#### Not: Aşağıdaki soruları boston_tr veri setini kullanarak yanıtlayın.

#### **3.a) Nehir kenarı (chas) değişkenine ait frekans tablosunu oluşturunuz.
**

table(veri2$chas)
prop.table(table(veri2$chas))

**3.b) Aynı değişken için yüzde (%) dağılımını hesaplayınız.

**

veri2 &>& count(chas) &>& mutate(yuzde = round((n / sum(n)))) ```

Soru 4 – Saçılım Diyagramı ve Korelasyon

4.a) Oda sayısı (rm) ile konut değeri (medv) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Eksen adlarını ve grafiğin başlığını ekleyiniz.

4.b) Bu iki değişken arasındaki korelasyon katsayısını hesaplayınız ve korelasyon katsayısını yorumlayınız.

Soru 5 – Basit Doğrusal Regresyon

5.a) Oda sayısı değişkeninin konut değeri değişkenini yordayıp yordamadığını test eden bir basit doğrusal regresyon modeli kurunuz.

5.b) Regresyon çıktısından aşağıdaki bilgileri bulunuz ve yorumlayınız:

  • eğim (β₁)

  • kesişim (β₀)

  • R-kare (R²)

5.c) Oda sayısı (oda_sayisi) ile konut değeri (konut_degeri) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Grafiğe uygun eksen adlarını ve bir başlık ekleyiniz. Bu grafiğin üzerine basit doğrusal regresyon çizgisini ekleyiniz.

Soru 6 - geom_jitter fonksiyonunun kullanım amacı nedir?

Grafikte iki noktanın üst üste gelmesini engellemek