SSB 201 – Sosyal Bilimler İçin İstatistik I

Final Sınavı

library (gapminder)
## Warning: package 'gapminder' was built under R version 4.5.2
library (dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library (ggplot2)

Soru 1 – Veri Setini İnceleme ve Düzenleme

1.a) gapminder veri setindeki değişken isimlerini ve veri türlerini inceleyiniz.

data(gapminder)
names(gapminder)
## [1] "country"   "continent" "year"      "lifeExp"   "pop"       "gdpPercap"
glimpse(gapminder)
## Rows: 1,704
## Columns: 6
## $ country   <fct> "Afghanistan", "Afghanistan", "Afghanistan", "Afghanistan", …
## $ continent <fct> Asia, Asia, Asia, Asia, Asia, Asia, Asia, Asia, Asia, Asia, …
## $ year      <int> 1952, 1957, 1962, 1967, 1972, 1977, 1982, 1987, 1992, 1997, …
## $ lifeExp   <dbl> 28.801, 30.332, 31.997, 34.020, 36.088, 38.438, 39.854, 40.8…
## $ pop       <int> 8425333, 9240934, 10267083, 11537966, 13079460, 14880372, 12…
## $ gdpPercap <dbl> 779.4453, 820.8530, 853.1007, 836.1971, 739.9811, 786.1134, …

1.b) Aşağıdaki değişkenleri seçerek gapminder_tr isimli yeni bir veri seti oluşturunuz:

gapminder_tr <- gapminder %>% dplyr::select(
country, year, lifeExp, gdpPercap, continent)
gapminder_tr2 <- gapminder_tr %>% 
  rename(ulke = country,
         yil = year,
         yasam_beklentisi = lifeExp,
         kisi_basi_gelir = gdpPercap,
         kita = continent)
  • ulke (country)

  • yil (year)

  • yasam_beklentisi (lifeExp)

  • kisi_basi_gelir (gdpPercap)

  • kita (continent)

1.c) Bu yeni veri setindeki değişken adlarını Türkçeleştiriniz ve gapminder_tr üzerinekaydediniz.

gapminder_tr2 <- gapminder_tr %>% 
  rename(ulke = country,
         yil = year,
         yasam_beklentisi = lifeExp,
         kisi_basi_gelir = gdpPercap,
         kita = continent)

Soru 2 – Betimsel İstatistikler

2.a) gapminder_tr veri seti için summary() fonksiyonunu kullanarak genel özeti elde ediniz.

summary(gapminder_tr2)
##           ulke           yil       yasam_beklentisi kisi_basi_gelir   
##  Afghanistan:  12   Min.   :1952   Min.   :23.60    Min.   :   241.2  
##  Albania    :  12   1st Qu.:1966   1st Qu.:48.20    1st Qu.:  1202.1  
##  Algeria    :  12   Median :1980   Median :60.71    Median :  3531.8  
##  Angola     :  12   Mean   :1980   Mean   :59.47    Mean   :  7215.3  
##  Argentina  :  12   3rd Qu.:1993   3rd Qu.:70.85    3rd Qu.:  9325.5  
##  Australia  :  12   Max.   :2007   Max.   :82.60    Max.   :113523.1  
##  (Other)    :1632                                                     
##        kita    
##  Africa  :624  
##  Americas:300  
##  Asia    :396  
##  Europe  :360  
##  Oceania : 24  
##                
## 

2.b) Yaşam beklentisi değişkeninin ortalama, medyan ve ranj değerlerini açıklayınız.

Mean=59.47 Median=60.71

Soru 3 – Frekans ve Yüzde Tablosu

Not: Aşağıdaki soruları gapminder_tr veri setini kullanarak yanıtlayın.

3.a) Kıta (continent) değişkenine ait frekans tablosunu oluşturunuz.

table(gapminder_tr2$kita)
## 
##   Africa Americas     Asia   Europe  Oceania 
##      624      300      396      360       24

3.b) Aynı değişken için yüzde (%) dağılımını hesaplayınız.

gapminder_tr2 %>% 
  count(kita) %>% 
          mutate(yuzde = round((n/sum(n)) * 100,2))
## # A tibble: 5 × 3
##   kita         n yuzde
##   <fct>    <int> <dbl>
## 1 Africa     624 36.6 
## 2 Americas   300 17.6 
## 3 Asia       396 23.2 
## 4 Europe     360 21.1 
## 5 Oceania     24  1.41

Katılımcıların %36.62 si Afrika’dan (n=624) katılım sağlamıştır. Katılımcıların %17.61 i Amerika’dan (n=300) katılım sağlamıştır. Katılımcıların %23.24 ü Asya’dan (n=396) katılım sağlamıştır. katılımcıların %21.13 ü Avrupa’dan katılım sağlamıştır.

Soru 4 – Saçılım Diyagramı ve Korelasyon

4.a) Yaşam beklentisi (lifeExp) ile kişi başına düşen gelir (gdpPercap) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Eksen adlarını ve grafiğin başlığını ekleyiniz.

gapminder_tr2  <- gapminder_tr2 |>
  select(yasam_beklentisi, kisi_basi_gelir) |>
  na.omit()
ggplot(gapminder_tr2, aes(x= kisi_basi_gelir, y = yasam_beklentisi)) +
  geom_point() +
labs(x = 'Yaşam Beklentisi',
     y = 'Kişi Başı Gelir',
     title = 'Yaşam Beklentisi ile Kişi Başı Gelir Arasındaki İlişki')

4.b) Bu iki değişken arasındaki korelasyon katsayısını hesaplayınız ve korelasyon katsayısını yorumlayınız.

#Kişi başına milli gelir arttıkça yaşam beklentisi de artar.

Soru 5 – Basit Doğrusal Regresyon

5.a) Kişi başına düşen gelirin (gdpPercap), yaşam beklentisini (lifeExp) yordayıp yordamadığını test eden bir basit doğrusal regresyon modeli kurunuz.

glimpse(gapminder_tr2)
## Rows: 1,704
## Columns: 2
## $ yasam_beklentisi <dbl> 28.801, 30.332, 31.997, 34.020, 36.088, 38.438, 39.85…
## $ kisi_basi_gelir  <dbl> 779.4453, 820.8530, 853.1007, 836.1971, 739.9811, 786…
names(gapminder_tr2)
## [1] "yasam_beklentisi" "kisi_basi_gelir"

5.b) Regresyon çıktısından aşağıdaki bilgileri bulunuz ve yorumlayınız:

  • eğim (β₁)

  • kesişim (β₀)

  • R-kare (R²)

5.c) Yaşam beklentisi (yasam_beklentisi) ile kişi başına düşen gelir (kisi_basi_gelir) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Grafiğe uygun eksen adlarını ve bir başlık ekleyiniz. Bu grafiğin üzerine basit doğrusal regresyon çizgisini ekleyiniz.

Soru 6 - geom_jitter fonksiyonunun kullanım amacı nedir?