itle: “SSB201-Final-I”
uthor: “240201005 Yağmur Zere”
ate: “2026-01-09”
utput:
html_document:
toc: true
toc_depth: 4
toc_float: true

SSB 201 – Sosyal Bilimler İçin İstatistik I

Final Sınavı

library (gapminder)
## Warning: package 'gapminder' was built under R version 4.5.2
library (dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library (ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2

Soru 1 – Veri Setini İnceleme ve Düzenleme

1.a) gapminder veri setindeki değişken isimlerini ve veri türlerini inceleyiniz.

names(gapminder)
## [1] "country"   "continent" "year"      "lifeExp"   "pop"       "gdpPercap"
head(gapminder)
## # A tibble: 6 × 6
##   country     continent  year lifeExp      pop gdpPercap
##   <fct>       <fct>     <int>   <dbl>    <int>     <dbl>
## 1 Afghanistan Asia       1952    28.8  8425333      779.
## 2 Afghanistan Asia       1957    30.3  9240934      821.
## 3 Afghanistan Asia       1962    32.0 10267083      853.
## 4 Afghanistan Asia       1967    34.0 11537966      836.
## 5 Afghanistan Asia       1972    36.1 13079460      740.
## 6 Afghanistan Asia       1977    38.4 14880372      786.
# country, continent nitel verilerken; year, lifeExp, pop, gdpPercap nicel verilerdir.

1.b) Aşağıdaki değişkenleri seçerek gapminder_tr isimli yeni bir veri seti oluşturunuz:

gapminder_tr <- gapminder %>% dplyr::select(country, year, lifeExp, gdpPercap, continent)
  • ulke (country)

  • yil (year)

  • yasam_beklentisi (lifeExp)

  • kisi_basi_gelir (gdpPercap)

  • kita (continent)

1.c) Bu yeni veri setindeki değişken adlarını Türkçeleştiriniz ve gapminder_tr üzerine kaydediniz.

gapminder_tr <- gapminder_tr %>% rename(ulke = country,
                                        yil = year,
                                        yasam_beklentisi= lifeExp,
                                        kisi_basi_gelir = gdpPercap,
                                        kita = continent)
names(gapminder_tr)
## [1] "ulke"             "yil"              "yasam_beklentisi" "kisi_basi_gelir" 
## [5] "kita"

Soru 2 – Betimsel İstatistikler

2.a) gapminder_tr veri seti için summary() fonksiyonunu kullanarak genel özeti elde ediniz.

summary(gapminder_tr)
##           ulke           yil       yasam_beklentisi kisi_basi_gelir   
##  Afghanistan:  12   Min.   :1952   Min.   :23.60    Min.   :   241.2  
##  Albania    :  12   1st Qu.:1966   1st Qu.:48.20    1st Qu.:  1202.1  
##  Algeria    :  12   Median :1980   Median :60.71    Median :  3531.8  
##  Angola     :  12   Mean   :1980   Mean   :59.47    Mean   :  7215.3  
##  Argentina  :  12   3rd Qu.:1993   3rd Qu.:70.85    3rd Qu.:  9325.5  
##  Australia  :  12   Max.   :2007   Max.   :82.60    Max.   :113523.1  
##  (Other)    :1632                                                     
##        kita    
##  Africa  :624  
##  Americas:300  
##  Asia    :396  
##  Europe  :360  
##  Oceania : 24  
##                
## 

2.b) Yaşam beklentisi değişkeninin ortalama, medyan ve ranj değerlerini açıklayınız.

# Veri setindeki yaşam beklentisi değişkeninde ortalama değer 59.47, medyan değeri 60.71, ranj değeri 59 bulunmuştur.

Soru 3 – Frekans ve Yüzde Tablosu

Not: Aşağıdaki soruları gapminder_tr veri setini kullanarak yanıtlayın.

3.a) Kıta (continent) değişkenine ait frekans tablosunu oluşturunuz.

table(gapminder_tr$kita )
## 
##   Africa Americas     Asia   Europe  Oceania 
##      624      300      396      360       24

3.b) Aynı değişken için yüzde (%) dağılımını hesaplayınız.

prop.table(table(gapminder_tr$kita)) * 100
## 
##    Africa  Americas      Asia    Europe   Oceania 
## 36.619718 17.605634 23.239437 21.126761  1.408451

Soru 4 – Saçılım Diyagramı ve Korelasyon

4.a) Yaşam beklentisi (lifeExp) ile kişi başına düşen gelir (gdpPercap) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Eksen adlarını ve grafiğin başlığını ekleyiniz.

ggplot(
  data = gapminder_tr,
  aes( x = yasam_beklentisi, y = kisi_basi_gelir)
) + 
  geom_point() +
  labs(
    x = "Yaşam Beklentisi",
    y = "Kişi Başına Düşen Gelir",
    title = " Yaşam Beklentisi İle Kişi Başına Düşen Gelir Arasındaki İlişki"
  )

4.b) Bu iki değişken arasındaki korelasyon katsayısını hesaplayınız ve korelasyon katsayısını yorumlayınız.

cor( 
  gapminder_tr$yasam_beklentisi,
  gapminder_tr$kisi_basi_gelir,
  use = "pairwise.complete.obs")
## [1] 0.5837062
# Korelasyon katsayısı 0.58 olup değişkenler arasında orta derecede bir ilişki bulunmaktadır. Katsayının işareti pozitiftir yani bir değişken arttığında diğeri de artmaktadır.

Soru 5 – Basit Doğrusal Regresyon

5.a) Kişi başına düşen gelirin (gdpPercap), yaşam beklentisini (lifeExp) yordayıp yordamadığını test eden bir basit doğrusal regresyon modeli kurunuz.

gapminder_tr <- lm( kisi_basi_gelir ~ yasam_beklentisi, data = gapminder_tr)
summary(gapminder_tr)
## 
## Call:
## lm(formula = kisi_basi_gelir ~ yasam_beklentisi, data = gapminder_tr)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -11483  -4539  -1223   2482 106950 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      -19277.25     914.09  -21.09   <2e-16 ***
## yasam_beklentisi    445.44      15.02   29.66   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8006 on 1702 degrees of freedom
## Multiple R-squared:  0.3407, Adjusted R-squared:  0.3403 
## F-statistic: 879.6 on 1 and 1702 DF,  p-value: < 2.2e-16

5.b) Regresyon çıktısından aşağıdaki bilgileri bulunuz ve yorumlayınız:

  • eğim (β₁)
# veri setinde eğim ( yasam_beklentisi) 445.44 bulunmuştur.Yaşam beklentisi 1 değer arttığında kişi başına düşen gelir de ortalama 445.4 değer artmaktadır.
  • kesişim (β₀)
# veri setinde kesişim (intercept) -19277.25 bulunmuştur. Yaşam beklentisi 0 olduğunda kişi başına düşen gelir -19277.25 bulunmuştur. Bu matematiksel bir başlangıç noktasıdır.
  • R-kare (R²)
# R-squared yani modelin başarısı 0.3407 bulunmuştur. Kişi başına düşen gelirin değişkenliğini %0.34'ünü sadece yaşam beklentisi açıklamaktadır.

5.c) Yaşam beklentisi (yasam_beklentisi) ile kişi başına düşen gelir (kisi_basi_gelir) arasındaki ilişkiyi gösteren bir saçılım diyagramı oluşturunuz. Grafiğe uygun eksen adlarını ve bir başlık ekleyiniz. Bu grafiğin üzerine basit doğrusal regresyon çizgisini ekleyiniz.

ggplot( gapminder_tr, aes( x = yasam_beklentisi, y = kisi_basi_gelir)) +
  geom_point() +
  geom_smooth(method = "lm",  se = FALSE, color= "red" ) +
  labs( x = "Yaşam Beklentisi",
        y = "Kişi Başı Düşen Gelir",
        title = " Yaşam Beklentisi ve Kişi Başına Düşen Gelir Arasındaki Basit Doğrusal Regresyon Çizgisi")
## Warning: `fortify(<lm>)` was deprecated in ggplot2 4.0.0.
## ℹ Please use `broom::augment(<lm>)` instead.
## ℹ The deprecated feature was likely used in the ggplot2 package.
##   Please report the issue at <https://github.com/tidyverse/ggplot2/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `geom_smooth()` using formula = 'y ~ x'

Soru 6 - geom_jitter fonksiyonunun kullanım amacı nedir?

# geom_jitter fonksiyonu üst üste binen noktaları aşağı, yukarı kaydırır.