📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr

  • MASS

  • lsr

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)
data(survey)
veri_1<-survey %>% dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

veri_2<-veri_1 %>% 
  rename(cinsiyet=Sex,
         yas=Age,
         nabiz=Pulse,
         egzersiz=Exer,
         boy=Height,
         sigara=Smoke)

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

head(veri_2,10)
##    cinsiyet    yas nabiz egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3<-veri_2 %>% 
  mutate(
    cinsiyet=recode(cinsiyet,
                    "Female"="Kadin",
                    "Male"="Erkek"),
    egzersiz=recode(egzersiz,
                    "None"="Yok",
                   "Some"="Bazen",
                   "Freq"="Sık"),
    sigara=recode(sigara,
                  "Never"="Hic",
                  "Occas"="Ara Sira",
                  "Regul"="Duzenli",
                  "Heavy"="Fazla")
)

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet      yas    nabiz egzersiz      boy   sigara 
##        1        0       45        0       28        1
veri_son<-na.omit(veri_3)

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

summary(veri_son[, c("yas","nabiz","boy")]) #Yaş, nabız ve boy ortalamaları sırasıyla 20.46, 73.92 ve 172.5 olup; yaşların çoğu 17.67–20.2 aralığında, nabızların büyük kısmı 66.3–80 aralığında ve boyların büyük bölümü 165–180 cm arasında toplanmıştır.
##       yas            nabiz             boy       
##  Min.   :16.92   Min.   : 35.00   Min.   :152.0  
##  1st Qu.:17.67   1st Qu.: 66.25   1st Qu.:165.0  
##  Median :18.58   Median : 72.00   Median :171.0  
##  Mean   :20.46   Mean   : 73.92   Mean   :172.5  
##  3rd Qu.:20.17   3rd Qu.: 80.00   3rd Qu.:180.0  
##  Max.   :70.42   Max.   :104.00   Max.   :200.0

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>% 
  group_by(egzersiz) %>% 
  summarise(ortalama_nabiz=round(mean(nabiz),))# En düşük nabız ortalaması 71 ile sık spor yapan grupta, en yüksek nabız ortalaması ise 77 ile bazen spor yapanlarda görülmüştür.
## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 Sık                  71
## 2 Yok                  76
## 3 Bazen                77

Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

Aslında fark ettim ki moralim bozulduğunda oyun oynamaya yönelmem, kısa sürede modumu değiştirse de ders çalışma isteğimi ciddi anlamda etkiliyor. Oyun oynayınca kendimi daha iyi hissettiğim oluyor ama “bir el daha”, “şu maçı bitirip çıkarım” derken zamanın nasıl geçtiği bile belli olmuyor. Bu yüzden oyun oynama davranışım ile akademik başarım arasında gerçekten anlamlı bir ilişki olup olmadığını merak etmeye başladım ve bunu veri toplayarak analiz etmeye karar verdim.

Kimlerden Veri Toplayabilirim? Oyun bağımlılığı–başarı ilişkisini farklı bakış açılarından karşılaştırabilmek için çeşitli gruplardan veri toplamayı düşünüyorum: • Benim gibi düzenli oyun oynayan üniversite öğrencilerinden • Oyun oynarken zaman kontrolünü kaybeden ve ders çalışmayı ertelemeye eğilimli bireylerden • Farklı akademik başarı seviyelerine sahip öğrencilerden • Hem mobil hem PC/konsol oyunlarını aktif oynayan kişilerden Bu gruplardan veri toplamak, oyun davranışının farklı kişilerde akademik performansı nasıl etkilediğini daha net görmemi sağlar.

Katılımcılardan Hangi Bilgileri Toplayacağım? Analizi hem davranışsal hem de akademik açıdan yapabilmek için çeşitli değişkenler belirledim: • Günlük oyun süresi (dakika) – Sayısal, sürekli • Haftalık oyun oynama sıklığı (kaç gün) – Sayısal, kesikli • Oyun türü (MOBA, FPS, mobil, strateji vb.) – Nominal • Akademik başarı (genel not ortalaması) – Sayısal • Ders çalışma süresi (günlük/dakika) – Sayısal • Oyun oynama motivasyonu (eğlence, stres atma, rekabet, kaçış vb.) – Nominal • Öznel başarı algısı (1–10 arası) – Ordinal Bu bilgiler, oyun davranışı ve akademik performans arasındaki ilişkiyi detaylı incelememe imkân tanır.

Frekans Tablosu Oluşturabileceğim Üç Değişken 1. Haftalık oyun oynama sıklığı • Haftada kaç gün oyun oynandığını gösteren kesikli bir değişkendir. 2. Oyun oynama motivasyonu • Stres atmak mı, rekabet mi, yoksa sıkıntı mı? Motivasyonların dağılımını frekans tablosuyla inceleyebilirim. 3. Oyun türü • FPS mi daha çok oynanıyor yoksa MOBA mı? Kategorik olduğundan frekans tablosuna uygun. Bu üç değişken öğrencilerin oyun alışkanlıklarını anlamada önemli rol oynar.

Tanımlayıcı İstatistikler Hesaplayabileceğim Üç Değişken 1. Günlük oyun süresi • Minimum–maksimum oyun süresi, ortalama, medyan, çeyrek değerler gibi ölçüler çıkarılabilir. 2. Ders çalışma süresi • Öğrencilerin en az—en çok çalışma süreleri incelenerek oyun–ders dengesi hakkında bilgi verir. 3. Akademik başarı (GPA) • Minimum, maksimum, ortalama, çeyrekler gibi istatistikler başarı düzeyini anlamayı sağlar. Bu değişkenler akademik performansın nasıl dağıldığını görmek için uygundur.

Toplanan verileri incelediğimde: • Oyun süresi arttıkça akademik başarının nasıl değiştiğini ortalama ve medyan değerlerle gösterebilirim. • Motivasyonların dağılımını inceleyip “en çok hangi nedenle oyun oynanıyor?” sorusuna cevap bulabilirim. • Ders çalışma süreleri ile oyun oynama alışkanlıkları arasındaki ilişkiyi analiz ederek öğrencilerin zaman yönetimi eğilimlerini anlayabilirim.

Bu veri seti sayesinde oyun bağımlılığının akademik başarı üzerindeki etkisini hem davranışsal hem istatistiksel olarak detaylı bir şekilde inceleyebilirim.