📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr

  • MASS

  • lsr

library(MASS)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
## 
##     select
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(lsr)

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

veri_1 <- survey %>%
  select(Sex, Age, Pulse, Exer, Height, Smoke)

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

veri_2 <- veri_1 %>%
  rename(
    Cinsiyet = Sex,
    Yas      = Age,
    Nabiz    = Pulse,
    Egzersiz = Exer,
    Boy      = Height,
    Sigara   = Smoke
  )

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

head(veri_2, 10)
##    Cinsiyet    Yas Nabiz Egzersiz    Boy Sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3 <- veri_2   
veri_3$Cinsiyet <- recode(veri_3$Cinsiyet,
                          "Female" = "Kadın",
                          "Male"   = "Erkek")
veri_3$Egzersiz <- recode(veri_3$Egzersiz,
                          "None" = "Hiç",
                          "Some" = "Ara sıra",
                          "Freq" = "Sık")
veri_3$Sigara <- recode(veri_3$Sigara,
                        "Never" = "Hiç",
                        "Occas" = "Ara sıra",
                        "Regul" = "Düzenli",
                        "Heavy" = "Fazla")  

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

colSums(is.na(veri_3))   
## Cinsiyet      Yas    Nabiz Egzersiz      Boy   Sigara 
##        1        0       45        0       28        1
veri_son <- na.omit(veri_3)
nrow(veri_3)
## [1] 237
nrow(veri_son)
## [1] 170

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

summary(veri_son)
##   Cinsiyet       Yas            Nabiz            Egzersiz       Boy       
##  Kadın:85   Min.   :16.92   Min.   : 35.00   Sık     :86   Min.   :152.0  
##  Erkek:85   1st Qu.:17.67   1st Qu.: 66.25   Hiç     :14   1st Qu.:165.0  
##             Median :18.58   Median : 72.00   Ara sıra:70   Median :171.0  
##             Mean   :20.46   Mean   : 73.92                 Mean   :172.5  
##             3rd Qu.:20.17   3rd Qu.: 80.00                 3rd Qu.:180.0  
##             Max.   :70.42   Max.   :104.00                 Max.   :200.0  
##       Sigara   
##  Fazla   :  7  
##  Hiç     :136  
##  Ara sıra: 13  
##  Düzenli : 14  
##                
## 

Yaş nabız ve boy için elde edilen özet tablo, bizlere şunları söylemektedir: Yaş için elimizdeki minimum değer 17, maximum 70 ve ortalama 20, 17–21 genel aralık olmak üzere. Nabız değerlerine baktığımızda en düşük nabız 35, en yüksek nabız 104 olarak görülmektedir. Ortalama nabız ise yaklaşık 74 civarındadır ve çoğu öğrencinin nabzı 66–80 aralığında toplanmıştır. Boy değişkeninde minimum değer 152, maksimum boy 200’dür. Ortalama boy yaklaşık 172 cm olup katılımcıların büyük bölümü 165–180 cm aralığında yer almaktadır.

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>%
  group_by(Egzersiz) %>%
  summarise(Ortalama_Nabiz = mean(Nabiz))
## # A tibble: 3 × 2
##   Egzersiz Ortalama_Nabiz
##   <fct>             <dbl>
## 1 Sık                71.4
## 2 Hiç                75.9
## 3 Ara sıra           76.6

Sık egzersiz yapanlarda ortalama nabız 71 ile en düşüktür. Hiç egzersiz yapmayanlarda nabız ortalaması 76 seviyesindedir. Ara sıra egzersiz yapanlarda ise ortalama 77olup en yüksek değeri göstermektedir. #### Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$Yas)
## [1] 20.46377
median(veri_son$Yas)
## [1] 18.583
modeOf(veri_son$Yas)
## [1] 17.5

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

Bazen gerçekten çok geç saatlere kadar oturuyorum ve ertesi sabah derse girince göz kapaklarım birbirine yapışıyor gibi oluyor, odaklanmakta zorlanıyorum. Ama ilginç olan şu ki, bazı günlerde daha az uyusam bile derste daha dinç ve dikkatli olduğumu fark ediyorum. Yani uyku süresi her zaman performansı düşürmüyor gibi. Bu durum kafamı karıştırdığı için arada gerçekten bir ilişki var mı yok mu merak etmeye başladım ve bunu küçük bir veri çalışmasıyla test etmenin mantıklı olacağını düşündüm. Eğer sınıf arkadaşlarımdan veri toplarsam hem benzer yaş ve uyku düzenine sahip olduğumuz için daha tutarlı sonuç çıkar, hem de kendimle kıyaslama yapma şansım olur.

Veriyi toplarken her öğrenciye o gün kaç saat uyuduğunu, derse girerken kendini ne kadar yorgun hissettiğini 1–10 arası puanlayarak belirtmesini isterim. Ayrıca derste kaç kez telefona baktıklarını sormak da faydalı olur, çünkü dikkat dağınıklığının bir göstergesi olabilir. Kahve içip içmediklerini eklemek de önemli çünkü bazı öğrenciler uykusuzluğu kahveyle telafi edebiliyor ve bu değişken analizde etkili olabilir. Bu bilgilerden uyku süresi ve telefona bakma sayısı sayısal ve ölçülebilir olur; yorgunluk puanı likert tipi sıralı bir değişkendir; kahve içme durumu ise kategorik değişkendir.

Topladığım bu verilerle kahve tüketimi, tekrar derse çalışma durumu veya öğrencilerin yorgunluk seviyelerini belirli aralıklara bölerek frekans tabloları oluşturabilirim. Sayısal olan uyku süresi, telefona bakma sayısı ve yorgunluk puanı üzerinden minimum–maksimum, çeyreklikler, mod, medyan ve ortalama gibi merkezi ölçüler hesaplanabilir. Bu analiz sayesinde gerçekten "az uyku = kötü performans" mı yoksa "kişiden kişiye değişen bir durum mu" sorusuna daha somut bir cevap bulabilirim. Sonuçlar beni şaşırtabilir bile belki asıl etkiyi uyku değil, telefon kullanımı ya da kafein belirliyordur. Bu küçük çalışma hem merakımı giderir hem de kendi uyku düzenimi nasıl iyileştirebileceğime dair fikir verir.

Değişkenlerin türleri

  • Uyku süresi (nicel, sürekli)

  • Telefon kullanım sayısı (nicel, kesikli)

  • Kahve içme durumu (kategorik, nominal)

  • Yorgunluk derecesi (ordinal / Likert)