📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr

  • MASS

  • lsr

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library( MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)
## Warning: package 'lsr' was built under R version 4.5.2
# gerekli paketleri aktifleştirdim.

data("survey")

*survey* veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.


### Soru 1: Bu veri setini etkinleştirerek `Sex` (cinsiyet)", "`Age` (yaş)", "`Pulse` (nabiz)" ve "`Exer` (egzersiz)", "`Height` (boy)", "`Smoke` (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini `veri_1` olarak isimlendirin.


#### Soru 1.1: `veri_1` veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini `veri_2` olarak isimlendirin.



``` r
veri_1 <- survey %>%
  dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)
head(veri_1)
##      Sex    Age Pulse Exer Height Smoke
## 1 Female 18.250    92 Some 173.00 Never
## 2   Male 17.583   104 None 177.80 Regul
## 3   Male 16.917    87 None     NA Occas
## 4   Male 20.333    NA None 160.00 Never
## 5   Male 23.667    35 Some 165.00 Never
## 6 Female 21.000    64 Some 172.72 Never
#survey veri setinden değişkenler seçip veri setini "veri_1" olarak adlandırdım.

veri_2 <- veri_1 %>% 
  rename (cinsiyet = Sex,
          yas = Age,
          boy = Height,
          sigara = Smoke,
          egzersiz = Exer,
          nabiz = Pulse)
head(veri_2)
##   cinsiyet    yas nabiz egzersiz    boy sigara
## 1   Female 18.250    92     Some 173.00  Never
## 2     Male 17.583   104     None 177.80  Regul
## 3     Male 16.917    87     None     NA  Occas
## 4     Male 20.333    NA     None 160.00  Never
## 5     Male 23.667    35     Some 165.00  Never
## 6   Female 21.000    64     Some 172.72  Never
# veri setindeki değişkenlerin ismini Türkçeleştirdim ve veri setine "veri_2" ismini verdim.

#### Soru 1.2: `veri_2`'nin ilk 10 satırını görüntüleyin.




``` r
head(veri_2 ,10)
##    cinsiyet    yas nabiz egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3 <- veri_2 %>% 
  mutate(
    cinsiyet = recode(cinsiyet,
                      "Female" = "Kadin" ,
                      "Male" = "Erkek") ,
    egzersiz = recode(egzersiz,
                      "None" = "Yok" ,
                      "Some" = "Bazen" ,
                      "Freq" = "Sik") ,
    sigara = recode(sigara,
                    "Never" = "Hic" ,
                    "Occas" = "Ara Sira" ,
                    "Regul" = "Duzenli" ,
                    "Heavy" = "Fazla")
  )
head(veri_3)
##   cinsiyet    yas nabiz egzersiz    boy   sigara
## 1    Kadin 18.250    92    Bazen 173.00      Hic
## 2    Erkek 17.583   104      Yok 177.80  Duzenli
## 3    Erkek 16.917    87      Yok     NA Ara Sira
## 4    Erkek 20.333    NA      Yok 160.00      Hic
## 5    Erkek 23.667    35    Bazen 165.00      Hic
## 6    Kadin 21.000    64    Bazen 172.72      Hic
# veri setideki kattegorik değişkenlerin isimlerini Türkçeleştirdim ve "veri_3" şeklinde isimlendirdim.

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet      yas    nabiz egzersiz      boy   sigara 
##        1        0       45        0       28        1
veri_son <- na.omit(veri_3)

# veri setindeki eksik değerleri bulup çıkardım. Cinsiyet değişkeninde 1 kayıp veri,nabız değişkeninde 45 kayıp veri, boy değişkeninde 28 kayıp veri, sigara değişkeninde 1 kayıp veri bulunmaktadır. Yaş ve egzersiz değişkeninde kayıp veri bulunmamaktadır. 

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

summary(veri_son)
##   cinsiyet       yas            nabiz         egzersiz       boy       
##  Kadin:85   Min.   :16.92   Min.   : 35.00   Sik  :86   Min.   :152.0  
##  Erkek:85   1st Qu.:17.67   1st Qu.: 66.25   Yok  :14   1st Qu.:165.0  
##             Median :18.58   Median : 72.00   Bazen:70   Median :171.0  
##             Mean   :20.46   Mean   : 73.92              Mean   :172.5  
##             3rd Qu.:20.17   3rd Qu.: 80.00              3rd Qu.:180.0  
##             Max.   :70.42   Max.   :104.00              Max.   :200.0  
##       sigara   
##  Fazla   :  7  
##  Hic     :136  
##  Ara Sira: 13  
##  Duzenli : 14  
##                
## 
# yas değişkeni için;                                                                  minimum değer: 16.92, maksimum değer: 70.42, 1.çeyreklik:17.67, 3.çeyreklik: 20.17, ortalama:20.46, medyan(ortanca):18.58

#nabiz değişkeni için;                                                                 minimum değer:35.00, maksimum değer:104.00, 1.çeyreklik:66.25, 3.çeyreklik:80.00, ortalama:73.92, medyan(ortanca):72.00

#boy değişkeni için; minimum değer:152.0, maksimum değer:200.0, 1.çeyreklik:165.0, 3.çeyreklik:180.0, ortalama:172.5, medyan(ortanca):171.0

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>% 
  group_by(egzersiz) %>%
  summarise(ortalama_nabiz = round(mean(nabiz),2))
## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 Sik                71.4
## 2 Yok                75.9
## 3 Bazen              76.6
# egzersiz sıklığına göre ortalama nabız değerlerini buldum.

# bazen egzersiz yapanların ortalama nabız değerleri 76.59 , sıklıkla egzersiz yapanların ortalama nabız değerleri 71.43 , egzersiz yapmayanların ortalama nabız değerleri ise 75.86   egzersiz sıklığı arttıkça ortalama nabız değeri azalmaktadır.

Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5
# veri_son için ortalama değer:20.46377                                                                     medyan değeri: 18.583                                                                       mod değeri:17.5                                                              bu durum sağa çarpık bir dağılıma işaret eder.  

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

SORU 5

Sabah Alarmı Erteleme ve Gün İçi Motivasyon Sabah alarmı erteleme alışkanlığının bireylerin gün içindeki motivasyon düzeyleri üzerindeki etkisini açıklamaya çalışacağız.Hipotez olarak alarmı sık erteleyenlerde gün içi motivasyon düzeyinin düşük olduğunu sunabiliriz.

Kimlerden veri toplayabiliriz

Üniversite öğrencilerinden, yetişkin çalışanlardan veri toplayabiliriz.

Alınacak bilgiler

cinsiyet, eğitim durumu, alarmı erteleme sayısı, gün içi motivasyon skoru, uyku süresi      gibi bilgileri öğrenebiliriz.

Değişkenlerin Türleri

cinsiyet=nominal, eğitim durumu=ordinal, alarmı erteleme sayısı= kesikli sayısal, motivasyon skoru=aralık/oran sayısal, uyku süresi=sürekli sayısal

Frekans tablosu oluşturabileceğimiz 3 değişken

1.cinsiyet(katılımcıların cinsiyete göre dağılımını göstermek için)
2.Alarm erteleme alışkanlığı(hiç ertelemiyor:0 , bazen erteliyor:1-2 , sık erteliyor:3+)
3.Ortalama motivasyon kategorisi(düşük:1-4 , orta:5-7 , yüksek:8-10)

Min,max,quarters,mod,median,mean değerlerini tanımlayabileceğimiz 3 değişken

1.Alarmı erteleme sayısı: mean(ortalama erteleme sayısı),mod(en çok ertelenen sayı)
2.Toplam uyku süresi:median,quarters (uç değerlerin etkisini azaltmak için)
3.Gün içi motivasyon skoru: quarters(puanların dağılımını göstermek için),min-max(en                                    düşük ve en yüksek puanı göstermek için)