📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr

  • MASS

  • lsr

library(MASS)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
## 
##     select
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(lsr)

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

data(survey)


veri_1 <- survey %>% 
  select(Sex, Age, Pulse, Exer, Height, Smoke)

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

veri_2 <- veri_1 %>%
  rename(Cinsiyet = Sex,Yaş= Age,Nabiz= Pulse,Egzersiz = Exer,Boy= Height,Sigara=Smoke
  )

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

head(veri_2,10)
##    Cinsiyet    Yaş Nabiz Egzersiz    Boy Sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

table(veri_2$Cinsiyet)
## 
## Female   Male 
##    118    118
table(veri_2$Egzersiz)
## 
## Freq None Some 
##  115   24   98
table(veri_2$Sigara)
## 
## Heavy Never Occas Regul 
##    11   189    19    17
library(dplyr)

veri_3 <- veri_2 %>%
  mutate(
    Cinsiyet = recode(Cinsiyet,
                      "Female" = "Kadın","Male"= "Erkek"),
    
    Egzersiz = recode(Egzersiz,"None" = "Hiç","Some" = "Ara sıra","Freq" = "Sık"),
    
    Sigara = recode(Sigara,"Never" = "Hiç","Occas" = "Ara sıra","Regul" = "Düzenli","Heavy" = "Fazla") 
  )
table(veri_3$Cinsiyet)
## 
## Kadın Erkek 
##   118   118
table(veri_3$Sigara)
## 
##    Fazla      Hiç Ara sıra  Düzenli 
##       11      189       19       17
table(veri_3$Egzersiz)
## 
##      Sık      Hiç Ara sıra 
##      115       24       98

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

colSums(is.na(veri_3))
## Cinsiyet      Yaş    Nabiz Egzersiz      Boy   Sigara 
##        1        0       45        0       28        1

Cinsiyette 1, nabız verisinde 45, boy verisinde 28 ve sigara verisinde 1 tane boş değer vardır.

veri_son <- na.omit(veri_3)
is.na(veri_son)
##     Cinsiyet   Yaş Nabiz Egzersiz   Boy Sigara
## 1      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 2      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 5      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 6      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 7      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 8      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 9      FALSE FALSE FALSE    FALSE FALSE  FALSE
## 10     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 11     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 14     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 17     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 18     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 20     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 21     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 22     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 23     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 24     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 27     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 28     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 30     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 32     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 33     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 34     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 36     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 38     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 39     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 42     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 43     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 44     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 45     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 47     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 48     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 49     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 50     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 51     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 52     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 53     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 54     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 55     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 57     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 59     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 61     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 62     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 63     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 65     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 71     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 73     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 74     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 75     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 76     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 77     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 79     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 82     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 85     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 86     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 87     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 88     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 89     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 91     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 93     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 95     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 97     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 98     FALSE FALSE FALSE    FALSE FALSE  FALSE
## 100    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 102    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 104    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 105    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 106    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 109    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 110    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 111    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 112    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 113    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 114    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 115    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 116    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 117    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 118    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 119    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 120    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 122    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 123    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 124    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 125    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 127    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 128    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 129    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 130    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 131    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 132    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 134    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 135    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 136    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 138    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 140    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 141    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 143    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 144    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 145    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 146    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 147    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 148    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 149    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 150    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 151    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 152    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 153    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 154    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 155    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 156    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 158    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 160    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 161    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 163    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 164    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 166    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 167    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 168    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 170    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 172    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 174    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 175    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 176    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 177    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 178    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 180    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 181    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 182    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 183    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 184    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 185    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 186    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 187    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 188    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 189    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 190    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 191    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 192    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 193    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 194    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 196    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 197    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 198    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 199    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 200    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 201    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 202    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 204    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 205    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 206    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 207    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 208    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 209    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 211    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 212    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 214    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 215    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 218    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 220    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 222    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 223    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 227    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 228    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 229    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 230    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 231    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 233    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 234    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 236    FALSE FALSE FALSE    FALSE FALSE  FALSE
## 237    FALSE FALSE FALSE    FALSE FALSE  FALSE

Hepsi false, yani boş değil.

Soru 4: veri_son için Yaş, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

summary(veri_son[, c("Yaş", "Nabiz", "Boy")])
##       Yaş            Nabiz             Boy       
##  Min.   :16.92   Min.   : 35.00   Min.   :152.0  
##  1st Qu.:17.67   1st Qu.: 66.25   1st Qu.:165.0  
##  Median :18.58   Median : 72.00   Median :171.0  
##  Mean   :20.46   Mean   : 73.92   Mean   :172.5  
##  3rd Qu.:20.17   3rd Qu.: 80.00   3rd Qu.:180.0  
##  Max.   :70.42   Max.   :104.00   Max.   :200.0

Tüm değerleri aynı anda ifade etmemiz gerekirse: Yaş değişkenine baktığımızda ortalama değerin yaklaşık 20 olduğu ve öğrencilerin büyük çoğunluğunun 17–21 yaş aralığında toplandığı görülmektedir. Buna karşılık maksimum değerin 70 olması, veri setinde yaşça diğer katılımcılardan oldukça farklı ve çok daha büyük bir kişinin bulunduğunu göstermektedir. Nabız değişkenine bakıldığında ortalamanın 73 civarında olduğu ve değerlerin çoğunlukla 66–80 arasında toplandığı söylenebilir. En yüksek nabız değeri olan 104 ise diğer gözlemlere göre oldukça yüksektir. Boy değişkeninde ortalama 172.5 olup genel dağılımın 165–180 cm aralığında yoğunlaştığı görülmektedir. En yüksek değer olan 200 cm dikkat çekici şekilde üst sınırdadır ve diğer katılımcılardan belirgin biçimde uzundur.

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>%
  group_by(Egzersiz) %>%
  summarise(Ortalama_Nabız = round(mean(Nabiz),2))
## # A tibble: 3 × 2
##   Egzersiz Ortalama_Nabız
##   <fct>             <dbl>
## 1 Sık                71.4
## 2 Hiç                75.9
## 3 Ara sıra           76.6

Sık egzersiz yapanların nabzi ortalama 71 ile en düsük değerde yer alıyor. Ara sıra egzersiz yapanlarda ortalama 77'ye kadar yükselirken, egzersiz yapmayanların nabız ortalaması 76 olarak görülüyor.

Soru 4.2: veri_son için Yaş değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$Yaş)       
## [1] 20.46377
median(veri_son$Yaş)     
## [1] 18.583
modeOf(veri_son$Yaş)     
## [1] 17.5

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

Ben sigara içen bir üniversite öğrencisi olduğum için, bu ödev bana geldiğinde günlük hayatımda gerçekten merak ettiğim bir durumu veri toplayarak incelemek istedim. Yoğun sınav haftalarında stresimin arttığını hissediyorum ve bu dönemlerde sigara tüketimim de belirgin şekilde artıyor. Bu yüzden sigara tüketiminin stres seviyesini ne kadar etkilediğini (ya da stresin sigarayı mı artırdığını) araştırmak benim için anlamlı ve kişisel olarak merak uyandırıcı bir konu oldu. Çevremde de aynı durumda olan birçok öğrenci var ve onlar üzerinde veri toplamak, bu ilişkiyi daha net görmeme yardımcı olabilir.

Bu çalışmada veri toplayacağım kişiler yine benim gibi üniversite öğrencileri olurdu. Çünkü hem yaş olarak benzer olduğumuz için sonuçlar tutarlı olur, hem de stres ve sigara ilişkisini anlamada ortak yaşam koşulları önemli bir avantaj sağlar. Katılımcılardan günlük kaç adet sigara içtiklerini, o gün stres düzeylerini 1’den 10’a değerlendirmelerini, ayrıca sınav veya ödev dönemlerinde sigara içme miktarlarının artıp artmadığını öğrenmek anlamlı olur. Bunun yanında sigara içme sıklığı, uyku süresi ve kafein tüketimi gibi değişkenleri de sormak stresi etkileyen başka faktörleri de görmemi sağlar.

Bu verilerden frekans tablosu çıkarabileceğim değişkenler arasında günlük sigara sayısı bulunur; çünkü kaç kişinin günde 5, 10 ya da 20 sigara içtiğini frekansla gösterebilirim. Aynı şekilde sigara içme sıklığı (hiç, ara sıra, sık) kategorik olduğu için bu değişken de frekans tablosu oluşturmak için uygundur. Ayrıca stres düzeyini 1–10 gibi sınıflara ayırdığımda hangi stres düzeyinde kaç kişi olduğu da frekansla gösterilebilir.

Öte yandan daha detaylı analiz yapabileceğim ölçülebilir değişkenler de vardır. Günlük içilen sigara sayısı sayısal ve sürekli değiştiği için minimum, maksimum, çeyreklikler, mod, medyan ve ortalama hesaplanabilir. Aynı şekilde stres düzeyi de sayısal olduğundan merkezi eğilim ölçüleri çıkarılabilir. Son olarak uyku süresi (kaç saat uyunduğu) da analiz için uygun bir değişkendir çünkü minimum–maksimum ve ortalama uyku süreleri hesaplanarak stres ve sigara ilişkisi daha anlamlı yorumlanabilir.

Bu veriler toplandığında, gerçekten sigaranın stresi azaltıp azaltmadığı mı yoksa stres arttığı için sigara tüketiminin mi yükseldiği gibi soruların cevabı daha net görülebilir. Yani hem ödevin gereklerini yerine getirir hem de kendimle ilgili merak ettiğim bir durumu bilimsel bir bakışla değerlendirmiş olurum.