📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
  • MASS
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
  • lsr
library(lsr)
## Warning: package 'lsr' was built under R version 4.5.2

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

data("survey")
veri_1 <-survey %>%
  dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

veri_2 <-veri_1 %>% dplyr::rename(cinsiyet=Sex,yas=Age,nabiz=Pulse,egzersiz=Exer,boy=Height,sigara=Smoke)

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

head(veri_2,n=10)
##    cinsiyet    yas nabiz egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3<-veri_2
veri_3$cinsiyet<-factor(veri_3$cinsiyet,
                        levels = c('Male','Famele'),
                        labels = c('Erkek','Kadın'))
veri_3$sigara<-factor(veri_3$sigara,
                      levels = c('Never','Occas','Regul', 'Heavy'),
                      labels = c('Asla','Bazen','Düzenli', 'Çok'))

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

toplam_eksik_deger<-sum(is.na(veri_3))
print(paste("veri_3'teki Toplam Eksik Deger Sayısı:",toplam_eksik_deger))
## [1] "veri_3'teki Toplam Eksik Deger Sayısı: 193"
veri_son<-na.omit(veri_3)
eski_gözlem_sayisi<-nrow(veri_3)
yeni_gözlem_sayisi<-nrow(veri_son)

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

veri_son %>% 
  dplyr::select(yas,nabiz,boy) %>% summary()
##       yas            nabiz             boy       
##  Min.   :17.17   Min.   : 35.00   Min.   :154.9  
##  1st Qu.:17.92   1st Qu.: 65.00   1st Qu.:174.0  
##  Median :18.92   Median : 72.00   Median :180.0  
##  Mean   :20.85   Mean   : 73.13   Mean   :179.3  
##  3rd Qu.:20.33   3rd Qu.: 80.00   3rd Qu.:185.0  
##  Max.   :70.42   Max.   :104.00   Max.   :200.0

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

nabiz_tablosu<-veri_son %>% 
  group_by(egzersiz) %>% 
  summarise(ortalama_nabiz=mean(nabiz))
print(nabiz_tablosu)
## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 Freq               70.2
## 2 None               79.8
## 3 Some               76.1

Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

frekans_tablosu<-table(veri_son$yas)
mod_yas<-names(which.max(frekans_tablosu))
ortalama_yas<-mean(veri_son$yas)
medyan_yas<-median(veri_son$yas)

ortalama_yas
## [1] 20.84611
medyan_yas
## [1] 18.917
mod_yas
## [1] "17.917"

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

Günlük kahve tüketimi alışkanlıklarının üniversite öğrencilerinin ders çalışırken odaklanma sürelerine ve günlük uyku kalitelerine etkisini incelemek istiyorum. tüketilen kahve miktarı ile uyku bozuklukları arasındaki ilişkiyi görmek amacım.

VERİ TOPLAMA DETAYLARI

Kimlerden veri toplayabilirim:bölüm arkadaşlarımdan veya bölümüm dışında üniversite öğrencilerinden atıyorum 150 üniversite öğrencisinden veri toplayabilirim.

Hangi bilgiler anlamlı olur:Günlük ortalama olarak içilen kahve sayısı ve kahveden sonra hissedilen uyanıklık seviyesi bunu da 1-5 arasında puanlamayla daha net öğrenebiliriz ve haftalık ortalama uyku süresi bilgileri anlamlı olur.

Değişken türlerinin açıklanması: toplayacağım bilgiler dahilinde değişken türleri şunlar: -Günlük kahve fincan sayısı bu oran türünden bir değişkendir. -Uyanıklık seviyesi puanlaması bu da sıralı türden bir değişkendir. -Medeni durum:bu ek bilgi olarak ele alınabilir kategorik türden bir değişken cinsinden.

Frekans tablosu oluşturulabilecek 3 değişken -Cinsiyet:veri setindeki kadın ve erkek öğrenci sayısını görürüz -En sık tüketilen kahve türü: burdan da içilen kahve çeşitleri oranını anlamak mümkün örneğin amerikano mu filtre kahve mi gibi -Uyanıklık seviyesi puanı: burdan da 1-5 arasında bir puanlamayla mesela (1,2,3,4,5)en çok hangisinin verildiğini görürürüz.

Minimum ve maximum vs. hesaplayabileceğimiz 3 değişken de şunlardır: -Günlük kahve fincan sayısı: burdan öğrencilerin ortalama kahve tüketim miktarını bulabiliriz -Haftalık ortalama uyku süresi : ortalama uyku süresinde medyan ve çeyreklik değerlerini hesaplayarak dağılımı görebiliriz. -Yaş: öğrencilerin yaş dağılımını burdan min,max,mod,medyan hesaplaması yapabiliriz.