📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

  • dplyr

  • MASS

  • lsr

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)
data(survey)
veri_1<-survey %>% dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

veri_2<-veri_1 %>% 
  rename(cinsiyet=Sex,
         yas=Age,
         nabiz=Pulse,
         egzersiz=Exer,
         boy=Height,
         sigara=Smoke)

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

head(veri_2,10)
##    cinsiyet    yas nabiz egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3<-veri_2 %>% 
  mutate(
    cinsiyet=recode(cinsiyet,
                    "Female"="Kadin",
                    "Male"="Erkek"),
    egzersiz=recode(egzersiz,
                    "None"="Yok",
                   "Some"="Bazen",
                   "Freq"="Sık"),
    sigara=recode(sigara,
                  "Never"="Hic",
                  "Occas"="Ara Sira",
                  "Regul"="Duzenli",
                  "Heavy"="Fazla")
)

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet      yas    nabiz egzersiz      boy   sigara 
##        1        0       45        0       28        1
veri_son<-na.omit(veri_3)

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

  • min

  • max

  • 1st quarter

  • 3rd quarter

  • mean

  • median

değerlerini açıklayın.

summary(veri_son[, c("yas","nabiz","boy")]) #yas,nabiz ve boy ortalaması sırasıyla; 20.46,73.92 ve 172.5.Çoğunluk 17.67-20.2 yaş aralığı, nabiz olarak 66.3-80 aralığında ve boy olarak büyük çoğunluğu 165-180 aralığındadır.
##       yas            nabiz             boy       
##  Min.   :16.92   Min.   : 35.00   Min.   :152.0  
##  1st Qu.:17.67   1st Qu.: 66.25   1st Qu.:165.0  
##  Median :18.58   Median : 72.00   Median :171.0  
##  Mean   :20.46   Mean   : 73.92   Mean   :172.5  
##  3rd Qu.:20.17   3rd Qu.: 80.00   3rd Qu.:180.0  
##  Max.   :70.42   Max.   :104.00   Max.   :200.0

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>% 
  group_by(egzersiz) %>% 
  summarise(ortalama_nabiz=round(mean(nabiz),))# Nabız değerleri sık egzersiz yapanlarda minumum ortalama değeri (71),bazen egzersiz yapanlarda ise en yüksek ortalam değeri(77) görmüştür.
## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 Sık                  71
## 2 Yok                  76
## 3 Bazen                77

Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

  • kimlerden veri toplayabileceğinizi,

  • veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,

  • toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

  • Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.

  • Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

#Son zamanlarda alışveriş yapmanın kendimi daha iyi hissettirdiğini fark ettim. Bazen moralim bozuk olduğunda alışverişe yöneliyor ve satın aldığım şeylerin ruh hâlimi kısa sürede değiştirdiğini hissediyorum. Ancak bunun gerçekten psikolojik olarak anlamlı bir etkisi olup olmadığını merak etmeye başladım. Bu yüzden alışveriş davranışım ile ruh hâlim arasındaki ilişkiyi veri toplayarak analiz etmek istedim.

Kimlerden veri toplarım? • Benim gibi düzenli alışveriş yapan üniversite öğrencilerinden • Özellikle moral değişimleri yaşayan ve alışverişi bir rahatlama yöntemi olarak kullananlardan • Farklı sosyoekonomik düzeylerdeki bireylerden • Hem online hem fiziksel mağaza alışverişini aktif olarak kullanan kişilerden Bu gruplardan veri toplamak, alışveriş davranışının farklı kişilerde ruh hâlini nasıl etkilediğini karşılaştırma imkânı sağlar.

Katılımcılardan hangi bilgileri toplarım? • Alışveriş öncesi ruh hâli puanı (1–10) – Ordinal (sıralı) • Alışveriş sonrası ruh hâli puanı (1–10) – Ordinal (sıralı) • Alışveriş süresi (dakika) – Sayısal – Sürekli • Aylık alışveriş sıklığı (kaç kez) – Sayısal – Kesikli • Harcama miktarı (TL) – Sayısal – Sürekli • Alışveriş motivasyonu (stres, keyif, ödül, sıkıntı vb.) – Nominal • Alışveriş yapılan kanal (online–mağaza) – Nominal

Bu bilgiler, hem sayısal analiz hem de kategorik sınıflandırma yapmayı mümkün kılar.

Frekans tablosu oluşturabileceğim üç değişken belirledim: 1. Aylık alışveriş sıklığı Bu değişken kesikli olduğundan 0, 1, 2, 3 gibi tekrar eden değerlere sahiptir. Kaç kişinin ayda kaç kez alışveriş yaptığını frekans tablosunda gösterebilirim. 2. Alışveriş motivasyonu Motivasyon türleri (stres azaltma, keyif, ödül, can sıkıntısı) nominal olduğundan kaç kişinin hangi nedenle alışveriş yaptığını frekans tablosu ile göstermek mümkündür. 3. Alışveriş yapılan kanal (online–fiziksel) Kaç kişinin hangi alışveriş türünü tercih ettiği yine frekans tablosunda rahatça incelenebilir. Bu üç değişken, genel alışveriş eğilimlerini anlamada temel rol oynar.

Minimum, maksimum, çeyrekler, mod, medyan ve ortalama hesaplayabileceğim üç değişken: 1. Alışveriş öncesi ve sonrası ruh hâli puanı Bu puanlar üzerinden minimum–maksimum değerleri, ortalama mutluluk düzeyi, en sık görülen ruh hâli medyan ve çeyrek değerler hesaplanabilir. Böylece alışverişin ruh hâlini ne kadar değiştirdiği anlaşılabilir. 2. Alışveriş süresi (dakika) En kısa ve en uzun alışveriş süreleri, ortalama süre, süre dağılımının çeyrek değerleri ve en sık görülen süre (mod) gibi istatistikler çıkarılabilir. 3. Harcama miktarı (TL) Minimum–maksimum harcama miktarı, ortalama harcama, medyan, çeyrekler ve mod gibi ölçüler hesaplanarak alışveriş davranışının ekonomik boyutu analiz edilebilir.

Bu verileri incelediğimde hem sayısal hem kategorik değişkenler üzerinden detaylı analiz yapabilirim. • Alışveriş sonrası ruh hâli puanının ne kadar arttığını ortalama ve medyan değerlerle gösterebilirim. • Motivasyonların dağılımını frekans tablosu ile inceleyebilirim. • Harcama miktarları için çeyrekler ve minimum–maksimum değerleri belirleyerek katılımcıların eğilimlerini daha iyi anlayabilirim.

Bu üç değişken grubu ve topladığım bilgiler, alışverişin ruh hâli üzerindeki etkisini istatistiksel olarak incelemek için oldukça uygun bir veri seti oluşturur. Böylece hem alışverişin psikolojik etkilerini hem de davranışsal eğilimleri detaylı şekilde analiz edebilirim.