SSB201-28.11.2025

📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.

📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.

📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.

Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(MASS)

## 
## Attaching package: 'MASS'

## The following object is masked from 'package:dplyr':
## 
##     select

library(lsr)

data("survey")

head(survey)

##      Sex Wr.Hnd NW.Hnd W.Hnd    Fold Pulse    Clap Exer Smoke Height      M.I
## 1 Female   18.5   18.0 Right  R on L    92    Left Some Never 173.00   Metric
## 2   Male   19.5   20.5  Left  R on L   104    Left None Regul 177.80 Imperial
## 3   Male   18.0   13.3 Right  L on R    87 Neither None Occas     NA     <NA>
## 4   Male   18.8   18.9 Right  R on L    NA Neither None Never 160.00   Metric
## 5   Male   20.0   20.0 Right Neither    35   Right Some Never 165.00   Metric
## 6 Female   18.0   17.7 Right  L on R    64   Right Some Never 172.72 Imperial
##      Age
## 1 18.250
## 2 17.583
## 3 16.917
## 4 20.333
## 5 23.667
## 6 21.000

names(survey)

##  [1] "Sex"    "Wr.Hnd" "NW.Hnd" "W.Hnd"  "Fold"   "Pulse"  "Clap"   "Exer"  
##  [9] "Smoke"  "Height" "M.I"    "Age"

survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.

Soru 1: Bu veri setini etkinleştirerek `Sex` (cinsiyet)“,”`Age` (yaş)“,”`Pulse` (nabiz)” ve “`Exer` (egzersiz)”, “`Height` (boy)”, “`Smoke` (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini `veri_1` olarak isimlendirin.

veri_1 <- survey %>% dplyr::select(Sex, Age, Pulse, Exer, Height, Smoke)

head(veri_1)

##      Sex    Age Pulse Exer Height Smoke
## 1 Female 18.250    92 Some 173.00 Never
## 2   Male 17.583   104 None 177.80 Regul
## 3   Male 16.917    87 None     NA Occas
## 4   Male 20.333    NA None 160.00 Never
## 5   Male 23.667    35 Some 165.00 Never
## 6 Female 21.000    64 Some 172.72 Never

Soru 1.1: `veri_1` veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini `veri_2` olarak isimlendirin.

veri_2 <- veri_1 %>% rename( cinsiyet = Sex, yas = Age, nabiz = Pulse, egzersiz = Exer, boy = Height, sigara = Smoke)

head(veri_2)

##   cinsiyet    yas nabiz egzersiz    boy sigara
## 1   Female 18.250    92     Some 173.00  Never
## 2     Male 17.583   104     None 177.80  Regul
## 3     Male 16.917    87     None     NA  Occas
## 4     Male 20.333    NA     None 160.00  Never
## 5     Male 23.667    35     Some 165.00  Never
## 6   Female 21.000    64     Some 172.72  Never

Soru 1.2: `veri_2`’nin ilk 10 satırını görüntüleyin.

head(veri_2, n = 10)

##    cinsiyet    yas nabiz egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2: `veri_2` veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

veri_3 <- veri_2 %>%
  mutate(
    cinsiyet = recode(cinsiyet,
                      "Female" = "Kadın",
                      "Male" = "Erkek"),
    egzersiz = recode(egzersiz,
                      "Some" = "Bazen",
                      "None" = "Yok",
                      "Freq" = "Sık"),
    sigara = recode(sigara,
                    "Never" = "Asla",
                    "Regul" = "Duzenli",
                    "Occas" = "Ara Sıra"))

head(veri_3)

##   cinsiyet    yas nabiz egzersiz    boy   sigara
## 1    Kadın 18.250    92    Bazen 173.00     Asla
## 2    Erkek 17.583   104      Yok 177.80  Duzenli
## 3    Erkek 16.917    87      Yok     NA Ara Sıra
## 4    Erkek 20.333    NA      Yok 160.00     Asla
## 5    Erkek 23.667    35    Bazen 165.00     Asla
## 6    Kadın 21.000    64    Bazen 172.72     Asla

Soru 3: `veri_3` veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

any(is.na(veri_3))

## [1] TRUE

colSums(is.na(veri_3))

## cinsiyet      yas    nabiz egzersiz      boy   sigara 
##        1        0       45        0       28        1

veri_son<-na.omit(veri_3)

summary(veri_son)

##   cinsiyet       yas            nabiz         egzersiz       boy       
##  Kadın:85   Min.   :16.92   Min.   : 35.00   Sık  :86   Min.   :152.0  
##  Erkek:85   1st Qu.:17.67   1st Qu.: 66.25   Yok  :14   1st Qu.:165.0  
##             Median :18.58   Median : 72.00   Bazen:70   Median :171.0  
##             Mean   :20.46   Mean   : 73.92              Mean   :172.5  
##             3rd Qu.:20.17   3rd Qu.: 80.00              3rd Qu.:180.0  
##             Max.   :70.42   Max.   :104.00              Max.   :200.0  
##       sigara   
##  Heavy   :  7  
##  Asla    :136  
##  Ara Sıra: 13  
##  Duzenli : 14  
##                
##

Soru 4: `veri_son` için yas, nabiz ve boy değişkenlerinin

min
max
1st quarter
3rd quarter
mean
median

değerlerini açıklayın.

min(veri_son$yas)

## [1] 16.917

min(veri_son$nabiz)

## [1] 35

min(veri_son$boy)

## [1] 152

max(veri_son$yas)

## [1] 70.417

max(veri_son$nabiz)

## [1] 104

max(veri_son$boy)

## [1] 200

summary(veri_son$yas)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.92   17.67   18.58   20.46   20.17   70.42

summary(veri_son$nabiz)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   35.00   66.25   72.00   73.92   80.00  104.00

summary(veri_son$boy)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   152.0   165.0   171.0   172.5   180.0   200.0

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

veri_son %>%
  group_by(egzersiz) %>%
  summarise(ortalama_nabiz = round(mean(nabiz),  2))

## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 Sık                71.4
## 2 Yok                75.9
## 3 Bazen              76.6

** Sık egzersiz yapan kişilerin dakikada oralama nabzı 71.43’tür. Yok egzersiz yapan kişilerin ortalamla nabzı 75.86 iken bazen egzersiz yapan insanların ortalama nabzı ise 76.59’dur.

Soru 4.2: veri_son için `yas` değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

mean(veri_son$yas)

## [1] 20.46377

median(veri_son$yas)

## [1] 18.583

modeOf(veri_son$yas)

## [1] 17.5

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

kimlerden veri toplayabileceğinizi,
veri topladığınız kişilerden hangi bilgileri almanın anlamlı olacağını,
toplayacağınız bilgiler kapsamında değişkenlerin türlerini

açıklayın.

Topladığınız verileri göz önünde bulundurarak frekans tablosu oluşturabileceğiniz üç değişken tanımlayın.
Topladığınız verileri göz önünde bulundurarak min, max, quarters, mod, median, mean değerlerini hesaplayabileceğiniz üç değişken tanımlayın.

Üniversite öğrencilerinin sınav haftasındaki günlük kahve tüketimietkilen faktörler kimlerden veri toplanacak üniversite öğrencilerinden sınav haftasındaki öğrencier ve sınav haftası olmayanlardan bilgi alınacaktır. değişken türleri:kahve tüketimi, uyku süresi, ders çalışma süresi.

veri <- data.frame(
  kahve_tuketimi = c(8, 2, 3, 5, 5, 6),
  uyku_suresi = c(3, 6, 7, 4, 4.5, 5),
  ders_calisma_suresi = c(12, 4, 8, 10, 8, 9)
)
summary(veri)

##  kahve_tuketimi   uyku_suresi    ders_calisma_suresi
##  Min.   :2.000   Min.   :3.000   Min.   : 4.00      
##  1st Qu.:3.500   1st Qu.:4.125   1st Qu.: 8.00      
##  Median :5.000   Median :4.750   Median : 8.50      
##  Mean   :4.833   Mean   :4.917   Mean   : 8.50      
##  3rd Qu.:5.750   3rd Qu.:5.750   3rd Qu.: 9.75      
##  Max.   :8.000   Max.   :7.000   Max.   :12.00

table(veri$kahve_tuketimi)

## 
## 2 3 5 6 8 
## 1 1 2 1 1

table(veri$uyku_suresi)

## 
##   3   4 4.5   5   6   7 
##   1   1   1   1   1   1

table(veri$ders_calisma_suresi)

## 
##  4  8  9 10 12 
##  1  2  1  1  1

summary(veri)

##  kahve_tuketimi   uyku_suresi    ders_calisma_suresi
##  Min.   :2.000   Min.   :3.000   Min.   : 4.00      
##  1st Qu.:3.500   1st Qu.:4.125   1st Qu.: 8.00      
##  Median :5.000   Median :4.750   Median : 8.50      
##  Mean   :4.833   Mean   :4.917   Mean   : 8.50      
##  3rd Qu.:5.750   3rd Qu.:5.750   3rd Qu.: 9.75      
##  Max.   :8.000   Max.   :7.000   Max.   :12.00

min(veri$kahve_tuketimi)

## [1] 2

min(veri$uyku_suresi)

## [1] 3

min(veri$ders_calisma_suresi)

## [1] 4

max(veri$kahve_tuketimi)

## [1] 8

max(veri$uyku_suresi)

## [1] 7

max(veri$ders_calisma_suresi)

## [1] 12

summary(veri$kahve_tuketimi)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.000   3.500   5.000   4.833   5.750   8.000

summary(veri$uyku_suresi)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   4.125   4.750   4.917   5.750   7.000

summary(veri$ders_calisma_suresi)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    4.00    8.00    8.50    8.50    9.75   12.00

median(veri$kahve_tuketimi)

## [1] 5

median(veri$uyku_suresi)

## [1] 4.75

median(veri$ders_calisma_suresi)

## [1] 8.5

modeOf(veri$kahve_tuketimi)

## [1] 5

modeOf(veri$uyku_suresi)

## [1] 3.0 6.0 7.0 4.0 4.5 5.0

modeOf(veri$ders_calisma_suresi)

## [1] 8

SSB201-28.11.2025

İrem Nur Dursun

2025-11-29

Soru 1: Bu veri setini etkinleştirerek `Sex` (cinsiyet)“,”`Age` (yaş)“,”`Pulse` (nabiz)” ve “`Exer` (egzersiz)”, “`Height` (boy)”, “`Smoke` (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini `veri_1` olarak isimlendirin.

Soru 1.1: `veri_1` veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini `veri_2` olarak isimlendirin.

Soru 1.2: `veri_2`’nin ilk 10 satırını görüntüleyin.

Soru 2: `veri_2` veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

Soru 3: `veri_3` veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

Soru 4: `veri_son` için yas, nabiz ve boy değişkenlerinin

değerlerini açıklayın.

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

Soru 4.2: veri_son için `yas` değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

açıklayın.

SSB201-28.11.2025

İrem Nur Dursun

2025-11-29

Soru 1: Bu veri setini etkinleştirerek Sex (cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve “Exer (egzersiz)”, “Height (boy)”, “Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini veri_1 olarak isimlendirin.

Soru 1.1: veri_1 veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak isimlendirin.

Soru 1.2: veri_2’nin ilk 10 satırını görüntüleyin.

Soru 2: veri_2 veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

Soru 3: veri_3 veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

Soru 4: veri_son için yas, nabiz ve boy değişkenlerinin

değerlerini açıklayın.

Soru 4.1: Egzersiz sıklığına göre ortalama nabzı hesapladığınız bir tablo oluşturun. Bu tablodaki değerlerin açıklamasını yazın.

Soru 4.2: veri_son için yas değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.

Soru 5: Günlük yaşamınızda veri toplayarak analiz etmek isteyebileceğiniz bir durum düşünün (sosyal medya kullanım süresi, kahve tüketimi, sınav kaygısı…). Bu durumu kısaca açıklayın.

Bu durumla ilgili

açıklayın.

Soru 1: Bu veri setini etkinleştirerek `Sex` (cinsiyet)“,”`Age` (yaş)“,”`Pulse` (nabiz)” ve “`Exer` (egzersiz)”, “`Height` (boy)”, “`Smoke` (sigara) değişkenlerini seçin. Seçtiğiniz bu değişkenlerden oluşan veri setini `veri_1` olarak isimlendirin.

Soru 1.1: `veri_1` veri setindeki değişkenlerin isimlerini Türkçeleştirin ve bu veri setini `veri_2` olarak isimlendirin.

Soru 1.2: `veri_2`’nin ilk 10 satırını görüntüleyin.

Soru 2: `veri_2` veri setindeki kategorik değişkenlerin etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini veri_3 olarak isimlendirin.

Soru 3: `veri_3` veri setindeki eksik değerleri sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı açıklayın. Veri setinin son halini veri_son olarak isimlendirin.

Soru 4: `veri_son` için yas, nabiz ve boy değişkenlerinin

Soru 4.2: veri_son için `yas` değişkenine ait mod, medyan ve aritmetik ortalama değerlerini hesaplayın.