📌 Aşağıda 5 soru bulunmaktadır. İlk 4 soruyu ders notlarınızdan faydalanarak yapabilirsiniz. Sadece dosyayı yayınlarken hata aldığınız durumlarda hata kodunu anlamak için yapay zekadan destek alabilirsiniz. Tüm soruları yapay zekaya yaptırdığınız tespit edilirse sınavınız geçersiz sayılacaktır.
📌 Son soru 30 puan değerinde olup kendi deneyimlerinizden yola çıkarak yanıtlayabileceğiniz bir sorudur. Farklı sınav kağıtlarında birbirinin aynısı yanıtlar tespit edilmesi durumunda ilgili öğrencilerin sınavları geçersiz sayılacaktır.
📌 Sınavınızı 29 Kasım 2025 Cumartesi günü saat 11’e kadar Rpubs hesaplarınızda yayınlamanız gerekmektedir. Teslim tarihinden geç yayınlanan dosyalar değerlendirmeye dahil edilmeyecektir.
Soruları yanıtlamak için aşağıdaki paketleri etkinleştirin:
dplyr
MASS
lsr
survey veri seti, bir grup üniversite öğrencisinden toplanmış bilgiler içerir. Değişkenler arasında yaş, cinsiyet, boy, nabız, egzersiz sıklığı gibi psikolojik ve fizyolojik özellikler vardır. Bu veri seti University of Adelaide öğrencilerinden toplanmış bir anket çalışmasından gelir. Veri seti 237 gözlem ve 12 değişkenden oluşur.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(MASS)
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(lsr)
data("survey")
head(survey)
## Sex Wr.Hnd NW.Hnd W.Hnd Fold Pulse Clap Exer Smoke Height M.I
## 1 Female 18.5 18.0 Right R on L 92 Left Some Never 173.00 Metric
## 2 Male 19.5 20.5 Left R on L 104 Left None Regul 177.80 Imperial
## 3 Male 18.0 13.3 Right L on R 87 Neither None Occas NA <NA>
## 4 Male 18.8 18.9 Right R on L NA Neither None Never 160.00 Metric
## 5 Male 20.0 20.0 Right Neither 35 Right Some Never 165.00 Metric
## 6 Female 18.0 17.7 Right L on R 64 Right Some Never 172.72 Imperial
## Age
## 1 18.250
## 2 17.583
## 3 16.917
## 4 20.333
## 5 23.667
## 6 21.000
names(survey)
## [1] "Sex" "Wr.Hnd" "NW.Hnd" "W.Hnd" "Fold" "Pulse" "Clap" "Exer"
## [9] "Smoke" "Height" "M.I" "Age"
Sex
(cinsiyet)“,”Age (yaş)“,”Pulse (nabiz)” ve
“Exer (egzersiz)”, “Height (boy)”,
“Smoke (sigara) değişkenlerini seçin. Seçtiğiniz bu
değişkenlerden oluşan veri setini veri_1 olarak
isimlendirin.veri_1<- survey %>% dplyr::select(Sex, Age, Pulse, Exer, Height, Smoke)
head(veri_1)
## Sex Age Pulse Exer Height Smoke
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
veri_1 veri setindeki değişkenlerin
isimlerini Türkçeleştirin ve bu veri setini veri_2 olarak
isimlendirin.veri_2<- veri_1 %>%
rename(cinsiyet = Sex, yas = Age, boy = Height, sigara = Smoke,
egzersiz = Exer, nabiz = Pulse)
head(veri_2)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
names(veri_2)
## [1] "cinsiyet" "yas" "nabiz" "egzersiz" "boy" "sigara"
veri_2’nin ilk 10 satırını görüntüleyin.head(veri_2, 10)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
## 7 Male 18.833 83 Freq 182.88 Never
## 8 Female 35.833 74 Freq 157.00 Never
## 9 Male 19.000 72 Some 175.00 Never
## 10 Male 22.333 90 Some 167.00 Never
veri_2 veri setindeki kategorik değişkenlerin
etiketlerini (örn. never, some, heavy) Türkçeleştirin ve bu veri setini
veri_3 olarak isimlendirin.veri_3 <- veri_2 %>%
mutate(
cinsiyet = recode(cinsiyet,
"Female" = "Kadın",
"Male" = "Erkek"),
egzersiz = recode(egzersiz,
"None" = "Yok",
"Some" = "Bazen",
"Freq" = "Sık"),
sigara = recode(sigara,
"Never" = "Hic",
"Occas" = "Ara Sıra",
"Regul" = "Duzenli",
"Heavy" = "Fazla")
)
head(veri_3)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Kadın 18.250 92 Bazen 173.00 Hic
## 2 Erkek 17.583 104 Yok 177.80 Duzenli
## 3 Erkek 16.917 87 Yok NA Ara Sıra
## 4 Erkek 20.333 NA Yok 160.00 Hic
## 5 Erkek 23.667 35 Bazen 165.00 Hic
## 6 Kadın 21.000 64 Bazen 172.72 Hic
veri_3 veri setindeki eksik değerleri
sorgulayın. Eksik değer varsa çıkarın ve gözlem sayısındaki farkı
açıklayın. Veri setinin son halini veri_son olarak isimlendirin.any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet yas nabiz egzersiz boy sigara
## 1 0 45 0 28 1
Yukarıdaki tabloda cinsiyet değişkeninde 1 kayıp veri,nabızda 45, boyda 28 ve sigara değişkeninde 1 kayıp veri bulunmaktadır.Yaş ve egzersiz değişkenlerinde kayıp veri bulunmamaktadır.
veri_son <- na.omit(veri_3)
summary(veri_son)
## cinsiyet yas nabiz egzersiz boy
## Kadın:85 Min. :16.92 Min. : 35.00 Sık :86 Min. :152.0
## Erkek:85 1st Qu.:17.67 1st Qu.: 66.25 Yok :14 1st Qu.:165.0
## Median :18.58 Median : 72.00 Bazen:70 Median :171.0
## Mean :20.46 Mean : 73.92 Mean :172.5
## 3rd Qu.:20.17 3rd Qu.: 80.00 3rd Qu.:180.0
## Max. :70.42 Max. :104.00 Max. :200.0
## sigara
## Fazla : 7
## Hic :136
## Ara Sıra: 13
## Duzenli : 14
##
##
veri_son için yas, nabiz ve boy
değişkenlerininmin
max
1st quarter
3rd quarter
mean
median
yaş için;
min:17 en düşük yaş olabilir.
max:70.42 yaklaşık en yüksek yaş.
1st quarter:17.65 %25’i 17.65’in altıdır.
3rd quarter:20.17 %75’i 20.17’nin altıdır.
mean:20.46 ortalama yaş 20.5, dağılım sağ çarpık olur.
median:18.58 ortanca değer.
nabız için;
min:35 nadir görülür ama olasıdır.
max:104 olabilir.
1st quarter:66.25 %25’i 66.25’in altıdır.
3rd quarter:80.00 %75’i 80.00’nin altıdır.
mean:73.92 ortalama 74.
median:72 ortanca değer.
boy için;
min:152 en kısa boydur.
max:200 en uzun boydur.
1st quarter:165 %25’i 165 altıdır.
3rd quarter:180 %75’i 180 altıdır.
mean:172.5 ortalama boy.
median:171 ortanca boy.
veri_son %>%
group_by(egzersiz) %>%
summarise(ortalama_nabiz = round(mean(nabiz), 2))
## # A tibble: 3 × 2
## egzersiz ortalama_nabiz
## <fct> <dbl>
## 1 Sık 71.4
## 2 Yok 75.9
## 3 Bazen 76.6Tabloya göre egzersiz sıklığı arttıkça nabız değeri azalır.
Egzersiz yapmayanlarda ortalama nabız 75.86
Bazen egzersiz yapanlarda ortalama nabız 76.59
Sık egzersiz yapanlarda ortalama nabız 71.43
yas değişkenine ait mod, medyan
ve aritmetik ortalama değerlerini hesaplayın.library(lsr)
modeOf(veri_son$yas)
## [1] 17.5
median(veri_son$yas)
## [1] 18.583
mean(veri_son$yas)
## [1] 20.46377