#Soru 1:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(MASS)
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(lsr)
data("survey")
head(survey)
## Sex Wr.Hnd NW.Hnd W.Hnd Fold Pulse Clap Exer Smoke Height M.I
## 1 Female 18.5 18.0 Right R on L 92 Left Some Never 173.00 Metric
## 2 Male 19.5 20.5 Left R on L 104 Left None Regul 177.80 Imperial
## 3 Male 18.0 13.3 Right L on R 87 Neither None Occas NA <NA>
## 4 Male 18.8 18.9 Right R on L NA Neither None Never 160.00 Metric
## 5 Male 20.0 20.0 Right Neither 35 Right Some Never 165.00 Metric
## 6 Female 18.0 17.7 Right L on R 64 Right Some Never 172.72 Imperial
## Age
## 1 18.250
## 2 17.583
## 3 16.917
## 4 20.333
## 5 23.667
## 6 21.000
names(survey)
## [1] "Sex" "Wr.Hnd" "NW.Hnd" "W.Hnd" "Fold" "Pulse" "Clap" "Exer"
## [9] "Smoke" "Height" "M.I" "Age"
veri1 <- survey %>%
dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)
(head(veri1))
## Sex Age Pulse Exer Height Smoke
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
veri2 <- veri1 %>%
rename(cinsiyet = Sex,yaş = Age,nabız = Pulse,egzersiz = Exer,boy = Height,
sigara = Smoke)
head(veri2)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
names(veri2)
## [1] "cinsiyet" "yaş" "nabız" "egzersiz" "boy" "sigara"
head(veri2,10)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
## 7 Male 18.833 83 Freq 182.88 Never
## 8 Female 35.833 74 Freq 157.00 Never
## 9 Male 19.000 72 Some 175.00 Never
## 10 Male 22.333 90 Some 167.00 Never
veri3 <- veri2 %>%
mutate(
cinsiyet=recode(cinsiyet,
"Female"="Kadın",
"Male"="Erkek"),
egzersiz=recode(egzersiz,
"Some"="Bazen",
"None"="Yok",
"Freq"="Sık"),
sigara=recode(sigara,
"Never"="Hic",
"Regul"="Düzenli",
"Occas"="Arasıra")
)
head(veri3)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Kadın 18.250 92 Bazen 173.00 Hic
## 2 Erkek 17.583 104 Yok 177.80 Düzenli
## 3 Erkek 16.917 87 Yok NA Arasıra
## 4 Erkek 20.333 NA Yok 160.00 Hic
## 5 Erkek 23.667 35 Bazen 165.00 Hic
## 6 Kadın 21.000 64 Bazen 172.72 Hic
any(is.na(veri3))
## [1] TRUE
colSums(is.na(veri3))
## cinsiyet yaş nabız egzersiz boy sigara
## 1 0 45 0 28 1
veri_son <- na.omit(veri3)
summary(veri_son)
## cinsiyet yaş nabız egzersiz boy
## Kadın:85 Min. :16.92 Min. : 35.00 Sık :86 Min. :152.0
## Erkek:85 1st Qu.:17.67 1st Qu.: 66.25 Yok :14 1st Qu.:165.0
## Median :18.58 Median : 72.00 Bazen:70 Median :171.0
## Mean :20.46 Mean : 73.92 Mean :172.5
## 3rd Qu.:20.17 3rd Qu.: 80.00 3rd Qu.:180.0
## Max. :70.42 Max. :104.00 Max. :200.0
## sigara
## Heavy : 7
## Hic :136
## Arasıra: 13
## Düzenli: 14
##
##
veri_son %>%
group_by(egzersiz) %>%
summarise(ortalama_nabız=round(mean(nabız),2))
## # A tibble: 3 × 2
## egzersiz ortalama_nabız
## <fct> <dbl>
## 1 Sık 71.4
## 2 Yok 75.9
## 3 Bazen 76.6
#Egzersiz yapmayanlarda ortalama nabız: 75.86
#Bazen egzersiz yapanlarda ortalama nabız: 76.59
#Sık egzersiz yapanlarda ortalama nabız: 71.43
mean(veri_son$yaş)
## [1] 20.46377
median(veri_son$yaş)
## [1] 18.583
library(lsr)
modeOf(veri_son$yaş)
## [1] 17.5
#soru 5:
İş Hayatında Çalışmanın Akademik Başarıya Etkisi Son zamanlarda part–time çalıştığım günlerde derse odaklanmakta zorlandığımı ve akademik performansımın dalgalandığını fark etmeye başladım. Yoğun iş temposu, vardiya saatleri veya zihinsel yorgunluk ders çalışma verimimi belirgin şekilde düşürüyor gibi geliyor. Bu durumun gerçekten bilimsel bir karşılığı var mı diye düşündükçe, çalışılan süre ile akademik başarı arasındaki ilişkiyi veriyle inceleme fikri aklıma yattı.
Kimlerden veri toplarım? • Hem okul hem iş yükünü aynı anda taşıyan üniversite öğrencilerinden • Özellikle vardiyalı veya gece çalışan öğrencilerden • Çalışma saatleri düzensiz olan part–time çalışanlardan • Çalışmayıp yalnızca okula odaklanan kontrol grubundan Katılımcılardan hangi bilgileri toplarım? • Haftalık çalışma süresi (saat) – Sayısal – Sürekli • İş yükü algısı (1–10) – Ordinal • Gün içi yorgunluk düzeyi (1–10) – Ordinal • Derse odaklanma düzeyi (1–10) – Ordinal • Haftalık ders çalışma süresi (saat) – Sayısal – Sürekli • Akademik başarı göstergesi (vize/final notu, dönem ortalaması) – Sayısal – Sürekli • Çalışma türü (vardiyalı, sabit saat, esnek çalışma vb.) – Nominal • Yoğun iş dönemi olup olmadığı – Nominal (Evet–Hayır) Frekans tablosu oluşturulabilecek üç değişken: 1. Çalışma türü Kaç kişinin hangi tür işte çalıştığını göstermek için ideal bir nominal değişken. 2. Yoğun iş dönemi “Evet–Hayır” şeklindeki dağılımı frekans tablosunda özetleyebilirim. 3. Derse odaklanma düzeyi Ordinal olmasına rağmen çok tekrarlanan değerleri olduğu için frekans tablosunda güzel görünür.
Minimum, maksimum, medyan, çeyrekler, mod ve ortalama hesaplanabilecek üç değişken: 1. Haftalık çalışma süresi (saat) En az ve en çok çalışanları belirleyebilir, ortalama iş yükünü görebilirim. 2. Akademik başarı (not) Başarı dağılımını hem merkezi eğilim hem de yayılım ölçüleriyle inceleyebilirim. 3. Gün içi yorgunluk ya da iş yükü algısı