#Soru 1:

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)

data("survey")

head(survey)
##      Sex Wr.Hnd NW.Hnd W.Hnd    Fold Pulse    Clap Exer Smoke Height      M.I
## 1 Female   18.5   18.0 Right  R on L    92    Left Some Never 173.00   Metric
## 2   Male   19.5   20.5  Left  R on L   104    Left None Regul 177.80 Imperial
## 3   Male   18.0   13.3 Right  L on R    87 Neither None Occas     NA     <NA>
## 4   Male   18.8   18.9 Right  R on L    NA Neither None Never 160.00   Metric
## 5   Male   20.0   20.0 Right Neither    35   Right Some Never 165.00   Metric
## 6 Female   18.0   17.7 Right  L on R    64   Right Some Never 172.72 Imperial
##      Age
## 1 18.250
## 2 17.583
## 3 16.917
## 4 20.333
## 5 23.667
## 6 21.000
names(survey)
##  [1] "Sex"    "Wr.Hnd" "NW.Hnd" "W.Hnd"  "Fold"   "Pulse"  "Clap"   "Exer"  
##  [9] "Smoke"  "Height" "M.I"    "Age"
veri1 <- survey %>% 
  dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)

(head(veri1))
##      Sex    Age Pulse Exer Height Smoke
## 1 Female 18.250    92 Some 173.00 Never
## 2   Male 17.583   104 None 177.80 Regul
## 3   Male 16.917    87 None     NA Occas
## 4   Male 20.333    NA None 160.00 Never
## 5   Male 23.667    35 Some 165.00 Never
## 6 Female 21.000    64 Some 172.72 Never

Soru 1.1:

veri2 <- veri1 %>% 
  rename(cinsiyet = Sex,yaş = Age,nabız = Pulse,egzersiz = Exer,boy = Height,
         sigara = Smoke)
head(veri2)
##   cinsiyet    yaş nabız egzersiz    boy sigara
## 1   Female 18.250    92     Some 173.00  Never
## 2     Male 17.583   104     None 177.80  Regul
## 3     Male 16.917    87     None     NA  Occas
## 4     Male 20.333    NA     None 160.00  Never
## 5     Male 23.667    35     Some 165.00  Never
## 6   Female 21.000    64     Some 172.72  Never
names(veri2)
## [1] "cinsiyet" "yaş"      "nabız"    "egzersiz" "boy"      "sigara"

Soru 1.2:

head(veri2,10)
##    cinsiyet    yaş nabız egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never

Soru 2:

veri3 <- veri2 %>% 
  mutate(
    cinsiyet=recode(cinsiyet,
                    "Female"="Kadın",
                     "Male"="Erkek"),
    egzersiz=recode(egzersiz,
                      "Some"="Bazen",
                      "None"="Yok",
                       "Freq"="Sık"),
    sigara=recode(sigara,
                    "Never"="Hic",
                    "Regul"="Düzenli",
                    "Occas"="Arasıra")
  )

Soru 3:

head(veri3)
##   cinsiyet    yaş nabız egzersiz    boy  sigara
## 1    Kadın 18.250    92    Bazen 173.00     Hic
## 2    Erkek 17.583   104      Yok 177.80 Düzenli
## 3    Erkek 16.917    87      Yok     NA Arasıra
## 4    Erkek 20.333    NA      Yok 160.00     Hic
## 5    Erkek 23.667    35    Bazen 165.00     Hic
## 6    Kadın 21.000    64    Bazen 172.72     Hic
any(is.na(veri3))
## [1] TRUE
colSums(is.na(veri3))
## cinsiyet      yaş    nabız egzersiz      boy   sigara 
##        1        0       45        0       28        1
veri_son <- na.omit(veri3)

Soru 4:

summary(veri_son)
##   cinsiyet       yaş            nabız         egzersiz       boy       
##  Kadın:85   Min.   :16.92   Min.   : 35.00   Sık  :86   Min.   :152.0  
##  Erkek:85   1st Qu.:17.67   1st Qu.: 66.25   Yok  :14   1st Qu.:165.0  
##             Median :18.58   Median : 72.00   Bazen:70   Median :171.0  
##             Mean   :20.46   Mean   : 73.92              Mean   :172.5  
##             3rd Qu.:20.17   3rd Qu.: 80.00              3rd Qu.:180.0  
##             Max.   :70.42   Max.   :104.00              Max.   :200.0  
##      sigara   
##  Heavy  :  7  
##  Hic    :136  
##  Arasıra: 13  
##  Düzenli: 14  
##               
## 

Soru 4.1:

veri_son %>%
group_by(egzersiz) %>% 
summarise(ortalama_nabız=round(mean(nabız),2))
## # A tibble: 3 × 2
##   egzersiz ortalama_nabız
##   <fct>             <dbl>
## 1 Sık                71.4
## 2 Yok                75.9
## 3 Bazen              76.6

#Egzersiz yapmayanlarda ortalama nabız: 75.86

#Bazen egzersiz yapanlarda ortalama nabız: 76.59

#Sık egzersiz yapanlarda ortalama nabız: 71.43

Soru 4.2:

mean(veri_son$yaş) 
## [1] 20.46377
median(veri_son$yaş)
## [1] 18.583
library(lsr) 
modeOf(veri_son$yaş)
## [1] 17.5

#soru 5:

İş Hayatında Çalışmanın Akademik Başarıya Etkisi Son zamanlarda part–time çalıştığım günlerde derse odaklanmakta zorlandığımı ve akademik performansımın dalgalandığını fark etmeye başladım. Yoğun iş temposu, vardiya saatleri veya zihinsel yorgunluk ders çalışma verimimi belirgin şekilde düşürüyor gibi geliyor. Bu durumun gerçekten bilimsel bir karşılığı var mı diye düşündükçe, çalışılan süre ile akademik başarı arasındaki ilişkiyi veriyle inceleme fikri aklıma yattı.

Kimlerden veri toplarım? • Hem okul hem iş yükünü aynı anda taşıyan üniversite öğrencilerinden • Özellikle vardiyalı veya gece çalışan öğrencilerden • Çalışma saatleri düzensiz olan part–time çalışanlardan • Çalışmayıp yalnızca okula odaklanan kontrol grubundan Katılımcılardan hangi bilgileri toplarım? • Haftalık çalışma süresi (saat) – Sayısal – Sürekli • İş yükü algısı (1–10) – Ordinal • Gün içi yorgunluk düzeyi (1–10) – Ordinal • Derse odaklanma düzeyi (1–10) – Ordinal • Haftalık ders çalışma süresi (saat) – Sayısal – Sürekli • Akademik başarı göstergesi (vize/final notu, dönem ortalaması) – Sayısal – Sürekli • Çalışma türü (vardiyalı, sabit saat, esnek çalışma vb.) – Nominal • Yoğun iş dönemi olup olmadığı – Nominal (Evet–Hayır) Frekans tablosu oluşturulabilecek üç değişken: 1. Çalışma türü Kaç kişinin hangi tür işte çalıştığını göstermek için ideal bir nominal değişken. 2. Yoğun iş dönemi “Evet–Hayır” şeklindeki dağılımı frekans tablosunda özetleyebilirim. 3. Derse odaklanma düzeyi Ordinal olmasına rağmen çok tekrarlanan değerleri olduğu için frekans tablosunda güzel görünür.

Minimum, maksimum, medyan, çeyrekler, mod ve ortalama hesaplanabilecek üç değişken: 1. Haftalık çalışma süresi (saat) En az ve en çok çalışanları belirleyebilir, ortalama iş yükünü görebilirim. 2. Akademik başarı (not) Başarı dağılımını hem merkezi eğilim hem de yayılım ölçüleriyle inceleyebilirim. 3. Gün içi yorgunluk ya da iş yükü algısı