Pendahuluan

Dataset ‘sleep’ digunakan untuk menganalisis waktu tambahan tidur pada dua kelompok eksperimen

Analisis Data

Ringakasan Statistik

library(datasets)
data("sleep")
View(sleep)
head(sleep)
##   extra group ID
## 1   0.7     1  1
## 2  -1.6     1  2
## 3  -0.2     1  3
## 4  -1.2     1  4
## 5  -0.1     1  5
## 6   3.4     1  6
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Rata-rata tambahan waktu tidur per Grup (summarise)

sleep %>%
  group_by(group) %>%
  summarise(mean_extra = mean (extra),
            sd_extra = sd(extra))
## # A tibble: 2 × 3
##   group mean_extra sd_extra
##   <fct>      <dbl>    <dbl>
## 1 1           0.75     1.79
## 2 2           2.33     2.00

Urutan data berdasarkan extra secara descending (arrage)

sleep %>%
  filter(extra > 0) %>%
  arrange(desc(extra))
##    extra group ID
## 1    5.5     2  7
## 2    4.6     2  9
## 3    4.4     2  6
## 4    3.7     1  7
## 5    3.4     1  6
## 6    3.4     2 10
## 7    2.0     1 10
## 8    1.9     2  1
## 9    1.6     2  8
## 10   1.1     2  3
## 11   0.8     1  8
## 12   0.8     2  2
## 13   0.7     1  1
## 14   0.1     2  4

Tambahkan kolom extra_minutes (modifikasi)

sleep %>%
  mutate(extra_hourese_category = ifelse(extra > 1, "Lebih dari 1 Jam", "Kurang dari 1 Jam"))
##    extra group ID extra_hourese_category
## 1    0.7     1  1      Kurang dari 1 Jam
## 2   -1.6     1  2      Kurang dari 1 Jam
## 3   -0.2     1  3      Kurang dari 1 Jam
## 4   -1.2     1  4      Kurang dari 1 Jam
## 5   -0.1     1  5      Kurang dari 1 Jam
## 6    3.4     1  6       Lebih dari 1 Jam
## 7    3.7     1  7       Lebih dari 1 Jam
## 8    0.8     1  8      Kurang dari 1 Jam
## 9    0.0     1  9      Kurang dari 1 Jam
## 10   2.0     1 10       Lebih dari 1 Jam
## 11   1.9     2  1       Lebih dari 1 Jam
## 12   0.8     2  2      Kurang dari 1 Jam
## 13   1.1     2  3       Lebih dari 1 Jam
## 14   0.1     2  4      Kurang dari 1 Jam
## 15  -0.1     2  5      Kurang dari 1 Jam
## 16   4.4     2  6       Lebih dari 1 Jam
## 17   5.5     2  7       Lebih dari 1 Jam
## 18   1.6     2  8       Lebih dari 1 Jam
## 19   4.6     2  9       Lebih dari 1 Jam
## 20   3.4     2 10       Lebih dari 1 Jam

##Select

sleep %>%
  select(extra, group)
##    extra group
## 1    0.7     1
## 2   -1.6     1
## 3   -0.2     1
## 4   -1.2     1
## 5   -0.1     1
## 6    3.4     1
## 7    3.7     1
## 8    0.8     1
## 9    0.0     1
## 10   2.0     1
## 11   1.9     2
## 12   0.8     2
## 13   1.1     2
## 14   0.1     2
## 15  -0.1     2
## 16   4.4     2
## 17   5.5     2
## 18   1.6     2
## 19   4.6     2
## 20   3.4     2

Menggabungkan 2 fungsi

Hitung rata-rata extra untuk grup 1 (filter dan summarise)

sleep %>%
  filter(group == 1) %>%
  summarise(mean_extra = mean(extra))
##   mean_extra
## 1       0.75

Mengurutkan data extra_minutes

sleep %>%
  mutate(extra_minutes = extra * 60) %>%
  arrange (extra_minutes)
##    extra group ID extra_minutes
## 1   -1.6     1  2           -96
## 2   -1.2     1  4           -72
## 3   -0.2     1  3           -12
## 4   -0.1     1  5            -6
## 5   -0.1     2  5            -6
## 6    0.0     1  9             0
## 7    0.1     2  4             6
## 8    0.7     1  1            42
## 9    0.8     1  8            48
## 10   0.8     2  2            48
## 11   1.1     2  3            66
## 12   1.6     2  8            96
## 13   1.9     2  1           114
## 14   2.0     1 10           120
## 15   3.4     1  6           204
## 16   3.4     2 10           204
## 17   3.7     1  7           222
## 18   4.4     2  6           264
## 19   4.6     2  9           276
## 20   5.5     2  7           330

Kategori tambahan waktu tidur

sleep %>%
  select(extra,group) %>%
  mutate (extra_category = ifelse(extra > 0, "Postitif", "Negatif")) %>%
  group_by(extra_category) %>%
  summarise(mean_extra = mean (extra),
             count = n())
## # A tibble: 2 × 3
##   extra_category mean_extra count
##   <chr>               <dbl> <int>
## 1 Negatif            -0.533     6
## 2 Postitif            2.43     14