Bagaimana cara menampilkan 6 baris pertama dari data_mahasiswa

df_mahasiswa <- read.csv("df_mahasiswa.csv")
head(df_mahasiswa)
##   X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1       MHS001             L                    4                   1
## 2 2       MHS002             P                    4                   2
## 3 3       MHS003             P                    2                   6
## 4 4       MHS004             P                    5                   3
## 5 5       MHS005             L                    3                   2
## 6 6       MHS006             L                    3                   7
##   motivasi_belajar  ipk
## 1               82 3.12
## 2               73 3.45
## 3               71 3.07
## 4               98 3.43
## 5               81 2.83
## 6               61 3.10

Bagaimana cara mengecek struktur dan tipe data_mahasiswa

str(df_mahasiswa)
## 'data.frame':    55 obs. of  7 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ id_mahasiswa        : chr  "MHS001" "MHS002" "MHS003" "MHS004" ...
##  $ jenis_kelamin       : chr  "L" "P" "P" "P" ...
##  $ jam_belajar_per_hari: int  4 4 2 5 3 3 1 3 2 1 ...
##  $ frekuensi_login_lms : int  1 2 6 3 2 7 7 4 6 5 ...
##  $ motivasi_belajar    : int  82 73 71 98 81 61 44 69 44 46 ...
##  $ ipk                 : num  3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...

Apakah terdapat missing value

colSums(is.na(df_mahasiswa))
##                    X         id_mahasiswa        jenis_kelamin 
##                    0                    0                    0 
## jam_belajar_per_hari  frekuensi_login_lms     motivasi_belajar 
##                    0                    0                    0 
##                  ipk 
##                    0

Ada berapa laki-laki dan perempuan di kelas ini?

table(df_mahasiswa$jenis_kelamin)
## 
##  L  P 
## 32 23

Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?

aggregate(ipk ~ jenis_kelamin, data = df_mahasiswa, mean)
##   jenis_kelamin      ipk
## 1             L 3.158125
## 2             P 3.176957

Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?

aggregate(motivasi_belajar ~ id_mahasiswa, data = df_mahasiswa, mean)
##    id_mahasiswa motivasi_belajar
## 1        MHS001               82
## 2        MHS002               73
## 3        MHS003               71
## 4        MHS004               98
## 5        MHS005               81
## 6        MHS006               61
## 7        MHS007               44
## 8        MHS008               69
## 9        MHS009               44
## 10       MHS010               46
## 11       MHS011               56
## 12       MHS012               35
## 13       MHS013               59
## 14       MHS014               81
## 15       MHS015               44
## 16       MHS016               90
## 17       MHS017               52
## 18       MHS018               92
## 19       MHS019               84
## 20       MHS020               73
## 21       MHS021               47
## 22       MHS022               72
## 23       MHS023               83
## 24       MHS024               81
## 25       MHS025               70
## 26       MHS026               89
## 27       MHS027               59
## 28       MHS028               53
## 29       MHS029               48
## 30       MHS030               87
## 31       MHS031               71
## 32       MHS032               39
## 33       MHS033               46
## 34       MHS034               87
## 35       MHS035               91
## 36       MHS036               66
## 37       MHS037               68
## 38       MHS038               90
## 39       MHS039               52
## 40       MHS040               80
## 41       MHS041               90
## 42       MHS042               73
## 43       MHS043               91
## 44       MHS044               63
## 45       MHS045               96
## 46       MHS046               43
## 47       MHS047               82
## 48       MHS048               92
## 49       MHS049               73
## 50       MHS050               57
## 51       MHS051               92
## 52       MHS052               88
## 53       MHS053               80
## 54       MHS054              100
## 55       MHS055               71
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5

df_mahasiswa %>%
  filter(frekuensi_login_lms == max(frekuensi_login_lms, na.rm = TRUE)) %>%
  select(id_mahasiswa, frekuensi_login_lms, ipk)
##    id_mahasiswa frekuensi_login_lms  ipk
## 1        MHS006                   7 3.10
## 2        MHS007                   7 2.98
## 3        MHS017                   7 3.06
## 4        MHS018                   7 3.89
## 5        MHS022                   7 3.69
## 6        MHS031                   7 3.22
## 7        MHS033                   7 3.11
## 8        MHS041                   7 3.73
## 9        MHS044                   7 3.15
## 10       MHS055                   7 3.21

Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?

df_mahasiswa %>%
  mutate(jam_belajar_per_hari = ifelse(jam_belajar_per_hari >= 4, "≥4 Jam", "<4 Jam")) %>%
  group_by(jam_belajar_per_hari) %>%
  summarise(ipk = mean(ipk, na.rm = TRUE))
## # A tibble: 2 × 2
##   jam_belajar_per_hari   ipk
##   <chr>                <dbl>
## 1 <4 Jam                2.94
## 2 ≥4 Jam                3.41
library(dplyr)
df_mahasiswa %>%
  slice_max(order_by = ipk, n = 1) %>%
  select(id_mahasiswa, motivasi_belajar, ipk)
##   id_mahasiswa motivasi_belajar  ipk
## 1       MHS018               92 3.89
q1 <- df_mahasiswa %>%
  filter(ipk>3.5, motivasi_belajar>85) %>%
  group_by(jenis_kelamin) %>%
  summarise(jumlah=n())
q1
## # A tibble: 2 × 2
##   jenis_kelamin jumlah
##   <chr>          <int>
## 1 L                  4
## 2 P                  1