1. Bagaimana cara menampilkan 6 baris pertama dari data_mahasiswa

data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa) |> head(6)
##   X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1       MHS001             L                    4                   1
## 2 2       MHS002             P                    4                   2
## 3 3       MHS003             P                    2                   6
## 4 4       MHS004             P                    5                   3
## 5 5       MHS005             L                    3                   2
## 6 6       MHS006             L                    3                   7
##   motivasi_belajar  ipk
## 1               82 3.12
## 2               73 3.45
## 3               71 3.07
## 4               98 3.43
## 5               81 2.83
## 6               61 3.10

2. Bagaimana cara mengecek struktur dan tipe data_mahasiswa

str(data_mahasiswa)
## 'data.frame':    55 obs. of  7 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ id_mahasiswa        : chr  "MHS001" "MHS002" "MHS003" "MHS004" ...
##  $ jenis_kelamin       : chr  "L" "P" "P" "P" ...
##  $ jam_belajar_per_hari: int  4 4 2 5 3 3 1 3 2 1 ...
##  $ frekuensi_login_lms : int  1 2 6 3 2 7 7 4 6 5 ...
##  $ motivasi_belajar    : int  82 73 71 98 81 61 44 69 44 46 ...
##  $ ipk                 : num  3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...

3. Apakah terdapat missing value?

colSums(is.na(data_mahasiswa))
##                    X         id_mahasiswa        jenis_kelamin 
##                    0                    0                    0 
## jam_belajar_per_hari  frekuensi_login_lms     motivasi_belajar 
##                    0                    0                    0 
##                  ipk 
##                    0

4. Ada berapa laki-laki dan perempuan di kelas ini?

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
table(data_mahasiswa$jenis_kelamin)
## 
##  L  P 
## 32 23

5. Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?

ratarataipk <- aggregate(ipk ~ jenis_kelamin, data = data_mahasiswa, FUN = mean)
ratarataipk
##   jenis_kelamin      ipk
## 1             L 3.158125
## 2             P 3.176957

6. Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?

motivasi_tinggi <- max(data_mahasiswa$motivasi_belajar, na.rm = TRUE)
mahasiswa_motivasi_tertinggi <- filter(data_mahasiswa, motivasi_belajar == motivasi_tinggi)
mahasiswa_motivasi_tertinggi[, c("id_mahasiswa", "motivasi_belajar")]
##   id_mahasiswa motivasi_belajar
## 1       MHS054              100

7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5

login_freq_tinggi <- max(data_mahasiswa$frekuensi_login_lms)
mahasiswa_login_tertinggi <- filter(data_mahasiswa, frekuensi_login_lms == login_freq_tinggi)
mahasiswa_login_tertinggi <- mutate(mahasiswa_login_tertinggi, ipk_tinggi = ipk > 3.5)
print(mahasiswa_login_tertinggi[, c("id_mahasiswa", "frekuensi_login_lms", "ipk", "ipk_tinggi")])
##    id_mahasiswa frekuensi_login_lms  ipk ipk_tinggi
## 1        MHS006                   7 3.10      FALSE
## 2        MHS007                   7 2.98      FALSE
## 3        MHS017                   7 3.06      FALSE
## 4        MHS018                   7 3.89       TRUE
## 5        MHS022                   7 3.69       TRUE
## 6        MHS031                   7 3.22      FALSE
## 7        MHS033                   7 3.11      FALSE
## 8        MHS041                   7 3.73       TRUE
## 9        MHS044                   7 3.15      FALSE
## 10       MHS055                   7 3.21      FALSE

8. Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam

kategori_jam_belajar<- ifelse(data_mahasiswa$jam_belajar_per_hari >= 4, ">=4 jam", "<4 jam")
rata_ipk_belajar <- aggregate(ipk ~ kategori_jam_belajar, data = data_mahasiswa, FUN = mean)
print(rata_ipk_belajar)
##   kategori_jam_belajar      ipk
## 1               <4 jam 2.935357
## 2              >=4 jam 3.405185

9. Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya

Versi 1

mahasiswa_ipk_tertinggi <- data_mahasiswa %>%
  filter(ipk == max(ipk, na.rm = TRUE)) %>%
  select(id_mahasiswa, ipk, motivasi_belajar) %>%
  arrange(desc(ipk))
print(mahasiswa_ipk_tertinggi)
##   id_mahasiswa  ipk motivasi_belajar
## 1       MHS018 3.89               92

Versi 2

mahasiswa_ipk_tertinggi <- max(data_mahasiswa$ipk, na.rm = TRUE)
mahasiswa_ipk_tertinggi <- data_mahasiswa[data_mahasiswa$ipk == mahasiswa_ipk_tertinggi, ]
print(mahasiswa_ipk_tertinggi[, c("id_mahasiswa", "ipk", "motivasi_belajar")])
##    id_mahasiswa  ipk motivasi_belajar
## 18       MHS018 3.89               92

10. Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?

filter_data <- filter(data_mahasiswa, ipk > 3.5 & motivasi_belajar > 85)
jumlah_laki <- sum(filter_data$jenis_kelamin == "L")
jumlah_pr <- sum(filter_data$jenis_kelamin == "P")
print(paste("L =", jumlah_laki))
## [1] "L = 4"
print(paste("P =", jumlah_pr))
## [1] "P = 1"