data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa) |> head(6)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
str(data_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
colSums(is.na(data_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
table(data_mahasiswa$jenis_kelamin)
##
## L P
## 32 23
ratarataipk <- aggregate(ipk ~ jenis_kelamin, data = data_mahasiswa, FUN = mean)
ratarataipk
## jenis_kelamin ipk
## 1 L 3.158125
## 2 P 3.176957
motivasi_tinggi <- max(data_mahasiswa$motivasi_belajar, na.rm = TRUE)
mahasiswa_motivasi_tertinggi <- filter(data_mahasiswa, motivasi_belajar == motivasi_tinggi)
mahasiswa_motivasi_tertinggi[, c("id_mahasiswa", "motivasi_belajar")]
## id_mahasiswa motivasi_belajar
## 1 MHS054 100
login_freq_tinggi <- max(data_mahasiswa$frekuensi_login_lms)
mahasiswa_login_tertinggi <- filter(data_mahasiswa, frekuensi_login_lms == login_freq_tinggi)
mahasiswa_login_tertinggi <- mutate(mahasiswa_login_tertinggi, ipk_tinggi = ipk > 3.5)
print(mahasiswa_login_tertinggi[, c("id_mahasiswa", "frekuensi_login_lms", "ipk", "ipk_tinggi")])
## id_mahasiswa frekuensi_login_lms ipk ipk_tinggi
## 1 MHS006 7 3.10 FALSE
## 2 MHS007 7 2.98 FALSE
## 3 MHS017 7 3.06 FALSE
## 4 MHS018 7 3.89 TRUE
## 5 MHS022 7 3.69 TRUE
## 6 MHS031 7 3.22 FALSE
## 7 MHS033 7 3.11 FALSE
## 8 MHS041 7 3.73 TRUE
## 9 MHS044 7 3.15 FALSE
## 10 MHS055 7 3.21 FALSE
kategori_jam_belajar<- ifelse(data_mahasiswa$jam_belajar_per_hari >= 4, ">=4 jam", "<4 jam")
rata_ipk_belajar <- aggregate(ipk ~ kategori_jam_belajar, data = data_mahasiswa, FUN = mean)
print(rata_ipk_belajar)
## kategori_jam_belajar ipk
## 1 <4 jam 2.935357
## 2 >=4 jam 3.405185
Versi 1
mahasiswa_ipk_tertinggi <- data_mahasiswa %>%
filter(ipk == max(ipk, na.rm = TRUE)) %>%
select(id_mahasiswa, ipk, motivasi_belajar) %>%
arrange(desc(ipk))
print(mahasiswa_ipk_tertinggi)
## id_mahasiswa ipk motivasi_belajar
## 1 MHS018 3.89 92
Versi 2
mahasiswa_ipk_tertinggi <- max(data_mahasiswa$ipk, na.rm = TRUE)
mahasiswa_ipk_tertinggi <- data_mahasiswa[data_mahasiswa$ipk == mahasiswa_ipk_tertinggi, ]
print(mahasiswa_ipk_tertinggi[, c("id_mahasiswa", "ipk", "motivasi_belajar")])
## id_mahasiswa ipk motivasi_belajar
## 18 MHS018 3.89 92
filter_data <- filter(data_mahasiswa, ipk > 3.5 & motivasi_belajar > 85)
jumlah_laki <- sum(filter_data$jenis_kelamin == "L")
jumlah_pr <- sum(filter_data$jenis_kelamin == "P")
print(paste("L =", jumlah_laki))
## [1] "L = 4"
print(paste("P =", jumlah_pr))
## [1] "P = 1"