R Markdown
df_mahasiswa <- read.csv("df_mahasiswa.csv")
# Bagaimana cara menampilkan 6 baris pertama dari data_mahasiswa
head(df_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
# Bagaimana cara mengecek struktur dan tipe data_mahasiswa
str(df_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
# Apakah terdapat missing value?
colSums(is.na(df_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
# Ada berapa laki-laki dan perempuan di kelas ini?
table(df_mahasiswa$jenis_kelamin)
##
## L P
## 32 23
# Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?
library (dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
rata.ipk <- aggregate(ipk~jenis_kelamin, data=df_mahasiswa, mean)
rata.ipk <- arrange(rata.ipk, desc(ipk))
rata.ipk [1, ]
## jenis_kelamin ipk
## 1 P 3.176957
# Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?
library (dplyr)
df <- df_mahasiswa
df <- df%>%
arrange(desc(motivasi_belajar)) %>%
slice_head(n=1)%>%
select(id_mahasiswa, motivasi_belajar)
df
## id_mahasiswa motivasi_belajar
## 1 MHS054 100
# Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
library (dplyr)
df <- df_mahasiswa
df <- df%>%
arrange(desc(frekuensi_login_lms)) %>%
slice_head(n=1)%>%
select(id_mahasiswa, frekuensi_login_lms, ipk)
if (df$ipk>3.5) {
print ("mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi")
} else {
print ("mahasiswa dengan frekuensi login LMS tertinggi tidak memiliki IPK tinggi")
}
## [1] "mahasiswa dengan frekuensi login LMS tertinggi tidak memiliki IPK tinggi"
df
## id_mahasiswa frekuensi_login_lms ipk
## 1 MHS006 7 3.1
# Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam
library (dplyr)
lebih_dari_4 <- df_mahasiswa%>%
filter(jam_belajar_per_hari>=4) %>%
summarise(rata_ipk = mean(ipk, na.rm = TRUE))
kurang_dari_4 <- df_mahasiswa%>%
filter(jam_belajar_per_hari<4) %>%
summarise(rata_ipk = mean(ipk, na.rm = TRUE))
print(lebih_dari_4)
## rata_ipk
## 1 3.405185
print(kurang_dari_4)
## rata_ipk
## 1 2.935357
if (lebih_dari_4$rata_ipk > kurang_dari_4$rata_ipk) {
print("Mahasiswa yang belajar >= 4 jam per hari memiliki IPK lebih tinggi.\n")
} else {
print("Mahasiswa yang belajar < 4 jam per hari memiliki IPK lebih tinggi atau sama.\n")
}
## [1] "Mahasiswa yang belajar >= 4 jam per hari memiliki IPK lebih tinggi.\n"
# Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya
library (dplyr)
df <- df_mahasiswa
df <- df%>%
arrange(desc(ipk)) %>%
slice_head(n=1)%>%
select(id_mahasiswa, motivasi_belajar, ipk)
df
## id_mahasiswa motivasi_belajar ipk
## 1 MHS018 92 3.89
# Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?
library (dplyr)
df <- df_mahasiswa
df_filtered <- df %>%
filter(ipk > 3.5, motivasi_belajar > 85)
df_filtered %>%
group_by(jenis_kelamin) %>%
summarise(jumlah = n())
## # A tibble: 2 × 2
## jenis_kelamin jumlah
## <chr> <int>
## 1 L 4
## 2 P 1