#1. Bagaimana cara menampilkan 6 baris pertama dari data_mahasiswa
data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
#2. Bagaimana cara mengecek struktur dan tipe data_mahasiswa
str(data_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
#3. Apakah terdapat missing value?
colSums(is.na(data_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
summary(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari
## Min. : 1.0 Length:55 Length:55 Min. :1.000
## 1st Qu.:14.5 Class :character Class :character 1st Qu.:2.000
## Median :28.0 Mode :character Mode :character Median :3.000
## Mean :28.0 Mean :3.127
## 3rd Qu.:41.5 3rd Qu.:4.000
## Max. :55.0 Max. :5.000
## frekuensi_login_lms motivasi_belajar ipk
## Min. :1.000 Min. : 35.0 Min. :2.490
## 1st Qu.:2.000 1st Qu.: 56.5 1st Qu.:2.955
## Median :4.000 Median : 73.0 Median :3.130
## Mean :4.018 Mean : 71.0 Mean :3.166
## 3rd Qu.:6.000 3rd Qu.: 87.0 3rd Qu.:3.365
## Max. :7.000 Max. :100.0 Max. :3.890
#4. Ada berapa laki-laki dan perempuan di kelas ini?
table(data_mahasiswa$jenis_kelamin)
##
## L P
## 32 23
#5. Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
rata_rata_ipk_jenis_kelamin <- data_mahasiswa |>
group_by(jenis_kelamin) |>
summarise(
Rata_Rata_IPK = mean(ipk, na.rm = TRUE)
) |>
arrange(desc(Rata_Rata_IPK))
print(rata_rata_ipk_jenis_kelamin)
## # A tibble: 2 × 2
## jenis_kelamin Rata_Rata_IPK
## <chr> <dbl>
## 1 P 3.18
## 2 L 3.16
#6. Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?
library(dplyr)
id_tertinggi <- data_mahasiswa |>
arrange(desc(motivasi_belajar)) |>
slice_head(n = 5) |>
select(id_mahasiswa, motivasi_belajar)
print(id_tertinggi)
## id_mahasiswa motivasi_belajar
## 1 MHS054 100
## 2 MHS004 98
## 3 MHS045 96
## 4 MHS018 92
## 5 MHS048 92
#7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
library(dplyr)
analisis_login_ipk <- data_mahasiswa |>
mutate(
Kategori_IPK = case_when(
ipk > 3.5 ~ "Tinggi (> 3.5)",
TRUE ~ "Rendah (<= 3.5)"
)
) |>
group_by(Kategori_IPK) |>
summarise(
Rata_Rata_Login = mean(frekuensi_login_lms, na.rm = TRUE)
) |>
arrange(desc(Rata_Rata_Login))
print(analisis_login_ipk)
## # A tibble: 2 × 2
## Kategori_IPK Rata_Rata_Login
## <chr> <dbl>
## 1 Tinggi (> 3.5) 5.44
## 2 Rendah (<= 3.5) 3.74
#8. Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?
library(dplyr)
analisis_jam_belajar_ipk <- data_mahasiswa |>
mutate(
Kategori_Belajar = case_when(
jam_belajar_per_hari >= 4 ~ "Tinggi (>= 4 Jam)",
TRUE ~ "Rendah (< 4 Jam)"
)
) |>
group_by(Kategori_Belajar) |>
summarise(
Rata_Rata_IPK = mean(ipk, na.rm = TRUE),
Jumlah_Mahasiswa = n()
) |>
arrange(desc(Rata_Rata_IPK))
print(analisis_jam_belajar_ipk)
## # A tibble: 2 × 3
## Kategori_Belajar Rata_Rata_IPK Jumlah_Mahasiswa
## <chr> <dbl> <int>
## 1 Tinggi (>= 4 Jam) 3.41 27
## 2 Rendah (< 4 Jam) 2.94 28
#9. Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya
library(dplyr)
mahasiswa_ipk_tertinggi <- data_mahasiswa |>
arrange(desc(ipk)) |>
slice_head(n = 5) |>
select(id_mahasiswa, ipk, motivasi_belajar)
print(mahasiswa_ipk_tertinggi)
## id_mahasiswa ipk motivasi_belajar
## 1 MHS018 3.89 92
## 2 MHS041 3.73 90
## 3 MHS048 3.70 92
## 4 MHS022 3.69 72
## 5 MHS037 3.67 68
#10. Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?
library(dplyr)
jumlah_mahasiswa_sukses <- data_mahasiswa |>
filter(
ipk > 3.5,
motivasi_belajar > 85
) |>
count(jenis_kelamin)
print(jumlah_mahasiswa_sukses)
## jenis_kelamin n
## 1 L 4
## 2 P 1