#1
datamahasiswa <- read.csv("df_mahasiswa.csv")
head(datamahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
#2
str(datamahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
#3
colSums(is.na(datamahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
#4
library (dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
frekuensi_jenis_kelamin <- datamahasiswa %>%
group_by(jenis_kelamin) %>%
summarise(jumlah_mahasiswa = n())
print(frekuensi_jenis_kelamin)
## # A tibble: 2 × 2
## jenis_kelamin jumlah_mahasiswa
## <chr> <int>
## 1 L 32
## 2 P 23
#5
library (dplyr)
jenis_kelamin_ipk_tertinggi <- datamahasiswa %>%
group_by(jenis_kelamin) %>%
summarise(Rata_Rata_IPK = mean(ipk, na.rm = TRUE)) %>%
arrange(desc(Rata_Rata_IPK))
print(jenis_kelamin_ipk_tertinggi)
## # A tibble: 2 × 2
## jenis_kelamin Rata_Rata_IPK
## <chr> <dbl>
## 1 P 3.18
## 2 L 3.16
#6
datamahasiswa[order(-datamahasiswa$motivasi_belajar), c("id_mahasiswa", "motivasi_belajar")] |> head(5)
## id_mahasiswa motivasi_belajar
## 54 MHS054 100
## 4 MHS004 98
## 45 MHS045 96
## 18 MHS018 92
## 48 MHS048 92
#7
datamahasiswa[order(-datamahasiswa$ipk), c("id_mahasiswa", "ipk")] |> head(5)
## id_mahasiswa ipk
## 18 MHS018 3.89
## 41 MHS041 3.73
## 48 MHS048 3.70
## 22 MHS022 3.69
## 37 MHS037 3.67
datamahasiswa[order(-datamahasiswa$frekuensi_login_lms), c("id_mahasiswa", "frekuensi_login_lms")] |> head(5)
## id_mahasiswa frekuensi_login_lms
## 6 MHS006 7
## 7 MHS007 7
## 17 MHS017 7
## 18 MHS018 7
## 22 MHS022 7
#8
library (dplyr)
jam_belajar_ipk_tertinggi <- datamahasiswa %>%
group_by(jam_belajar_per_hari) %>%
summarise(Rata_Rata_IPK = mean(ipk, na.rm = TRUE)) %>%
arrange(desc(Rata_Rata_IPK))
print(jam_belajar_ipk_tertinggi)
## # A tibble: 5 × 2
## jam_belajar_per_hari Rata_Rata_IPK
## <int> <dbl>
## 1 5 3.51
## 2 4 3.33
## 3 2 3.06
## 4 3 2.95
## 5 1 2.79
#9
datamahasiswa[order(-datamahasiswa$ipk), c("id_mahasiswa", "ipk")] |> head(5)
## id_mahasiswa ipk
## 18 MHS018 3.89
## 41 MHS041 3.73
## 48 MHS048 3.70
## 22 MHS022 3.69
## 37 MHS037 3.67
#10
library(dplyr)
laki_laki_perempuan_ipk_motivasi_belajar <- datamahasiswa %>%
filter(ipk > 3.5 & motivasi_belajar > 85) %>%
group_by(jenis_kelamin) %>%
summarise(Jumlah = n())
print(laki_laki_perempuan_ipk_motivasi_belajar)
## # A tibble: 2 × 2
## jenis_kelamin Jumlah
## <chr> <int>
## 1 L 4
## 2 P 1