Bagaimana cara menampilkan 6 baris pertama dari data_mahasiswa Import Data
data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
Bagaimana cara mengecek struktur dan tipe data_mahasiswa Data Structure
str(data_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
summary(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari
## Min. : 1.0 Length:55 Length:55 Min. :1.000
## 1st Qu.:14.5 Class :character Class :character 1st Qu.:2.000
## Median :28.0 Mode :character Mode :character Median :3.000
## Mean :28.0 Mean :3.127
## 3rd Qu.:41.5 3rd Qu.:4.000
## Max. :55.0 Max. :5.000
## frekuensi_login_lms motivasi_belajar ipk
## Min. :1.000 Min. : 35.0 Min. :2.490
## 1st Qu.:2.000 1st Qu.: 56.5 1st Qu.:2.955
## Median :4.000 Median : 73.0 Median :3.130
## Mean :4.018 Mean : 71.0 Mean :3.166
## 3rd Qu.:6.000 3rd Qu.: 87.0 3rd Qu.:3.365
## Max. :7.000 Max. :100.0 Max. :3.890
Apakah terdapat missing value? MISSING VALUE
colSums(is.na(data_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Ada berapa laki-laki dan perempuan di kelas ini?
freq <- as.data.frame(sort(table(data_mahasiswa$jenis_kelamin)))
freq
## Var1 Freq
## 1 P 23
## 2 L 32
Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?
aggregate(ipk ~ jenis_kelamin, data = data_mahasiswa, mean)
## jenis_kelamin ipk
## 1 L 3.158125
## 2 P 3.176957
Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?
data_mahasiswa[order(-data_mahasiswa$motivasi_belajar), c("id_mahasiswa", "motivasi_belajar")] |> head(1)
## id_mahasiswa motivasi_belajar
## 54 MHS054 100
View(data_mahasiswa)
Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
data_mahasiswa[order(-data_mahasiswa$ipk), c("id_mahasiswa", "ipk")] |> head(55)
## id_mahasiswa ipk
## 18 MHS018 3.89
## 41 MHS041 3.73
## 48 MHS048 3.70
## 22 MHS022 3.69
## 37 MHS037 3.67
## 51 MHS051 3.65
## 24 MHS024 3.61
## 34 MHS034 3.56
## 23 MHS023 3.54
## 16 MHS016 3.46
## 2 MHS002 3.45
## 4 MHS004 3.43
## 54 MHS054 3.41
## 30 MHS030 3.40
## 45 MHS045 3.33
## 26 MHS026 3.32
## 14 MHS014 3.31
## 52 MHS052 3.30
## 38 MHS038 3.29
## 43 MHS043 3.29
## 53 MHS053 3.29
## 31 MHS031 3.22
## 49 MHS049 3.22
## 55 MHS055 3.21
## 40 MHS040 3.17
## 44 MHS044 3.15
## 28 MHS028 3.14
## 35 MHS035 3.13
## 47 MHS047 3.13
## 1 MHS001 3.12
## 13 MHS013 3.11
## 33 MHS033 3.11
## 6 MHS006 3.10
## 19 MHS019 3.09
## 8 MHS008 3.08
## 3 MHS003 3.07
## 17 MHS017 3.06
## 42 MHS042 3.05
## 50 MHS050 3.05
## 7 MHS007 2.98
## 21 MHS021 2.96
## 36 MHS036 2.95
## 27 MHS027 2.94
## 10 MHS010 2.93
## 15 MHS015 2.90
## 29 MHS029 2.89
## 5 MHS005 2.83
## 9 MHS009 2.82
## 20 MHS020 2.73
## 12 MHS012 2.71
## 32 MHS032 2.66
## 25 MHS025 2.65
## 11 MHS011 2.64
## 39 MHS039 2.52
## 46 MHS046 2.49
data_mahasiswa[order(-data_mahasiswa$frekuensi_login_lms), c("id_mahasiswa", "frekuensi_login_lms")] |> head(15)
## id_mahasiswa frekuensi_login_lms
## 6 MHS006 7
## 7 MHS007 7
## 17 MHS017 7
## 18 MHS018 7
## 22 MHS022 7
## 31 MHS031 7
## 33 MHS033 7
## 41 MHS041 7
## 44 MHS044 7
## 55 MHS055 7
## 3 MHS003 6
## 9 MHS009 6
## 13 MHS013 6
## 21 MHS021 6
## 26 MHS026 6
Tidak, karena id_mahasiswa MHS055 memiliki ipk 3,21
Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?
data_mahasiswa[order(-data_mahasiswa$jam_belajar_per_hari), c("id_mahasiswa", "jam_belajar_per_hari")] |> head(35)
## id_mahasiswa jam_belajar_per_hari
## 4 MHS004 5
## 16 MHS016 5
## 18 MHS018 5
## 19 MHS019 5
## 24 MHS024 5
## 30 MHS030 5
## 34 MHS034 5
## 41 MHS041 5
## 45 MHS045 5
## 48 MHS048 5
## 54 MHS054 5
## 1 MHS001 4
## 2 MHS002 4
## 14 MHS014 4
## 22 MHS022 4
## 23 MHS023 4
## 26 MHS026 4
## 35 MHS035 4
## 37 MHS037 4
## 38 MHS038 4
## 40 MHS040 4
## 42 MHS042 4
## 43 MHS043 4
## 47 MHS047 4
## 49 MHS049 4
## 51 MHS051 4
## 52 MHS052 4
## 5 MHS005 3
## 6 MHS006 3
## 8 MHS008 3
## 20 MHS020 3
## 25 MHS025 3
## 36 MHS036 3
## 53 MHS053 3
## 3 MHS003 2
data_mahasiswa[order(-data_mahasiswa$ipk), c("id_mahasiswa", "ipk")] |> head(30)
## id_mahasiswa ipk
## 18 MHS018 3.89
## 41 MHS041 3.73
## 48 MHS048 3.70
## 22 MHS022 3.69
## 37 MHS037 3.67
## 51 MHS051 3.65
## 24 MHS024 3.61
## 34 MHS034 3.56
## 23 MHS023 3.54
## 16 MHS016 3.46
## 2 MHS002 3.45
## 4 MHS004 3.43
## 54 MHS054 3.41
## 30 MHS030 3.40
## 45 MHS045 3.33
## 26 MHS026 3.32
## 14 MHS014 3.31
## 52 MHS052 3.30
## 38 MHS038 3.29
## 43 MHS043 3.29
## 53 MHS053 3.29
## 31 MHS031 3.22
## 49 MHS049 3.22
## 55 MHS055 3.21
## 40 MHS040 3.17
## 44 MHS044 3.15
## 28 MHS028 3.14
## 35 MHS035 3.13
## 47 MHS047 3.13
## 1 MHS001 3.12
Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya
ipk_tertinggi <- data_mahasiswa[order(-data_mahasiswa$ipk), c("id_mahasiswa", "ipk")] |> head(1)
ipk_tertinggi
## id_mahasiswa ipk
## 18 MHS018 3.89
q11 <- data_mahasiswa %>%
arrange(desc(ipk))%>%
slice(1)%>%
select(id_mahasiswa,ipk,motivasi_belajar)
q11
## id_mahasiswa ipk motivasi_belajar
## 1 MHS018 3.89 92
q22 <- data_mahasiswa %>%
filter(ipk>3.5,motivasi_belajar>85) %>%
group_by(jenis_kelamin)%>%
summarise(jumlah=n())
q22
## # A tibble: 2 × 2
## jenis_kelamin jumlah
## <chr> <int>
## 1 L 4
## 2 P 1