Kuiz Pengantar Sains Data Week 6
Cara menampilkan 6 baris pertama dari data_mahasiswa adalah menggunakan:
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
Cara untuk mengecek struktur dan tipe data_mahasiswa adalah menggunakan:
str(data_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
Cara untuk mengecek apakah terdapat missing value atau tidak adalah menggunakan :
colSums(is.na(data_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
Dari data di atas, maka jawabannya adalah tidak ada missing value.
Untuk mencari jumlah laki-laki dan perempuan di kelas ini adalah menggunakan:
table(data_mahasiswa$jenis_kelamin)
##
## L P
## 32 23
Jadi, jumlah laki-laki di kelas ini adalah 32, dan jumlah perempuan di kelas ini adalah 23.
Untuk mencari jenis kelamin apakah yang memiliki rata-rata ipk tertinggi adalah menggunakan:
aggregate(ipk ~ jenis_kelamin, data = data_mahasiswa, mean)
## jenis_kelamin ipk
## 1 L 3.158125
## 2 P 3.176957
Dari data diatas dapat ditentukan bahwasanya jenis kelamin perempuan memiliki rata-rata ipk tertinggi.
Untuk mencarinya kita dapat mengurutkan data tersebut sesuai dengan motivasi belajar dari yang tertinggi hingga yang terendah dengan cara seperti berikut:
data_mahasiswa %>%
arrange(desc(motivasi_belajar))
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 54 MHS054 L 5 4
## 2 4 MHS004 P 5 3
## 3 45 MHS045 P 5 2
## 4 18 MHS018 L 5 7
## 5 48 MHS048 L 5 4
## 6 51 MHS051 L 4 6
## 7 35 MHS035 L 4 1
## 8 43 MHS043 P 4 5
## 9 16 MHS016 L 5 1
## 10 38 MHS038 L 4 1
## 11 41 MHS041 L 5 7
## 12 26 MHS026 L 4 6
## 13 52 MHS052 L 4 4
## 14 30 MHS030 P 5 3
## 15 34 MHS034 P 5 4
## 16 19 MHS019 L 5 2
## 17 23 MHS023 L 4 4
## 18 1 MHS001 L 4 1
## 19 47 MHS047 L 4 5
## 20 5 MHS005 L 3 2
## 21 14 MHS014 L 4 2
## 22 24 MHS024 P 5 4
## 23 40 MHS040 L 4 2
## 24 53 MHS053 L 3 4
## 25 2 MHS002 P 4 2
## 26 20 MHS020 L 3 1
## 27 42 MHS042 P 4 6
## 28 49 MHS049 P 4 5
## 29 22 MHS022 P 4 7
## 30 3 MHS003 P 2 6
## 31 31 MHS031 P 2 7
## 32 55 MHS055 P 2 7
## 33 25 MHS025 L 3 1
## 34 8 MHS008 L 3 4
## 35 37 MHS037 L 4 6
## 36 36 MHS036 P 3 1
## 37 44 MHS044 P 2 7
## 38 6 MHS006 L 3 7
## 39 13 MHS013 P 2 6
## 40 27 MHS027 L 2 3
## 41 50 MHS050 P 2 4
## 42 11 MHS011 L 1 1
## 43 28 MHS028 P 2 6
## 44 17 MHS017 L 2 7
## 45 39 MHS039 P 1 1
## 46 29 MHS029 L 2 2
## 47 21 MHS021 L 1 6
## 48 10 MHS010 L 1 5
## 49 33 MHS033 P 1 7
## 50 7 MHS007 P 1 7
## 51 9 MHS009 P 2 6
## 52 15 MHS015 L 1 2
## 53 46 MHS046 L 1 3
## 54 32 MHS032 L 1 2
## 55 12 MHS012 P 1 2
## motivasi_belajar ipk
## 1 100 3.41
## 2 98 3.43
## 3 96 3.33
## 4 92 3.89
## 5 92 3.70
## 6 92 3.65
## 7 91 3.13
## 8 91 3.29
## 9 90 3.46
## 10 90 3.29
## 11 90 3.73
## 12 89 3.32
## 13 88 3.30
## 14 87 3.40
## 15 87 3.56
## 16 84 3.09
## 17 83 3.54
## 18 82 3.12
## 19 82 3.13
## 20 81 2.83
## 21 81 3.31
## 22 81 3.61
## 23 80 3.17
## 24 80 3.29
## 25 73 3.45
## 26 73 2.73
## 27 73 3.05
## 28 73 3.22
## 29 72 3.69
## 30 71 3.07
## 31 71 3.22
## 32 71 3.21
## 33 70 2.65
## 34 69 3.08
## 35 68 3.67
## 36 66 2.95
## 37 63 3.15
## 38 61 3.10
## 39 59 3.11
## 40 59 2.94
## 41 57 3.05
## 42 56 2.64
## 43 53 3.14
## 44 52 3.06
## 45 52 2.52
## 46 48 2.89
## 47 47 2.96
## 48 46 2.93
## 49 46 3.11
## 50 44 2.98
## 51 44 2.82
## 52 44 2.90
## 53 43 2.49
## 54 39 2.66
## 55 35 2.71
Dari data tersebut kita dapat mengetahui bahwa id_mahasiswa yang memiliki motivasi_belajar tertinggi adalah MHS054.
Untuk mengetahui hal tersebut, kita harus mengurutkan data tersebut berdasarkan frekuensi login LMS terlebih dahulu.
data_mahasiswa %>%
arrange(desc(frekuensi_login_lms))
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 6 MHS006 L 3 7
## 2 7 MHS007 P 1 7
## 3 17 MHS017 L 2 7
## 4 18 MHS018 L 5 7
## 5 22 MHS022 P 4 7
## 6 31 MHS031 P 2 7
## 7 33 MHS033 P 1 7
## 8 41 MHS041 L 5 7
## 9 44 MHS044 P 2 7
## 10 55 MHS055 P 2 7
## 11 3 MHS003 P 2 6
## 12 9 MHS009 P 2 6
## 13 13 MHS013 P 2 6
## 14 21 MHS021 L 1 6
## 15 26 MHS026 L 4 6
## 16 28 MHS028 P 2 6
## 17 37 MHS037 L 4 6
## 18 42 MHS042 P 4 6
## 19 51 MHS051 L 4 6
## 20 10 MHS010 L 1 5
## 21 43 MHS043 P 4 5
## 22 47 MHS047 L 4 5
## 23 49 MHS049 P 4 5
## 24 8 MHS008 L 3 4
## 25 23 MHS023 L 4 4
## 26 24 MHS024 P 5 4
## 27 34 MHS034 P 5 4
## 28 48 MHS048 L 5 4
## 29 50 MHS050 P 2 4
## 30 52 MHS052 L 4 4
## 31 53 MHS053 L 3 4
## 32 54 MHS054 L 5 4
## 33 4 MHS004 P 5 3
## 34 27 MHS027 L 2 3
## 35 30 MHS030 P 5 3
## 36 46 MHS046 L 1 3
## 37 2 MHS002 P 4 2
## 38 5 MHS005 L 3 2
## 39 12 MHS012 P 1 2
## 40 14 MHS014 L 4 2
## 41 15 MHS015 L 1 2
## 42 19 MHS019 L 5 2
## 43 29 MHS029 L 2 2
## 44 32 MHS032 L 1 2
## 45 40 MHS040 L 4 2
## 46 45 MHS045 P 5 2
## 47 1 MHS001 L 4 1
## 48 11 MHS011 L 1 1
## 49 16 MHS016 L 5 1
## 50 20 MHS020 L 3 1
## 51 25 MHS025 L 3 1
## 52 35 MHS035 L 4 1
## 53 36 MHS036 P 3 1
## 54 38 MHS038 L 4 1
## 55 39 MHS039 P 1 1
## motivasi_belajar ipk
## 1 61 3.10
## 2 44 2.98
## 3 52 3.06
## 4 92 3.89
## 5 72 3.69
## 6 71 3.22
## 7 46 3.11
## 8 90 3.73
## 9 63 3.15
## 10 71 3.21
## 11 71 3.07
## 12 44 2.82
## 13 59 3.11
## 14 47 2.96
## 15 89 3.32
## 16 53 3.14
## 17 68 3.67
## 18 73 3.05
## 19 92 3.65
## 20 46 2.93
## 21 91 3.29
## 22 82 3.13
## 23 73 3.22
## 24 69 3.08
## 25 83 3.54
## 26 81 3.61
## 27 87 3.56
## 28 92 3.70
## 29 57 3.05
## 30 88 3.30
## 31 80 3.29
## 32 100 3.41
## 33 98 3.43
## 34 59 2.94
## 35 87 3.40
## 36 43 2.49
## 37 73 3.45
## 38 81 2.83
## 39 35 2.71
## 40 81 3.31
## 41 44 2.90
## 42 84 3.09
## 43 48 2.89
## 44 39 2.66
## 45 80 3.17
## 46 96 3.33
## 47 82 3.12
## 48 56 2.64
## 49 90 3.46
## 50 73 2.73
## 51 70 2.65
## 52 91 3.13
## 53 66 2.95
## 54 90 3.29
## 55 52 2.52
Dari data tersebut dapat diketahui bahwasanya frekuensi login LMS tertinggi adalah 7, dan mahasiswa yang termasuk memeliki frekuensi login LMS tertinggi sangatlah banyak. Oleh karena itu, kita coba memfilternya dengan IPK > 3.5
data_mahasiswa %>%
arrange(desc(frekuensi_login_lms)) %>%
filter(ipk > 3.5)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 18 MHS018 L 5 7
## 2 22 MHS022 P 4 7
## 3 41 MHS041 L 5 7
## 4 37 MHS037 L 4 6
## 5 51 MHS051 L 4 6
## 6 23 MHS023 L 4 4
## 7 24 MHS024 P 5 4
## 8 34 MHS034 P 5 4
## 9 48 MHS048 L 5 4
## motivasi_belajar ipk
## 1 92 3.89
## 2 72 3.69
## 3 90 3.73
## 4 68 3.67
## 5 92 3.65
## 6 83 3.54
## 7 81 3.61
## 8 87 3.56
## 9 92 3.70
Nah, dari data di atas dapat disimpulkan bahwa mahasiswa yang memiliki frekuensi login LMS tertinggi (7) belum tentu memiliki IPK tinggi (asumsi IPK tinggi > 3.5), tetapi hanya ada beberapa saja.
Untuk mengetahui hal tersebut kita harus mencari rata-rata IPK mahasiswa berdasarkan jam belajar per hari nya.
aggregate(ipk ~ jam_belajar_per_hari >= 4, data = data_mahasiswa, mean)
## jam_belajar_per_hari >= 4 ipk
## 1 FALSE 2.935357
## 2 TRUE 3.405185
Dari data diatas dapat diketahui bahwasanya rata-rata IPK mahasiswa yang memiliki jam belajar per hari >= 4 jam lebih tinggi daripda mahasiswa yang memiliki jam belajar per hari < 4 jam.
Untuk mengetahui hal tersebut, kita harus mengurutkan data sesuai dengan nilai IPK dari yang terbesar sampai yang terkecil terlebih dahulu.
data_mahasiswa %>%
arrange(desc(ipk))
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 18 MHS018 L 5 7
## 2 41 MHS041 L 5 7
## 3 48 MHS048 L 5 4
## 4 22 MHS022 P 4 7
## 5 37 MHS037 L 4 6
## 6 51 MHS051 L 4 6
## 7 24 MHS024 P 5 4
## 8 34 MHS034 P 5 4
## 9 23 MHS023 L 4 4
## 10 16 MHS016 L 5 1
## 11 2 MHS002 P 4 2
## 12 4 MHS004 P 5 3
## 13 54 MHS054 L 5 4
## 14 30 MHS030 P 5 3
## 15 45 MHS045 P 5 2
## 16 26 MHS026 L 4 6
## 17 14 MHS014 L 4 2
## 18 52 MHS052 L 4 4
## 19 38 MHS038 L 4 1
## 20 43 MHS043 P 4 5
## 21 53 MHS053 L 3 4
## 22 31 MHS031 P 2 7
## 23 49 MHS049 P 4 5
## 24 55 MHS055 P 2 7
## 25 40 MHS040 L 4 2
## 26 44 MHS044 P 2 7
## 27 28 MHS028 P 2 6
## 28 35 MHS035 L 4 1
## 29 47 MHS047 L 4 5
## 30 1 MHS001 L 4 1
## 31 13 MHS013 P 2 6
## 32 33 MHS033 P 1 7
## 33 6 MHS006 L 3 7
## 34 19 MHS019 L 5 2
## 35 8 MHS008 L 3 4
## 36 3 MHS003 P 2 6
## 37 17 MHS017 L 2 7
## 38 42 MHS042 P 4 6
## 39 50 MHS050 P 2 4
## 40 7 MHS007 P 1 7
## 41 21 MHS021 L 1 6
## 42 36 MHS036 P 3 1
## 43 27 MHS027 L 2 3
## 44 10 MHS010 L 1 5
## 45 15 MHS015 L 1 2
## 46 29 MHS029 L 2 2
## 47 5 MHS005 L 3 2
## 48 9 MHS009 P 2 6
## 49 20 MHS020 L 3 1
## 50 12 MHS012 P 1 2
## 51 32 MHS032 L 1 2
## 52 25 MHS025 L 3 1
## 53 11 MHS011 L 1 1
## 54 39 MHS039 P 1 1
## 55 46 MHS046 L 1 3
## motivasi_belajar ipk
## 1 92 3.89
## 2 90 3.73
## 3 92 3.70
## 4 72 3.69
## 5 68 3.67
## 6 92 3.65
## 7 81 3.61
## 8 87 3.56
## 9 83 3.54
## 10 90 3.46
## 11 73 3.45
## 12 98 3.43
## 13 100 3.41
## 14 87 3.40
## 15 96 3.33
## 16 89 3.32
## 17 81 3.31
## 18 88 3.30
## 19 90 3.29
## 20 91 3.29
## 21 80 3.29
## 22 71 3.22
## 23 73 3.22
## 24 71 3.21
## 25 80 3.17
## 26 63 3.15
## 27 53 3.14
## 28 91 3.13
## 29 82 3.13
## 30 82 3.12
## 31 59 3.11
## 32 46 3.11
## 33 61 3.10
## 34 84 3.09
## 35 69 3.08
## 36 71 3.07
## 37 52 3.06
## 38 73 3.05
## 39 57 3.05
## 40 44 2.98
## 41 47 2.96
## 42 66 2.95
## 43 59 2.94
## 44 46 2.93
## 45 44 2.90
## 46 48 2.89
## 47 81 2.83
## 48 44 2.82
## 49 73 2.73
## 50 35 2.71
## 51 39 2.66
## 52 70 2.65
## 53 56 2.64
## 54 52 2.52
## 55 43 2.49
Dari data di atas, dapat diketahui ID_Mahasiswa yang memiliki IPK tertinggi adalah MHS018 dengan motivasi belajarnya adalah 92.
mahasiswa_teladan <- data_mahasiswa %>%
filter(ipk > 3.5 & motivasi_belajar > 85)
table(mahasiswa_teladan$jenis_kelamin)
##
## L P
## 4 1
Dari data diatas dapat diketahui bahwa jumlah mahasiswa yang memenuhi syarat-syarat yang tertera dalam soal adalah L=4 dan P=1.