#no 1 cara menampilkan 6 baris pertama dari data mahasiswa
data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa)
## X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1 MHS001 L 4 1
## 2 2 MHS002 P 4 2
## 3 3 MHS003 P 2 6
## 4 4 MHS004 P 5 3
## 5 5 MHS005 L 3 2
## 6 6 MHS006 L 3 7
## motivasi_belajar ipk
## 1 82 3.12
## 2 73 3.45
## 3 71 3.07
## 4 98 3.43
## 5 81 2.83
## 6 61 3.10
# 2. Bagaimana cara mengecek struktur dan tipe data_mahasiswa
str(data_mahasiswa)
## 'data.frame': 55 obs. of 7 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ id_mahasiswa : chr "MHS001" "MHS002" "MHS003" "MHS004" ...
## $ jenis_kelamin : chr "L" "P" "P" "P" ...
## $ jam_belajar_per_hari: int 4 4 2 5 3 3 1 3 2 1 ...
## $ frekuensi_login_lms : int 1 2 6 3 2 7 7 4 6 5 ...
## $ motivasi_belajar : int 82 73 71 98 81 61 44 69 44 46 ...
## $ ipk : num 3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
# 3. Apakah terdapat missing value?
colSums(is.na(data_mahasiswa))
## X id_mahasiswa jenis_kelamin
## 0 0 0
## jam_belajar_per_hari frekuensi_login_lms motivasi_belajar
## 0 0 0
## ipk
## 0
#pada data mahasiswa ini bersih/ tidak ada missing value (NA), jadi hasil semuanya 0
# 4. Ada berapa laki-laki dan perempuan di kelas ini?
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
dfmahasiswa <- data_mahasiswa %>%
count(jenis_kelamin)
dfmahasiswa
## jenis_kelamin n
## 1 L 32
## 2 P 23
# 5. Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi ?
aggregate(ipk ~ jenis_kelamin , data = data_mahasiswa, mean)
## jenis_kelamin ipk
## 1 L 3.158125
## 2 P 3.176957
# 6. Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?
data_mahasiswa[order(-data_mahasiswa$motivasi_belajar), c("id_mahasiswa", "motivasi_belajar")] |> head(5)
## id_mahasiswa motivasi_belajar
## 54 MHS054 100
## 4 MHS004 98
## 45 MHS045 96
## 18 MHS018 92
## 48 MHS048 92
# 7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
data_mahasiswa[order(-data_mahasiswa$frekuensi_login_lms), c("id_mahasiswa", "frekuensi_login_lms", "ipk")] |> head(100)
## id_mahasiswa frekuensi_login_lms ipk
## 6 MHS006 7 3.10
## 7 MHS007 7 2.98
## 17 MHS017 7 3.06
## 18 MHS018 7 3.89
## 22 MHS022 7 3.69
## 31 MHS031 7 3.22
## 33 MHS033 7 3.11
## 41 MHS041 7 3.73
## 44 MHS044 7 3.15
## 55 MHS055 7 3.21
## 3 MHS003 6 3.07
## 9 MHS009 6 2.82
## 13 MHS013 6 3.11
## 21 MHS021 6 2.96
## 26 MHS026 6 3.32
## 28 MHS028 6 3.14
## 37 MHS037 6 3.67
## 42 MHS042 6 3.05
## 51 MHS051 6 3.65
## 10 MHS010 5 2.93
## 43 MHS043 5 3.29
## 47 MHS047 5 3.13
## 49 MHS049 5 3.22
## 8 MHS008 4 3.08
## 23 MHS023 4 3.54
## 24 MHS024 4 3.61
## 34 MHS034 4 3.56
## 48 MHS048 4 3.70
## 50 MHS050 4 3.05
## 52 MHS052 4 3.30
## 53 MHS053 4 3.29
## 54 MHS054 4 3.41
## 4 MHS004 3 3.43
## 27 MHS027 3 2.94
## 30 MHS030 3 3.40
## 46 MHS046 3 2.49
## 2 MHS002 2 3.45
## 5 MHS005 2 2.83
## 12 MHS012 2 2.71
## 14 MHS014 2 3.31
## 15 MHS015 2 2.90
## 19 MHS019 2 3.09
## 29 MHS029 2 2.89
## 32 MHS032 2 2.66
## 40 MHS040 2 3.17
## 45 MHS045 2 3.33
## 1 MHS001 1 3.12
## 11 MHS011 1 2.64
## 16 MHS016 1 3.46
## 20 MHS020 1 2.73
## 25 MHS025 1 2.65
## 35 MHS035 1 3.13
## 36 MHS036 1 2.95
## 38 MHS038 1 3.29
## 39 MHS039 1 2.52
#berdasarkan hasil run dengan frekuensi login lms tertinggi data paling atas menunjukan ipk 3.10 yang berarti kurang dari 3.5
#Lanjutan 7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
aggregate(ipk ~ frekuensi_login_lms , data = data_mahasiswa, mean)
## frekuensi_login_lms ipk
## 1 1 2.943333
## 2 2 3.034000
## 3 3 3.065000
## 4 4 3.393333
## 5 5 3.142500
## 6 6 3.198889
## 7 7 3.314000
#berdasarkan rata rata yang frekuensi login lms yg tertinggi (7 jam) memiliki rata rata ipk sekitar 3.31 yang berarti kurang dari 3.5
#8. Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?
aggregate(ipk ~ jam_belajar_per_hari , data = data_mahasiswa, mean)
## jam_belajar_per_hari ipk
## 1 1 2.790000
## 2 2 3.060000
## 3 3 2.947143
## 4 4 3.333125
## 5 5 3.510000
#berdasarkan hasil run, mahasiswa yang memiliki jam belajar >= 4 memiliki rata rata ipk 3,33 dan 3,51 yang dimana lebih besar dibandingkan dengan yang memiliki jam belajar dibawahnya. Dengan demikian pernyataan tersebut benar
#9. Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya
data_mahasiswa[order(-data_mahasiswa$ipk), c("id_mahasiswa","ipk", "motivasi_belajar")] |> head(5)
## id_mahasiswa ipk motivasi_belajar
## 18 MHS018 3.89 92
## 41 MHS041 3.73 90
## 48 MHS048 3.70 92
## 22 MHS022 3.69 72
## 37 MHS037 3.67 68
#Berdasarkan hasil run, Mahasiswa dengan ID MHS018 memiliki IPK tertinggi yaitu 3.89 dan memiliki nilai motivasi 92
#10. Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?
jumlah_mhs <- data_mahasiswa %>%
filter(ipk > 3.5 ,motivasi_belajar > 85) %>%
count(jenis_kelamin)
jumlah_mhs
## jenis_kelamin n
## 1 L 4
## 2 P 1
data_mahasiswa[order(-data_mahasiswa$ipk), c("jenis_kelamin","ipk", "motivasi_belajar")] |> head(50)
## jenis_kelamin ipk motivasi_belajar
## 18 L 3.89 92
## 41 L 3.73 90
## 48 L 3.70 92
## 22 P 3.69 72
## 37 L 3.67 68
## 51 L 3.65 92
## 24 P 3.61 81
## 34 P 3.56 87
## 23 L 3.54 83
## 16 L 3.46 90
## 2 P 3.45 73
## 4 P 3.43 98
## 54 L 3.41 100
## 30 P 3.40 87
## 45 P 3.33 96
## 26 L 3.32 89
## 14 L 3.31 81
## 52 L 3.30 88
## 38 L 3.29 90
## 43 P 3.29 91
## 53 L 3.29 80
## 31 P 3.22 71
## 49 P 3.22 73
## 55 P 3.21 71
## 40 L 3.17 80
## 44 P 3.15 63
## 28 P 3.14 53
## 35 L 3.13 91
## 47 L 3.13 82
## 1 L 3.12 82
## 13 P 3.11 59
## 33 P 3.11 46
## 6 L 3.10 61
## 19 L 3.09 84
## 8 L 3.08 69
## 3 P 3.07 71
## 17 L 3.06 52
## 42 P 3.05 73
## 50 P 3.05 57
## 7 P 2.98 44
## 21 L 2.96 47
## 36 P 2.95 66
## 27 L 2.94 59
## 10 L 2.93 46
## 15 L 2.90 44
## 29 L 2.89 48
## 5 L 2.83 81
## 9 P 2.82 44
## 20 L 2.73 73
## 12 P 2.71 35
#berdasarkan hasil run ini untuk no 10, L yang memiliki ipk > 3.5 dan motivasi > 85 yaitu ada 5 ((3.89,92),(3.73,90),(3.70,92),(3.65,92)), dan untuk P ada 1 yaitu (3.56, 87)