#no 1 cara menampilkan 6 baris pertama dari data mahasiswa

data_mahasiswa <- read.csv("df_mahasiswa.csv")

head(data_mahasiswa)
##   X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1       MHS001             L                    4                   1
## 2 2       MHS002             P                    4                   2
## 3 3       MHS003             P                    2                   6
## 4 4       MHS004             P                    5                   3
## 5 5       MHS005             L                    3                   2
## 6 6       MHS006             L                    3                   7
##   motivasi_belajar  ipk
## 1               82 3.12
## 2               73 3.45
## 3               71 3.07
## 4               98 3.43
## 5               81 2.83
## 6               61 3.10
# 2. Bagaimana cara mengecek struktur dan tipe data_mahasiswa

str(data_mahasiswa)
## 'data.frame':    55 obs. of  7 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ id_mahasiswa        : chr  "MHS001" "MHS002" "MHS003" "MHS004" ...
##  $ jenis_kelamin       : chr  "L" "P" "P" "P" ...
##  $ jam_belajar_per_hari: int  4 4 2 5 3 3 1 3 2 1 ...
##  $ frekuensi_login_lms : int  1 2 6 3 2 7 7 4 6 5 ...
##  $ motivasi_belajar    : int  82 73 71 98 81 61 44 69 44 46 ...
##  $ ipk                 : num  3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
# 3. Apakah terdapat missing value?

colSums(is.na(data_mahasiswa))
##                    X         id_mahasiswa        jenis_kelamin 
##                    0                    0                    0 
## jam_belajar_per_hari  frekuensi_login_lms     motivasi_belajar 
##                    0                    0                    0 
##                  ipk 
##                    0
#pada data mahasiswa ini bersih/ tidak ada missing value (NA), jadi hasil semuanya 0 
# 4. Ada berapa laki-laki dan perempuan di kelas ini?

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
dfmahasiswa <- data_mahasiswa %>%
  count(jenis_kelamin)

dfmahasiswa
##   jenis_kelamin  n
## 1             L 32
## 2             P 23
# 5. Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi ?

aggregate(ipk ~ jenis_kelamin , data = data_mahasiswa, mean)
##   jenis_kelamin      ipk
## 1             L 3.158125
## 2             P 3.176957
# 6. Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?

data_mahasiswa[order(-data_mahasiswa$motivasi_belajar), c("id_mahasiswa", "motivasi_belajar")] |> head(5)
##    id_mahasiswa motivasi_belajar
## 54       MHS054              100
## 4        MHS004               98
## 45       MHS045               96
## 18       MHS018               92
## 48       MHS048               92
# 7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5

data_mahasiswa[order(-data_mahasiswa$frekuensi_login_lms), c("id_mahasiswa", "frekuensi_login_lms", "ipk")] |> head(100)
##    id_mahasiswa frekuensi_login_lms  ipk
## 6        MHS006                   7 3.10
## 7        MHS007                   7 2.98
## 17       MHS017                   7 3.06
## 18       MHS018                   7 3.89
## 22       MHS022                   7 3.69
## 31       MHS031                   7 3.22
## 33       MHS033                   7 3.11
## 41       MHS041                   7 3.73
## 44       MHS044                   7 3.15
## 55       MHS055                   7 3.21
## 3        MHS003                   6 3.07
## 9        MHS009                   6 2.82
## 13       MHS013                   6 3.11
## 21       MHS021                   6 2.96
## 26       MHS026                   6 3.32
## 28       MHS028                   6 3.14
## 37       MHS037                   6 3.67
## 42       MHS042                   6 3.05
## 51       MHS051                   6 3.65
## 10       MHS010                   5 2.93
## 43       MHS043                   5 3.29
## 47       MHS047                   5 3.13
## 49       MHS049                   5 3.22
## 8        MHS008                   4 3.08
## 23       MHS023                   4 3.54
## 24       MHS024                   4 3.61
## 34       MHS034                   4 3.56
## 48       MHS048                   4 3.70
## 50       MHS050                   4 3.05
## 52       MHS052                   4 3.30
## 53       MHS053                   4 3.29
## 54       MHS054                   4 3.41
## 4        MHS004                   3 3.43
## 27       MHS027                   3 2.94
## 30       MHS030                   3 3.40
## 46       MHS046                   3 2.49
## 2        MHS002                   2 3.45
## 5        MHS005                   2 2.83
## 12       MHS012                   2 2.71
## 14       MHS014                   2 3.31
## 15       MHS015                   2 2.90
## 19       MHS019                   2 3.09
## 29       MHS029                   2 2.89
## 32       MHS032                   2 2.66
## 40       MHS040                   2 3.17
## 45       MHS045                   2 3.33
## 1        MHS001                   1 3.12
## 11       MHS011                   1 2.64
## 16       MHS016                   1 3.46
## 20       MHS020                   1 2.73
## 25       MHS025                   1 2.65
## 35       MHS035                   1 3.13
## 36       MHS036                   1 2.95
## 38       MHS038                   1 3.29
## 39       MHS039                   1 2.52
#berdasarkan hasil run dengan frekuensi login lms tertinggi data paling atas menunjukan ipk 3.10 yang berarti kurang dari 3.5
#Lanjutan 7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5
aggregate(ipk ~ frekuensi_login_lms , data = data_mahasiswa, mean)
##   frekuensi_login_lms      ipk
## 1                   1 2.943333
## 2                   2 3.034000
## 3                   3 3.065000
## 4                   4 3.393333
## 5                   5 3.142500
## 6                   6 3.198889
## 7                   7 3.314000
#berdasarkan rata rata yang frekuensi login lms yg tertinggi (7 jam) memiliki rata rata ipk sekitar 3.31 yang berarti kurang dari 3.5
#8. Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?

aggregate(ipk ~ jam_belajar_per_hari , data = data_mahasiswa, mean)
##   jam_belajar_per_hari      ipk
## 1                    1 2.790000
## 2                    2 3.060000
## 3                    3 2.947143
## 4                    4 3.333125
## 5                    5 3.510000
#berdasarkan hasil run, mahasiswa yang memiliki jam belajar >= 4 memiliki rata rata ipk 3,33 dan 3,51 yang dimana lebih besar dibandingkan dengan yang memiliki jam belajar dibawahnya. Dengan demikian pernyataan tersebut benar
#9. Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya

data_mahasiswa[order(-data_mahasiswa$ipk), c("id_mahasiswa","ipk", "motivasi_belajar")] |> head(5)
##    id_mahasiswa  ipk motivasi_belajar
## 18       MHS018 3.89               92
## 41       MHS041 3.73               90
## 48       MHS048 3.70               92
## 22       MHS022 3.69               72
## 37       MHS037 3.67               68
#Berdasarkan hasil run, Mahasiswa dengan ID MHS018 memiliki IPK tertinggi yaitu 3.89 dan memiliki nilai motivasi    92
#10. Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?

jumlah_mhs <- data_mahasiswa %>%
  filter(ipk > 3.5 ,motivasi_belajar > 85) %>%
  count(jenis_kelamin)
jumlah_mhs
##   jenis_kelamin n
## 1             L 4
## 2             P 1
data_mahasiswa[order(-data_mahasiswa$ipk), c("jenis_kelamin","ipk", "motivasi_belajar")] |> head(50)
##    jenis_kelamin  ipk motivasi_belajar
## 18             L 3.89               92
## 41             L 3.73               90
## 48             L 3.70               92
## 22             P 3.69               72
## 37             L 3.67               68
## 51             L 3.65               92
## 24             P 3.61               81
## 34             P 3.56               87
## 23             L 3.54               83
## 16             L 3.46               90
## 2              P 3.45               73
## 4              P 3.43               98
## 54             L 3.41              100
## 30             P 3.40               87
## 45             P 3.33               96
## 26             L 3.32               89
## 14             L 3.31               81
## 52             L 3.30               88
## 38             L 3.29               90
## 43             P 3.29               91
## 53             L 3.29               80
## 31             P 3.22               71
## 49             P 3.22               73
## 55             P 3.21               71
## 40             L 3.17               80
## 44             P 3.15               63
## 28             P 3.14               53
## 35             L 3.13               91
## 47             L 3.13               82
## 1              L 3.12               82
## 13             P 3.11               59
## 33             P 3.11               46
## 6              L 3.10               61
## 19             L 3.09               84
## 8              L 3.08               69
## 3              P 3.07               71
## 17             L 3.06               52
## 42             P 3.05               73
## 50             P 3.05               57
## 7              P 2.98               44
## 21             L 2.96               47
## 36             P 2.95               66
## 27             L 2.94               59
## 10             L 2.93               46
## 15             L 2.90               44
## 29             L 2.89               48
## 5              L 2.83               81
## 9              P 2.82               44
## 20             L 2.73               73
## 12             P 2.71               35
#berdasarkan hasil run ini untuk no 10, L yang memiliki ipk > 3.5 dan motivasi > 85 yaitu ada 5 ((3.89,92),(3.73,90),(3.70,92),(3.65,92)), dan untuk P ada 1 yaitu (3.56, 87)