#1. Bagaimana cara menampilkan  6 baris pertama dari data_mahasiswa

data_mahasiswa <- read.csv("df_mahasiswa.csv")
head(data_mahasiswa)
##   X id_mahasiswa jenis_kelamin jam_belajar_per_hari frekuensi_login_lms
## 1 1       MHS001             L                    4                   1
## 2 2       MHS002             P                    4                   2
## 3 3       MHS003             P                    2                   6
## 4 4       MHS004             P                    5                   3
## 5 5       MHS005             L                    3                   2
## 6 6       MHS006             L                    3                   7
##   motivasi_belajar  ipk
## 1               82 3.12
## 2               73 3.45
## 3               71 3.07
## 4               98 3.43
## 5               81 2.83
## 6               61 3.10
#2. Bagaimana cara mengecek struktur dan tipe data_mahasiswa

str(data_mahasiswa)
## 'data.frame':    55 obs. of  7 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ id_mahasiswa        : chr  "MHS001" "MHS002" "MHS003" "MHS004" ...
##  $ jenis_kelamin       : chr  "L" "P" "P" "P" ...
##  $ jam_belajar_per_hari: int  4 4 2 5 3 3 1 3 2 1 ...
##  $ frekuensi_login_lms : int  1 2 6 3 2 7 7 4 6 5 ...
##  $ motivasi_belajar    : int  82 73 71 98 81 61 44 69 44 46 ...
##  $ ipk                 : num  3.12 3.45 3.07 3.43 2.83 3.1 2.98 3.08 2.82 2.93 ...
#3. Apakah terdapat missing value?

colSums(is.na(data_mahasiswa))
##                    X         id_mahasiswa        jenis_kelamin 
##                    0                    0                    0 
## jam_belajar_per_hari  frekuensi_login_lms     motivasi_belajar 
##                    0                    0                    0 
##                  ipk 
##                    0
summary(data_mahasiswa)
##        X        id_mahasiswa       jenis_kelamin      jam_belajar_per_hari
##  Min.   : 1.0   Length:55          Length:55          Min.   :1.000       
##  1st Qu.:14.5   Class :character   Class :character   1st Qu.:2.000       
##  Median :28.0   Mode  :character   Mode  :character   Median :3.000       
##  Mean   :28.0                                         Mean   :3.127       
##  3rd Qu.:41.5                                         3rd Qu.:4.000       
##  Max.   :55.0                                         Max.   :5.000       
##  frekuensi_login_lms motivasi_belajar      ipk       
##  Min.   :1.000       Min.   : 35.0    Min.   :2.490  
##  1st Qu.:2.000       1st Qu.: 56.5    1st Qu.:2.955  
##  Median :4.000       Median : 73.0    Median :3.130  
##  Mean   :4.018       Mean   : 71.0    Mean   :3.166  
##  3rd Qu.:6.000       3rd Qu.: 87.0    3rd Qu.:3.365  
##  Max.   :7.000       Max.   :100.0    Max.   :3.890
#4. Ada berapa laki-laki dan perempuan di kelas ini?

table(data_mahasiswa$jenis_kelamin)
## 
##  L  P 
## 32 23
#5. Jenis kelamin apakah yang memiliki rata-rata IPK tertinggi?

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
rata_rata_ipk_jenis_kelamin <- data_mahasiswa |>
  group_by(jenis_kelamin) |>
  summarise(
    Rata_Rata_IPK = mean(ipk, na.rm = TRUE)
  ) |>
  arrange(desc(Rata_Rata_IPK))

print(rata_rata_ipk_jenis_kelamin)
## # A tibble: 2 × 2
##   jenis_kelamin Rata_Rata_IPK
##   <chr>                 <dbl>
## 1 P                      3.18
## 2 L                      3.16
#6. Berapakah id_mahasiswa yang memiliki motivasi belajar tertinggi?

library(dplyr)

id_tertinggi <- data_mahasiswa |>
  arrange(desc(motivasi_belajar)) |>
  slice_head(n = 5) |>
  select(id_mahasiswa, motivasi_belajar)

print(id_tertinggi)
##   id_mahasiswa motivasi_belajar
## 1       MHS054              100
## 2       MHS004               98
## 3       MHS045               96
## 4       MHS018               92
## 5       MHS048               92
#7. Apakah mahasiswa dengan frekuensi login LMS tertinggi juga memiliki IPK tinggi? Asumsi IPK Tinggi > 3.5

library(dplyr)

analisis_login_ipk <- data_mahasiswa |>
  mutate(
    Kategori_IPK = case_when(
      ipk > 3.5 ~ "Tinggi (> 3.5)",
      TRUE      ~ "Rendah (<= 3.5)"
    )
  ) |>
  group_by(Kategori_IPK) |>
  summarise(
    Rata_Rata_Login = mean(frekuensi_login_lms, na.rm = TRUE)
  ) |>
  arrange(desc(Rata_Rata_Login))

print(analisis_login_ipk)
## # A tibble: 2 × 2
##   Kategori_IPK    Rata_Rata_Login
##   <chr>                     <dbl>
## 1 Tinggi (> 3.5)             5.44
## 2 Rendah (<= 3.5)            3.74
#8. Apakah mahasiswa dengan jam belajar ≥ 4 jam per hari memiliki IPK lebih tinggi dibandingkan yang kurang dari 4 jam?

library(dplyr)

analisis_jam_belajar_ipk <- data_mahasiswa |>
  mutate(
    Kategori_Belajar = case_when(
      jam_belajar_per_hari >= 4 ~ "Tinggi (>= 4 Jam)",
      TRUE                      ~ "Rendah (< 4 Jam)"
    )
  ) |>
  group_by(Kategori_Belajar) |>
  summarise(
    Rata_Rata_IPK = mean(ipk, na.rm = TRUE),
    Jumlah_Mahasiswa = n()
  ) |>
  arrange(desc(Rata_Rata_IPK))

print(analisis_jam_belajar_ipk)
## # A tibble: 2 × 3
##   Kategori_Belajar  Rata_Rata_IPK Jumlah_Mahasiswa
##   <chr>                     <dbl>            <int>
## 1 Tinggi (>= 4 Jam)          3.41               27
## 2 Rendah (< 4 Jam)           2.94               28
#9. Siapa mahasiswa dengan IPK tertinggi dan berapa nilai motivasinya? Jawablah dengan menyebutkan ID_Mahasiswanya

library(dplyr)

mahasiswa_ipk_tertinggi <- data_mahasiswa |>
  arrange(desc(ipk)) |>
  slice_head(n = 5) |>
  select(id_mahasiswa, ipk, motivasi_belajar)

print(mahasiswa_ipk_tertinggi)
##   id_mahasiswa  ipk motivasi_belajar
## 1       MHS018 3.89               92
## 2       MHS041 3.73               90
## 3       MHS048 3.70               92
## 4       MHS022 3.69               72
## 5       MHS037 3.67               68
#10. Hitung jumlah laki-laki dan perempuan yang memiliki ipk lebih dari 3,5 dan motivasi belajar lebih dari 85! Jawablah dengan menyebutkan L=? dan P=?

library(dplyr)

jumlah_mahasiswa_sukses <- data_mahasiswa |>
  filter(
    ipk > 3.5,
    motivasi_belajar > 85
  ) |>
  count(jenis_kelamin)

print(jumlah_mahasiswa_sukses)
##   jenis_kelamin n
## 1             L 4
## 2             P 1