Tugas 2 - Majors

Due: 28 Maret 2025, 16:00 WITA

Dalam tugas ini, kita akan bekerja dengan dataset tentang pendapatan dari berbagai jurusan kuliah. Tugas ini mengasumsikan bahwa Anda sudah menyelesaikan materi hingga minggu ke-5.

Packages

R adalah bahasa pemrograman open-source yang mendukung banyak package tambahan. Dalam tugas ini, kita akan menggunakan beberapa package berikut:

Untuk menggunakan packages ini, kita menggunakan fungsi library(). Dalam dokumen R Markdown, terdapat bagian load-packages yang sudah berisi kode untuk memuat packages ini. Anda juga perlu memuat package di Console dengan menekan ikon Run Current Chunk (panah hijau ke kanan).

College majors

Dalam tugas ini, kita akan menganalisis data tentang jurusan kuliah dan pendapatan lulusan, khususnya dari artikel FiveThirtyEight berjudul “The Economic Guide to Picking a College Major” The Economic Guide To Picking A College Major. Data ini berasal dari American Community Survey (ACS) 2010-2012. Jika Anda tertarik dengan cara FiveThirtyEight mengolah data mentah ACS, Anda dapat melihat the code yang mereka gunakan.

Perlu diingat bahwa ada banyak faktor dalam memilih jurusan kuliah. Potensi pendapatan dan peluang kerja memang penting, tetapi bukan satu-satunya pertimbangan. Jadi, saat menganalisis data, jangan hanya fokus pada aspek ekonomi.

Dataset utama yang digunakan dalam tugas ini adalah college_recent_grads, yang terdapat dalam paket fivethirtyeight. Untuk melihat dokumentasi dataset ini, ketik perintah berikut ?college_recent_grads di Console atau menggunakan menu Help di Rstudio untuk mencari tentang college_recent_grads. Anda juga dapat menemukan informasi mengenai dataset ini pada laman berikut here.

  1. Ada tiga jenis pendapatan yang dilaporkan dalam data frame ini: p25th, median, dan p75th. Ketiganya masing-masing merujuk pada persentil ke-25, ke-50, dan ke-75 dari distribusi pendapatan individu yang diambil sampelnya untuk suatu jurusan tertentu. Mengapa kita sering memilih median daripada mean untuk menggambarkan pendapatan tipikal suatu kelompok?

✏️🧶 ✅ ⬆️ Write your answer in your R Markdown document under the appropriate exercise.

Hint: The label_dollar() function can be helpful for the x-axis.

  1. Buat ulang visualisasi berikut. Catatan: Lebar bin yang digunakan adalah $5.000. Perhatikan dengan cermat teks dan label pada sumbu.

Hint: Wondering how to restrict to full-time, year-round workers? Have a look at the data dictionary by typing ?college_recent_grads into the console. It’s probably easier than you think!

✏️🧶 ✅ ⬆️ Write your answer in your R Markdown document under the appropriate exercise.

  1. Buat ulang visualisasi dari latihan sebelumnya, kali ini dengan lebar bin sebesar $1.000. Mana yang lebih baik antara $1.000 atau $5.000 sebagai pilihan lebar bin? Jelaskan alasan Anda dalam satu kalimat.

Tip: If you don’t feel line writing out the names of the majors by hand, you can use inline code with the glue_collapse() function from the glue package after you pull() the names of the majors out and save them as a vector. So, pull() the names of the majors, save them as a vector, then use inline code where you glue_collapse() the vector, separated by commas. This would be a nice exercise in constructing sentences programmatically!

  1. Jurusan STEM mana (yaitu, jurusan dalam kategori "Biology & Life Science", "Computers & Mathematics", "Engineering", dan "Physical Sciences") yang memiliki gaji median yang sama dengan atau lebih rendah dari median untuk seluruh jurusan (semua jurusan, bukan hanya yang termasuk dalam kategori STEM)? Output Anda hanya boleh menampilkan nama jurusan serta pendapatan median, persentil ke-25, dan persentil ke-75 untuk jurusan tersebut, dan harus diurutkan sehingga jurusan dengan pendapatan median tertinggi berada di bagian atas.

✏️🧶 ✅ ⬆️ Write your answer in your R Markdown document under the appropriate exercise.

  1. Buatlah sebuah pertanyaan yang menarik bagi Anda yang dapat dijawab menggunakan setidaknya tiga variabel dari dataset, lalu jawab pertanyaan tersebut menggunakan statistik ringkasan dan/atau visualisasi.

✏️🧶 ✅ ⬆️ Write your answer in your R Markdown document under the appropriate exercise, knit the document.