Data

About

Kali ini, kita akan melakukan proses visualisasi dari 3 data tabular berbeda. Visualisasi data akan menggunakan 2 library yaitu highcharts dan ggplot2. Mengapa ada 3 data yang digunakan? Karena masing-masing menyimpan informasi yang berbeda tentang sekolah di Amerika Serikat sehingga kita bisa memperoleh insight yang beragam, misalnya berupa rekomendasi. Dalam kasus ini kita akan melihat total biaya dan tingkat kepercayaan diri dari alumnus suatu universitas (school/collage/university) di beberapa kota/negara bagian Amerika Serikat.

Input

Preparation

Library

Any NA

## [1] TRUE
## [1] TRUE
## [1] FALSE


Nilai NA pada data tuition_cost terdapat pada kolom room_and_board yang menjelaskan keberadaan/ketersediaan tempat tinggal dari suatu universitas. Nantinya nilai NA itu akan diganti saat proses wrangling dan visualisasi dengan variabel karakter: “Unavailable”.

Wrangling & Visualization

Public VS Private

Data tabular historical_tuition merekam biaya perkuliahan yang terbagi menjadi 2 jenis, yaitu private dan public dari tahun 1985. Namun karena data tiap tahunnya tidak terisi lengkap, maka data yang akan digunakan hanya dari tahun 2000 hingga 2016. Visualisasi data ini bertujuan untuk membandingkan rata-rata kenaikan dan perbedaan harga dari 2 jenis kelas di universitas Amerika Serikat dalam kurun waktu tertentu.

Average Cost

Dengan menggunakan data tuition_cost, kita akan menampilkan 10 kota/negara bagian mana saja yang rata-rata biaya kuliahnya paling tinggi. Informasi yang ditampilkan terbagi menjadi 2 kelompok, yaitu instate berlaku untuk pelajar dari dalam kota/negara bagian tersebut dan outstate, biaya untuk pelajar dari kota/luar negara bagian.

School Recommendation

Mengacu pada visualisasi di atas, diperoleh informasi bahwa New York adalah kota dengan biaya sekolah termahal. Selanjutnya, kita akan menampilkan rekomendasi universitas di suatu kota dengan rata-rata biaya yang paling terjangkau, tanpa tempat tinggal dari universitas, tipe sekolah public, dan proses kuliah 4 tahun. Dalam kasus ini, kita memilih negara bagian Texas yang akan ditampilkan rekomendasi universitas/sekolah. Pada tahap berikut, kita juga memberi perlakuan terhadap nilai NA, yakni menggantinya dengan karakter “Unavailable”.

## Alumnus-Confidence Kita akan melihat tingkat kepercayaan diri dari para alumnus universitas di Texas. Kepercayaan diri alumnus diukur dari nilai variabel make_world_better_percent yang menjelaskan keyakinan mereka untuk bisa membuat dunia lebih baik. Lalu variabel tersebut juga akan disandingkan dengan pendapatan yang akan diperoleh di awal karir/setelah lulus kuliah.

Conclusion

Visualisasi data membantu kita memahami data tabular secara menyeluruh. Dalam kasus sekolah/universitas di Amerika Serikat , kita bisa tahu ada beberapa kota yang termasuk mahal untuk dijadikan destinasi studi. Di sisi lain, ini juga bisa menjadi ancang-ancang bagi para pelajar yang ingin meneruskan studi di Negeri Paman Sam untuk bisa menyiapkan dana seberapa banyak agar bisa belajar dengan baik. Terlebih lagi, kita bisa mengetahui seberapa menjanjikan suatu almamater universitas dalam meningkatkan kepercayaan diri alumnus dan peluang gaji setelah lulus masa studi.Tingkat kepercayaan diri alumnus dan nilai gaji yang diperoleh di awal karir cenderung berada pada range nilai yang berdekatan, artinya kedua variabel ini bisa disebut linear/berjalan beriringan.

Namun perlu dipahami bahwa visualisasi ini tidak bersifat rigid. Semuanya dapat disesuaikan dengan kebutuhan, target, dan kelengkapan variabel dari data yang digunakan. Tujuan penting dari visualisasi data adalah untuk menyajikan informasi dengan lebih menarik dan terstruktur, juga memberi rekomendasi tertentu kepada target audience.