Visualisasi Data Kontinu (Bivariate)

Visualisasi data bivariat adalah teknik penyajian data yang digunakan untuk melihat hubungan antara dua variabel dalam satu waktu. Berbeda dengan visualisasi univariat yang hanya berfokus pada satu variabel, visualisasi bivariat membantu analis memahami apakah terdapat keterkaitan, pola hubungan, perbedaan kelompok, atau kecenderungan tertentu antarvariabel. Tujuan utama visualisasi bivariat antara lain: - Mengidentifikasi ada atau tidaknya hubungan antarvariabel - Melihat arah hubungan (positif, negatif, atau tidak ada hubungan) - Membandingkan distribusi data antar kelompok - Menemukan pola, tren, atau anomali dalam data Jenis visualisasi yang digunakan bergantung pada karakteristik data, antara lain:

Numerik vs Numerik → Scatter plot, line plot, bubble plot

Kategorik vs Numerik → Boxplot, violin plot, barplot

Kategorik vs Kategorik → Countplot, stacked bar

Dengan demikian, visualisasi bivariat merupakan langkah penting dalam eksplorasi data sebelum analisis statistik lanjutan.

Studi Kasus (Data Pendidikan)

Sebagai contoh, dalam penelitian pendidikan seorang analis ingin mengetahui faktor yang memengaruhi prestasi belajar mahasiswa. Dataset berisi variabel:

exam_score → nilai ujian mahasiswa (numerik)

study_hours → lama belajar per hari (numerik)

motivation → tingkat motivasi belajar (Low, Medium, High)

Pada tahap ini analis mulai bertanya:

Apakah mahasiswa yang belajar lebih lama memiliki nilai yang lebih tinggi?

Apakah mahasiswa dengan motivasi tinggi memiliki prestasi yang lebih baik?

Untuk menjawab pertanyaan tersebut dilakukan visualisasi bivariat.

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

  1. Scatter Plot (Jam Belajar vs Nilai)

Scatter plot dipilih karena merupakan visualisasi numerik vs numerik yang mampu menunjukkan arah hubungan antarvariabel secara langsung. Melalui penyebaran titik, audiens dapat melihat kecenderungan bahwa peningkatan jam belajar diikuti oleh peningkatan nilai ujian, sehingga visual ini efektif dalam menjelaskan keterkaitan antarvariabel.

  1. Bloxpot bloxpot ini merupakan visualisasi yang umum orang lihat ya , karena bloxpot dapat Menampilkan median & sebaran secara ringkas, membuat peneliti atau reviewers mudah membandingkan antar kategorinya. Boxplot dipilih karena merupakan visualisasi kategorik vs numerik yang mampu menampilkan ringkasan distribusi data dalam setiap kategori. Dengan melihat posisi median dan rentang sebaran data pada setiap kotak, audiens dapat langsung membandingkan kategori mana yang memiliki nilai tipikal lebih tinggi atau variasi yang lebih besar. Visualisasi ini membantu menjelaskan perbedaan karakteristik data antar kelompok secara ringkas dan mudah dipahami tanpa harus membaca nilai statistik secara detail.
  2. Barplot (Rata-rata Nilai per Motivasi) Barplot mean Lebih mudah dipahami karena kita dapat langsung merankingkan kategori berdasarkan tinggi rendahnya barplot Barplot dipilih karena termasuk visualisasi kategorik vs numerik berbasis agregasi yang paling intuitif dan mudah dipahami oleh audiens. Tinggi batang secara langsung merepresentasikan nilai rata-rata pada setiap kategori, sehingga audiens dapat dengan cepat melihat kategori dengan performa tertinggi maupun terendah. Kesederhanaan visual ini menjadikan barplot sangat efektif untuk menyampaikan gambaran umum dan perbandingan antar kategori secara jelas.

Kesimpulan

Visualisasi bivariat menunjukkan bahwa prestasi akademik mahasiswa memiliki keterkaitan dengan jam belajar dan motivasi. Scatter plot memperlihatkan hubungan positif antara jam belajar dan nilai ujian, sedangkan boxplot dan barplot menunjukkan bahwa mahasiswa dengan motivasi lebih tinggi cenderung memperoleh nilai yang lebih baik. Dengan demikian, visualisasi bivariat memberikan pemahaman intuitif mengenai faktor-faktor yang berasosiasi dengan prestasi belajar dan dapat menjadi dasar analisis lanjutan.

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.