Visualisasi Data Kontinu (Bivariate)
Visualisasi data bivariat adalah teknik penyajian data yang digunakan untuk melihat hubungan antara dua variabel dalam satu waktu. Berbeda dengan visualisasi univariat yang hanya berfokus pada satu variabel, visualisasi bivariat membantu analis memahami apakah terdapat keterkaitan, pola hubungan, perbedaan kelompok, atau kecenderungan tertentu antarvariabel. Tujuan utama visualisasi bivariat antara lain: - Mengidentifikasi ada atau tidaknya hubungan antarvariabel - Melihat arah hubungan (positif, negatif, atau tidak ada hubungan) - Membandingkan distribusi data antar kelompok - Menemukan pola, tren, atau anomali dalam data Jenis visualisasi yang digunakan bergantung pada karakteristik data, antara lain:
Numerik vs Numerik → Scatter plot, line plot, bubble plot
Kategorik vs Numerik → Boxplot, violin plot, barplot
Kategorik vs Kategorik → Countplot, stacked bar
Dengan demikian, visualisasi bivariat merupakan langkah penting dalam eksplorasi data sebelum analisis statistik lanjutan.
Studi Kasus (Data Pendidikan)
Sebagai contoh, dalam penelitian pendidikan seorang analis ingin mengetahui faktor yang memengaruhi prestasi belajar mahasiswa. Dataset berisi variabel:
exam_score → nilai ujian mahasiswa (numerik)
study_hours → lama belajar per hari (numerik)
motivation → tingkat motivasi belajar (Low, Medium, High)
Pada tahap ini analis mulai bertanya:
Apakah mahasiswa yang belajar lebih lama memiliki nilai yang lebih tinggi?
Apakah mahasiswa dengan motivasi tinggi memiliki prestasi yang lebih baik?
Untuk menjawab pertanyaan tersebut dilakukan visualisasi bivariat.
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Scatter plot dipilih karena merupakan visualisasi numerik vs numerik yang mampu menunjukkan arah hubungan antarvariabel secara langsung. Melalui penyebaran titik, audiens dapat melihat kecenderungan bahwa peningkatan jam belajar diikuti oleh peningkatan nilai ujian, sehingga visual ini efektif dalam menjelaskan keterkaitan antarvariabel.
Kesimpulan
Visualisasi bivariat menunjukkan bahwa prestasi akademik mahasiswa memiliki keterkaitan dengan jam belajar dan motivasi. Scatter plot memperlihatkan hubungan positif antara jam belajar dan nilai ujian, sedangkan boxplot dan barplot menunjukkan bahwa mahasiswa dengan motivasi lebih tinggi cenderung memperoleh nilai yang lebih baik. Dengan demikian, visualisasi bivariat memberikan pemahaman intuitif mengenai faktor-faktor yang berasosiasi dengan prestasi belajar dan dapat menjadi dasar analisis lanjutan.
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.