email : ?_?
ntraktir : https://trakteer.id/contekansial
nyawer :
https://saweria.co/contekansial
github :
https://bit.ly/origin-AL-GitHub
youtube :
https://bit.ly/origin-AL-youtube
Seorang analis data seringkali menghabiskan waktunya untuk berkutat dengan data, menganalisisnya hingga benar-benar menghasilkan kesimpulan yang tepat. Pendek kata, yang diurusi melulu soal angka. Namun, ada satu hal yang seringkali dilewatkan, yakni ketika harus menyajikannya kepada orang lain yang belum tentu paham dengan data tersebut. Hal yang paling umum terjadi adalah data disajikan apa adanya. Misalnya, dalam bentuk grafik dengan desain template dari aplikasi seperti Microsoft Excel. Karena menggunakan template, tampilan data itu menjadi monoton, bikin bosan, kadang tidak pas dengan kesimpulan dan pesan yang ingin disampaikan.
Permasalahan lain pun muncul, yakni ketika orang yang melihatnya salah mengartikan data. Ini dapat terjadi karena misalnya, data dipresentasikan tanpa narasi yang jelas. Atau, bisa jadi tata letak dan elemen grafisnya tidak tepat sehingga audiens tersesat dari maksud dan tujuan sang analis. Maka dari itu, penting bagi seorang analis data untuk memvisualisasikan hasil kerjanya dengan baik. Analis data perlu mengetahui cara menggambarkan data agar audiens memahami konteks dari data yang disajikan.
Pembelajaran ini akan membahas beragam cara memvisualisasikan data, terutama cara memilih grafik yang tepat serta memodifikasinya agar fokus pada pesan yang ingin disampaikan. Setelah menuntaskan pembelajaran ini, diharapkan tidak lagi menggunakan jenis grafik yang itu-itu saja dengan desain yang itu lagi dan itu lagi. Pembelajaran ini juga akan menuntun untuk memahami elemen-elemen pada grafik sehingga dapat mengubah elemen-elemen tersebut sesuai kebutuhan. Pada pembelajaran ini akan mempelajari bagian mana yang perlu dan tidak perlu ditampilkan dalam visualisasi data. Pembelajaran ini tidak akan mengajarkan menjadi seorang analis data dengan kemampuan desain grafis sekaligus. Namun, setidaknya lebih mudah untuk dapat memahami bagaimana sebuah desain visual dapat membantu audiens memahami data yang disajikan.
Visualisasi data dapat didefinisikan sebagai cara merepresentasikan data melalui komponen visual, seperti posisi, komposisi, panjang, luas, dan warna. Visualisasi data juga mencakup cara berkomunikasi secara efektif kepada audiens melalui bahasa gambar. Coba perhatikan Gambar 1. Gambar tersebut dibuat oleh engineer asal Prancis, Charles Joseph Minard, yang terlibat dalam invasi militer Napoleon ke Rusia pada 1812-1813.
Garis coklat dan hitam memperlihatkan kekuatan pasukan dari Prancis menuju dan kembali dari Moskow. Lebar garis menggambarkan banyaknya serdadu. Lebarnya mengecil karena jumlahnya terus menyusut. Gambar yang dibuat tahun 1869 tersebut juga memperlihatkan peta, rute dan arah perjalanan, jarak tempuh, hingga grafik temperatur pada medan yang dilalui.
Siapapun yang melihatnya, dan paham bahasanya, akan dengan mudah mengetahui data dan cerita yang disampaikan dalam gambar tersebut. Invasi itu berakhir dengan hilangnya sebagian besar kekuatan Napoleon. Awalnya lebih dari 400.000-an prajurit, yang kembali hanya 10.000-an. Sisanya menjadi korban akibat penyakit, suhu dingin, kelaparan, atau serangan lawan. Tragis!
Dari contoh sebelumnya, jelaslah bahwa penyajian data dengan visualisasi yang tepat bisa dengan cepat mendapat perhatian audiens dan membuatnya paham tentang apa yang disampaikan. Itulah tujuan utama visualisasi data. Bukan sekadar membuat tampilan data yang enak dilihat, tetapi juga harus bisa membuat data lebih mudah dipahami, jelas, dan menarik. Yang tidak kalah penting, harus dapat meyakinkan audiens sesuai kesimpulan dan narasi yang dibangun analis. Pembahasan tentang visualisasi data ini dimaksudkan dengan tujuan sebagai berikut:
Sebelum menentukan visual yang cocok atas suatu data, seorang analis data harus memahami siapa atau audiens yang akan membaca data tersebut. Dengan mengetahui karakter audiens, seorang data analis akan bisa memperkirakan kepadatan data dan informasi yang akan disajikan. Hal itu akan memengaruhi pilihan visualisasi data, yakni visual yang mengeksplorasi data sedetail mungkin atau grafis yang menarasikan informasi dengan ringkas dan jelas. Apa bedanya?
Visual naratif seringkali digunakan untuk presentasi, biasanya statis, dan berisi ringkasan informasi. Tujuan utamanya adalah menjelaskan hasil akhir atau kesimpulan dari analis. Hasil tersebut bisa jadi disebarluaskan untuk banyak orang dengan berbagai tingkat pemahaman terhadap data. Audiens tidak perlu lama-lama membacanya dan semestinya bisa segera memahaminya. Oleh karena itu, penyajiannya cenderung menonjolkan keindahan visual. Maka tidak heran bila informasi tidak disampaikan secara detail, misalnya grafik tanpa legenda, label data, ataupun detail lain. Contoh visual naratif dapat dilihat pada Gambar 1.
Sebaliknya, visual eksploratif bertujuan memaparkan proses yang dilakukan untuk mendapatkan hasil akhir yang tepat. Penyajiannya dibuat serinci dan seakurat mungkin untuk meyakinkan bahwa prosesnya benar. Visual eksploratif cenderung menampilkan banyak data. Audiensnya pun tidak sembarang orang karena butuh waktu lebih lama untuk mencerna kompleksitas data tersebut. Visual ini lebih ditujukan untuk orang-orang yang memang memahami data atau bisa menginvestigasi data tersebut. Contoh visual eksploratif dapat dilihat pada Gambar 2.
Baik visual naratif maupun eksploratif ini memiliki tantangan tersendiri dalam pengerjaannya. Untuk grafis naratif, sudah jelas bahwa kekuatan penyajiannya terletak pada cerita dan pesan dari narasi yang disampaikan. Cerita dan pesan itu akan mudah dipahami apabila didukung dengan paparan yang tidak bertele-tele dan kemasan visual menuntun audiens pada tujuan yang sama. Wujudnya bisa berupa infografik, annual report, materi promosi, hingga company profile. Adapun visual eksploratif haruslah menonjolkan kekuatan analisis, hubungan sebab-akibat perubahan data, dan proses lain. Detail data ditampilkan untuk mendukung kesahihan analisis.
AL baru selesai membaca pengantar awal isi modul mengenai visualisasi data. Lalu menemukan hasil survei yang menarik untuk dijadikan bahan praktik awal. AL pun mencoba menyampaikan keinginan pada Lee.(lihat Gambar 1).
“Lee, ini aku mau coba praktik pakai data antusiasme orangtua dan murid terhadap kegiatan sekolah,” ujar AL setelah membaca modul visualisasi data dari Lee.
“Boleh. Itu praktiknya ada di berkas studi kasus ya, bisa kamu cek.”
“Iya, ini ditulis kalau sekolah A berharap bahwa murid-murid menunjukkan antusiasme lebih besar dibanding orangtua untuk semua kegiatan yang diadakan di sekolah. Dari grafik ini, awalnya pihak sekolah tidak menyadari bahwa ternyata respon murid terhadap kegiatan religi tidak setinggi harapan orangtua. Itu karena grafik yang dimiliki sekolah tidak memperlihatkan perbedaan yang jelas satu sama lain.”
“Oke, sudah ada kasusnya. Sudah paham harus diolah seperti apa visualisasinya, AL?”
AL terdiam untuk berpikir sebentar.
“Aku akan mengubah desain grafiknya. Aku akan membuat slope graph (lihat Gambar 2) untuk memperlihatkan pertanyaan/kategori apa yang memperlihatkan respon murid lebih rendah ketimbang orangtua untuk menunjukkan secara jelas perbedaannya,” jawab AL.
“Kenapa memilih grafik itu, AL? Bisa jelaskan alasannya?”
“Aku menggunakan slope graph agar keterangan kegiatan dapat diletakkan di samping (Kiri) dari angka-angka tersebut. Jika aku paksa menggunakan column chart, aku bisa menyusun urutan angkanya secara vertikal. Tetapi, di sekolah juga akan mengalami kesulitan yang sama seperti grafik sebelumnya. Grafik batang maupun kolom seharusnya menempatkan angka nol pada garis dasar, baik vertikal maupun horizontal. Ini bisa menjadi masalah karena perbedaan persentase respon pada antarkegiatan tidak terlalu besar, hanya sekian persen. Sekolah pun akan sulit melihat bedanya secara sekilas. Dengan slope graph, aku dapat menghilangkan garis zero based dan fokus pada kisaran angka persentase dalam data,” jelas AL panjang lebar.
Lee tersenyum dan mempersilakan AL untuk mulai mengerjakan studi kasus dengan hasil seperti ini:
“Gimana menurutmu hasilnya, Lee?” ujar AL sambil menunjukkan hasil visualisasi.
“Hmmm, menurut saya, kamu bisa menampilkan angka persentase dari murid dan orangtua dari item kegiatan religi saja. Yang lain bisa kamu jelaskan tanpa harus menampilkan grafiknya. Contohnya seperti ini agar menjadi lebih simpel (lihat Gambar 3).”
AL membiarkan Lee mengambil alih hasil kerja sebentar. Setelah diubah sedikit oleh Lee, AL mendapati gambar jadi lebih simpel dan langsung memperlihatkan pesan yang ingin disampaikan.
“Sekarang kamu punya dua opsi grafik, AL, terutama dalam hal menampilkan seberapa detail data yang ingin ditonjolkan. Grafik yang terakhir menonjolkan peringatan tentang kegiatan yang perlu dibenahi, sementara grafik sebelumnya menitikberatkan pada seberapa antusias orangtua dan siswa terhadap seluruh kegiatan di sekolah. Jadi lebih beragam untuk disajikan semisal kita punya klien,” terang Lee.
Dari penjelasan Lee, hal yang perlu dicatat adalah beri opsi tampilan grafik, jangan hanya satu.
“Makasih sarannya, Lee!”
“Lee, aku mau tanya boleh?” ujar AL sembari mendekati Lee.
“Ya? Tanya saja,” sahut Lee sambil tetap fokus pada layar laptop.
“Sebelum menarasikan data, sebenarnya apa yang harus kita perhatikan ya?”
Lee menghentikan pekerjaannya untuk menjawab rasa penasaranku.
“Pertama, apa. Tanyakan pada dirimu, pesan/hal apa yang paling ingin kamu sampaikan kepada audiens. Misalnya, kamu ingin audiens tahu bahwa performa perusahaan terus menurun. Atau, kinerja perusahaan sedang bagus, tetapi sebetulnya masih perlu ada perbaikan di beberapa sektor. Jika pesan utama sudah diketahui, periksalah apakah data dan grafik yang kamu miliki sudah menunjukkan dengan jelas pesan tersebut,” jelas Lee.
AL diam mendengarkan sembari sibuk mencatat poin-poin pentingnya.
“Kedua, untuk apa orang lain perlu mengetahui hal yang kamu sampaikan tadi. Disinilah kamu tunjukkan hasil analisismu terhadap data yang kamu miliki. Hasil analisismu harus bisa membuktikan bahwa pesan yang kamu sampaikan tadi penting karena ada efek lanjutan yang tak kalah penting dari pesan tersebut. Dari contoh tadi, misalnya, kamu ingin audiens tahu bahwa performa perusahaan akan semakin anjlok jika tidak segera mengambil tindakan tepat. Atau, untuk contoh kedua, perusahaan sebetulnya bisa mendapatkan hasil lebih maksimal jika sektor-sektor tertentu segera mengevaluasi kinerjanya yang merosot,” tambah Lee.
Tak kusangka cukup banyak juga hal yang tak boleh kulewatkan saat mengolah dan menarasikan data.
“Terakhir, bagaimana caranya agar masalah yang kamu sampaikan tadi bisa teratasi. Di sini kamu bisa menyampaikan sejumlah alternatif solusi atau action plan yang diperlukan, tentunya berdasarkan analisis data yang menunjukkan bahwa rencana itulah yang paling baik untuk ditindaklanjuti. Jadi, sudah cukup jelas ya, AL?”
“Iya, Lee. Makasih ya! Ini jelas banget.”
“Satu lagi, AL. Itu baru langkah awal. Dengan cara itu, setidaknya kamu bisa lebih fokus pada pesan yang ingin kamu sampaikan kepada audiens. Kamu juga bisa lebih fokus menentukan data apa saja yang perlu disajikan. Ini penting karena pada langkah berikutnya, kamu bisa melanjutkan analisis data dan menyampaikan kesimpulan yang benar-benar berkaitan dengan masalah yang kamu paparkan.”
“Kelihatannya sih mudah, tapi sebenarnya penuh tantangan yah, Lee?”
“Begini saja. Kalau kamu kesulitan melakukannya, buatlah sketsa atau coretan-coretan seperlunya tentang tiga hal tadi. Saya bisa berikan contohnya (lihat Gambar 1).”
AL pun mempelajari gambar yang dibagikan Lee.
“AL, kalau sketsa tadi sudah selesai dibuat, jangan lupa menguji kembali apakah data dan grafik yang ditampilkan sudah sesuai dengan pertanyaan-pertanyaan tadi ya,” pinta Lee.
“Maksudnya, Lee?”
“Begini, kamu tentu tahu bahwa data bisa ditampilkan dalam berbagai jenis tampilan. Masing-masing jenis memiliki karakter visual dan fungsi berbeda-beda. Nah, periksalah sketsa grafik yang kamu buat pada langkah sebelumnya, apakah jenisnya cocok dengan pesan yang ingin kamu sampaikan.”
“Tapi, bukankah ada beberapa grafik saja yang lazim digunakan dan mudah dipahami orang awam? Setahuku hanya tabel, grafik batang/kolom, dan pie chart atau kombinasi dari itu semua,” sahut AL masih bingung.
“Betul, itu jenis-jenis visualisasi data yang biasa disajikan karena mudah dibuat dan mudah dipahami. Secara umum visualisasi data itu bisa diwujudkan dengan cara teks, grafik, tabel, dan peta. Dan apa yang kamu sebutkan tadi adalah bagian dari jenis-jenis visualisasi data di atas. Masih banyak jenis lainnya yang bisa kamu eksplorasi. Dari situ, kamu bisa merangkainya menjadi sebuah tata visual yang kompleks, misalnya infografik, dashboard, dan sebagainya.”
“Oh oke, aku mulai paham.”
“Sebenarnya enggak cuma itu saja, kamu juga harus belajar tentang memilih warna, mengatur ukuran huruf, serta tata letak ataupun bentuk-bentuk visual untuk membuat visualisasi data menjadi sempurna,” tambah Lee.
Lama akhirnya aku menyadari jika visualisasi data bukan hanya soal angka, tetapi juga memanjakan mata.
Membaca grafik bukanlah satu pekerjaan mudah bagi sebagian orang, terutama yang tidak terbiasa melihat data. Melihat dua garis saling bersinggungan, misalnya, bisa menimbulkan arti berbeda bagi orang yang tidak memahami data. Oleh karena itu, penting sekali memperkenalkan visualisasi data dengan sesederhana mungkin agar alur membaca dan mengambil kesimpulan atas elemen visual yang ditampilkan dengan lebih mudah. Ada berbagai macam cara menampilkan data, entah dalam bentuk grafik, angka, atau teks. Cara menampilkannya tergantung pada pesan yang ingin disampaikan kepada audiens. Berikut penjelasan singkat tentang sejumlah pilihan visualisasi data.
Merangkum jenis-jenis grafik dan penggunaannya, berikut ini panduan singkat penggunaan jenis grafik berdasarkan kebutuhannya.
Setelah berhasil memilih grafik yang benar sesuai tujuan penyajian data, tantangan berikutnya adalah bagaimana membuat grafik tersebut menjadi mudah dipahami oleh audiens. Di sini kata kuncinya adalah audiens, yang karakternya berbeda-beda. Karena itu, sangat penting bagi seorang pemapar data untuk memahami karakter audiens. Seseorang yang terbiasa melihat data, tentu saja akan lebih mudah mencerna grafik apa pun yang ada di hadapannya, bukan? Sebaliknya, orang yang tak biasa menyaksikan gambar-gambar disertai angka, apalagi disertai rumus atau perhitungan rumit, tentu membutuhkan waktu lebih lama menerjemahkan sajian grafis tentang data.
Karena karakter audiens yang beragam, maka cara mereka membaca data dan grafik pun tidak sama satu sama lain. Karena itu, dalam menyajikan data, seorang analisis sebisa mungkin mengarahkan pembaca. Mengarahkan di sini berarti harus dapat membawa alam pikir audiens seturut dengan logika analisis data hingga menyimpulkan hasilnya. Juga mengarahkan mata pembaca dalam menelusuri sajian visual atas analisis data dan kesimpulan tersebut.
Lihatlah dua ilustrasi grafik pada Gambar 1 dan Gambar 2. Pada Gambar 1, tidak ada petunjuk jelas tentang bagaimana cara membaca grafik tersebut. Karena tidak ada ketentuan khusus, orang yang melihatnya akan membacanya dengan cara berbeda-beda. Mungkin ada yang membacanya mulai dari judul grafik, tetapi ada pula yang langsung mengarahkan perhatian pada garis berwarna cerah di bagian tengah.
Gambar 2 memperlihatkan contoh pola membaca grafik tersebut. Belum tentu semua orang akan menggunakan alur baca yang sama seperti ilustrasi tersebut. Namun, setidaknya penggunaan warna, tebal-tipis garis, maupun besar-kecil ukuran huruf, menuntun audiens untuk menentukan bagian mana yang perlu dibaca lebih dulu.
Coba bayangkan bila semua garis pada grafik tersebut memiliki ketebalan dan warna yang sama. Demikian ukuran huruf pada judul, penjelasan grafik, legenda, hingga keterangan di masing-masing sumbu. Sudah dapat dipastikan, tidak ada bagian yang paling menonjol dalam grafik tersebut, bukan? Kalau begitu kondisinya, dapat dipastikan pula setiap orang yang membacanya akan punya cara sendiri-sendiri untuk mencerna grafik tersebut.
Sebagai mentorku Lee ingin aku bisa mengetahui hal-hal apa saja yang perlu diperbaiki dalam visualisasi data. Ia pun memintaku untuk mengumpulkan contoh-contoh data visual yang pernah dibuat perusahaan untuk dievaluasi dan diperbaiki di kemudian hari.
Aku pun mulai mengumpulkan sejumlah presentasi, materi promosi, hingga materi iklan yang pernah digarap oleh perusahaan untuk dievaluasi. Terkumpullah sejumlah materi grafik yang perlu dibenahi. Tapi, sebelumnya aku butuh bantuan Senja untuk memberi masukan atas materi-materi ini.
“Kalau saya lihat, ini materinya perlu dirombak total. Tampilannya ini bukan saja membingungkan, tapi juga berpotensi melahirkan asumsi-asumsi yang salah atas datanya.”
“Aku pikir juga begitu sih, Lee.”
“Contohnya ini ya, AL. Menurut saya, sangat sulit dipahami karena tidak mudah membedakan proporsi jawaban survei berdasarkan persentase jumlahnya. Bahkan, ada porsi gambar yang salah pada jawaban Baik (20%) dan Sangat Baik (22%), di mana potongan jawaban Baik justru tampak lebih besar dibanding Sangat Baik,” komentar Lee untuk salah satu contoh grafik kolom yang dibuat dengan tiga dimensi (lihat Gambar 1).
“Ini karena selisih persentase antarbagian tidak terlalu besar dan pie chart ditampilkan dalam rupa tiga dimensi dengan perspektif yang tidak pas. Kamu paham maksud saya, AL? Ini bisa jadi masukan untuk membenahi grafik-grafik lainnya juga,” sahut Lee.
“Oke, aku paham. Tapi, menurutku sebenarnya tidak masalah jika selisih keduanya kecil. Pesan yang ingin disampaikan adalah sebagian besar responden memiliki pemahaman cukup hingga sangat baik atas pernyataan yang diajukan, Lee,” AL memberanikan diri memberi penilaian.
Lee tampak mempertimbangkan opini AL. “Maksudmu responden yang menjawab Cukup, Baik, dan Sangat Baik adalah responden dengan kategori yang kamu sebutkan tadi? Jumlahnya memang dominan, 67 persen sih.”
“Betul, ketiga kategori itulah yang ingin ditonjolkan. Itu menurut pandanganku ya.”
Setelah lama menimbang-nimbang, tampaknya Lee cukup setuju dengan analisis AL.
“Baiklah, jika seperti itu, pesannya menjadi lebih jelas. Kamu masih bisa menggunakan pie chart atau diagram donat dengan pewarnaan sesuai kategori tadi. Jangan lupa berikan kesimpulan data pada grafik tersebut untuk memudahkan orang membacanya. Kamu bisa lihat contohnya di Gambar 2, seperti ini.”
“AL, satu lagi, saya punya tips lain tentang bagaimana memilih warna, bentuk, dan elemen visual untuk presentasi data. Coba lihat perbandingan contoh grafik di layar.”
AL menarik bangku mendekati Lee.
“Wah, ini jadi sangat jelas sekali. Aku jadi paham kenapa selama ini sering gagal menampilkan data. Sayang banget pas sekolah dulu hal ini enggak ada saat pelajaran matematika atau statistik,” ungkap AL.
“Memang jarang dipelajari di sekolah atau kuliah. Soalnya bukan ranahnya ilmu pasti seperti matematika. Ini lebih kepada soal rasa dan persepsi. Dan, tiap orang bisa berbeda-beda menilainya. Tapi setidaknya ini bisa jadi referensi yang membantu.”
“Bagaimana gambar tadi bisa menjelaskan rasa dan persepsi, Lee?”
“Mudah saja. Untuk gambar teratas, sudah jelas bahwa perbedaan warna yang sangat kontras akan membantu mata membedakan setiap bagian. Ada mata yang dengan mudah membedakan perbedaan tipis seperti petak-petak di bagian Kiri. Tetapi bagi sebagian orang, warna yang tidak pekat itu akan dianggap sama saja. Tipis sekali bedanya.”
“Kalau gambar yang di tengah?” tanya AL antusias.
“Gambar di tengah juga sama, tetapi kali ini lebih kepada masalah membaca posisi. Lihat, ada sejumlah titik yang hampir segaris, agak sulit membedakan mana yang lebih tinggi dan rendah.”
“Oh, begitu. Oke, aku akhirnya baru bisa membedakan perbedaan tinggi masing-masing titik pada gambar di sebelah Kanan. Garis tipis di belakang titik sangat membantu menentukan batasnya.”
“Satu lagi yang harus kamu perhatikan, AL. Kesalahan seperti gambar terbawah di bagian Kiri sering terjadi. Alih-alih membuat lebih dinamis, tampilan visual berbentuk grafik balon ini justru bikin sulit membedakan lingkaran terbesar dan terkecil. Selisihnya amat kecil sehingga tampak sama, bukan?”
AL ikut menyimak gambar yang ditunjuk Lee.
“Ya, tetapi yang bagian kanan pun sama sulitnya membedakan tinggi kolom pertama dan terakhir. Bukan begitu, Lee?”
“Kamu benar. Tetapi sudah jauh lebih baik dibanding yang Kiri. Kalau mau lebih sempurna, tinggal tambahkan garis tipis sebagai pemandu seperti gambar tengah, atau berikan saja label data di masing-masing kolom.”
“Tampaknya ini akan jadi diskusi yang menarik,” batin AL sambil menyimak kembali gambar-gambar tersebut.
Terdapat sejumlah data tentang karyawan di perusahaan A. Lalu aku diminta untuk mempresentasikan sebagian data itu kepada pimpinan. Salah satu data yang hendak ditampilkan adalah jumlah karyawan berdasarkan jenis kelamin dalam kelompok usia tertentu. Pimpinan perusahaan ingin melihat postur jumlah karyawan laki-laki dan perempuan berdasarkan rentang usia mereka.
Aku pun diminta menampilkan grafik yang simpel, tetapi padat informasi. Grafik itu membandingkan banyaknya jumlah karyawan laki-laki dan perempuan dalam setiap kelompok umur yang sama. Tantangannya adalah, grafik tersebut harus menunjukkan postur jumlah karyawan berdasarkan jenis kelamin dan rentang usianya sekaligus.
Dengan menggunakan Microsoft Excel, tentunya aku bisa dengan mudah membuat grafik seperti pada Gambar 1. Sayangnya, grafik ini boros tempat karena banyaknya kategori rentang usia membuatnya melebar. Ukuran huruf untuk keterangan pada masing-masing sumbu pun menjadi kecil dan kurang terbaca.
Selain itu, pembaca sulit melihat postur jumlah karyawan berdasarkan jenis kelamin karena jarak antarkolom jenis kelamin yang sama tampak berjauhan.
Bagaimana mengubah grafik ini menjadi lebih ringkas dan mudah terbaca?
Target
Berikut adalah data karyawan di perusahaan A.
Dengan menggunakan data karyawan di atas, aku bisa mengerjakan dengan
menggunakan aplikasi Google spreadsheet, Excel,
LibreOffice atau OpenOffice untuk memplotkan data ini,
tentunya di laptop/komputer nantinya. Akan tetapi kali ini aku akan
melakukannya dengan menggunakan ggplot (salah satu
library plotting bahasa pemrograman R).
Buatlah visualisasi dari data yang telah disediakan sebelumnya !
Begini :
#set library yang dibutuhkan
library("dplyr")
library("ggplot2")
tabel <- read.csv("https://storage.googleapis.com/dqlab-dataset/lo5_m01_mp01.csv") %>%
mutate(Laki.laki = -Laki.laki) %>%
arrange(desc(Kelompok.Usia))
plt <- ggplot(data = tabel,
aes(x = factor(Kelompok.Usia,
levels = Kelompok.Usia))) +
geom_bar(stat = "identity",
width = 0.8,
fill = "blue",
aes(y = Laki.laki)) +
geom_text(aes(x = Kelompok.Usia,
y = Laki.laki + 27,
label = abs(Laki.laki)),
colour = "white") +
geom_bar(stat = "identity",
width = 0.8,
fill = "orange",
aes(y = Perempuan)) +
geom_text(aes(x = Kelompok.Usia,
y = Perempuan - 27,
label = Perempuan),
colour = "white") +
ylim(-550, 550) +
coord_flip() +
annotate("text", x=0.5, y=-20, hjust=1,
label="Laki-laki", colour="blue") +
annotate("text", x=0.5, y=20, hjust=0,
label="Perempuan", colour="orange") +
labs(colour = "", x = "", y = "",
title = "Perbandingan Jumlah Karyawan Laki-laki dan Perempuan \nBerdasarkan Kelompok Usia") +
theme(axis.text = element_text(size = 12, face="bold"),
axis.text.x = element_blank(),
axis.ticks = element_blank(),
plot.title = element_text(hjust = 0, size = 16),
panel.background = element_rect(fill = "white"),
legend.position = "bottom")
options(repr.plt.width = 10, repr.plt.height = 2)
pltGrafik kolom kurang cocok untuk menampilkan banyak kategori, dalam hal ini adalah rentang usia karyawan. Ada tujuh kelompok usia dalam tabel data, masing-masing memiliki keterangan sebanyak 11 karakter (huruf). Jika keterangan ini dijejer pada sumbu X, akan melebar dan makan tempat, bukan?
Pilihan yang lebih baik adalah menggunakan dua bar chart yang disusun menjadi piramida. Jenis grafik ini dapat menempatkan batang-batang grafik menjadi lebih berdekatan sehingga menghemat ruang tampilan. Dengan ukuran gambar yang sama seperti grafik sebelumnya, dimungkinkan juga untuk memilih ukuran huruf lebih besar dan lebih terbaca.
Sebagai catatan, ada trik khusus untuk membuatnya di Excel. Pada contoh ini, grafik tersebut sebetulnya terdiri dari dua grafik terpisah, masing-masing untuk laki-laki dan perempuan. Khusus untuk grafik laki-laki, hanya perlu mengubah nilai pada sumbu X menjadi terbaca dari Kanan ke Kiri (reverse order). Selain itu dapat juga mengubahnya pada jendela Format Data Series dalam Excel.
Pimpinan perusahaan merasa kesal karena setiap kali rapat, analis data mempresentasikan data report yang bertele-tele. Selain itu, ia selalu meragukan kesahihan kesimpulan dalam laporan itu karena analisis tidak dilakukan secara detail. Ketika analis data itu memberikan data lebih detail, pimpinan perusahaan semakin kesal karena yang ditampilkan adalah data mentah yang masih sangat kotor dan harus ia simpulkan sendiri. Pimpinan tersebut juga berkali-kali bertanya tentang data, yang disajikan dalam bentuk grafik tiga dimensi, atau grafik yang penuh dengan label data dengan garis dan blok warna-warni yang mencolok mata.
Kali ini AL mendapat tugas dari Lee untuk memperbaiki laporan dari contoh kasus tersebut. Tujuannya menyajikan visualisasi data yang enak dilihat, alur narasinya tepat, dan kesimpulannya benar. Tugasnya adalah mencari karyawan dengan tren produktivitas paling baik selama satu tahun lalu untuk mendapatkan reward sebagai best employee. Masalahnya aku masih hanya bisa menggunakan Microsoft Excel dan PowerPoint untuk membuat presentasi laporan. Aku terbiasa menggunakan desain template dari kedua aplikasi itu. Yang aku tahu hanyalah jenis-jenis grafik bawaan yang disediakan pada aplikasi tersebut, contohnya seperti Gambar 1.
Tujuan
Berikut adalah data karyawan di perusahaan.
Dengan menggunakan data karyawan di atas, aku dapat mengerjakan
dengan menggunakan aplikasi Google spreadsheet, Excel,
LibreOffice atau OpenOffice untuk memplotkan data ini,
tentunya di laptop/komputer nantinya. Akan tetapi kali ini aku akan
melakukannya dengan menggunakan ggplot (salah satu
library plotting bahasa pemrograman R).
Buatlah visualisasi dari data yang telah disediakan sebelumnya !
Begini :
#set library yang dibutuhkan
library("dplyr")
library("ggplot2")
tabel <- read.csv("https://storage.googleapis.com/dqlab-dataset/lo5_m01_mp02.csv") %>%
mutate(Bulan = substr(Bulan, 1, 3),
Karyawan.A = Karyawan.A/1000,
Karyawan.B = Karyawan.B/1000,
Karyawan.C = Karyawan.C/1000,
Karyawan.D = Karyawan.D/1000,
Karyawan.E = Karyawan.E/1000)
plt <- ggplot(data = tabel,
aes(x = factor(Bulan, levels = Bulan))) +
geom_line(aes(y = Karyawan.A, group=1,
colour = "Karyawan A"),
colour = "gray",
size = 1) +
geom_line(aes(y = Karyawan.B, group=1),
colour = "gray",
size = 1.25) +
geom_line(aes(y = Karyawan.C, group=1),
colour = "gray",
size = 0.75) +
geom_line(aes(y = Karyawan.D, group=1),
colour = "gray",
size = 1.5) +
geom_line(aes(y = Karyawan.E, group=1),
colour = "darkblue",
size = 2) +
ylim(10, 40) +
# Produktivitas tertinggi
annotate("segment", x=8.5, xend=9, y=38, yend=max(tabel$Karyawan.E),
colour="darkblue", size=0.5) +
annotate("text", x=7.5, 38, size=3, hjust=0, colour="darkblue",
label=paste("Produktivitas\ntertinggi\n",
toString(max(tabel$Karyawan.E)))) +
# Karyawan A
annotate("segment", x=12, xend=12.15, colour="grey", size=0.5,
y=tabel$Karyawan.A[12], yend=tabel$Karyawan.A[12]-1.5) +
annotate("text", x=12.2, y=tabel$Karyawan.A[12]-1,
hjust=0, colour="grey", label="Karyawan A") +
annotate("text", x=12.2, y=tabel$Karyawan.A[12]-2,
hjust=0, colour="grey", size=3,
label=paste("avg:", toString(mean(tabel$Karyawan.A)))) +
# Karyawan B
annotate("segment", x=12, xend=12.15, colour="grey", size=0.5,
y=tabel$Karyawan.B[12], yend=tabel$Karyawan.B[12]+1.5) +
annotate("text", x=12.2, y=tabel$Karyawan.B[12]+2,
hjust=0, colour="grey", label="Karyawan B") +
annotate("text", x=12.2, y=tabel$Karyawan.B[12]+1,
hjust=0, colour="grey", size=3,
label=paste("avg:", toString(mean(tabel$Karyawan.B)))) +
# Karyawan C
annotate("segment", x=12, xend=12.15, colour="grey", size=0.5,
y=tabel$Karyawan.C[12], yend=tabel$Karyawan.C[12]+1.5) +
annotate("text", x=12.2, y=tabel$Karyawan.C[12]+2,
hjust=0, colour="grey", label="Karyawan C") +
annotate("text", x=12.2, y=tabel$Karyawan.C[12]+1,
hjust=0, colour="grey", size=3,
label=paste("avg:", toString(mean(tabel$Karyawan.C)))) +
# Karyawan D
annotate("segment", x=12, xend=12.15, colour="grey", size=0.5,
y=tabel$Karyawan.D[12], yend=tabel$Karyawan.D[12]-1.5) +
annotate("text", x=12.2, y=tabel$Karyawan.D[12]-1,
hjust=0, colour="grey", label="Karyawan D") +
annotate("text", x=12.2, y=tabel$Karyawan.D[12]-2,
hjust=0, colour="grey", size=3,
label=paste("avg:", toString(mean(tabel$Karyawan.D)))) +
# Karyawan E
annotate("segment", x=12, xend=12.15, colour="darkblue", size=0.5,
y=tabel$Karyawan.E[12], yend=tabel$Karyawan.E[12]+0.5) +
annotate("text", x=12.2, y=tabel$Karyawan.E[12]+1,
hjust=0, colour="darkblue", label="Karyawan E") +
annotate("text", x=12.2, y=tabel$Karyawan.E[12],
hjust=0, colour="darkblue", size=3,
label=paste("avg:", toString(mean(tabel$Karyawan.E)))) +
labs(x = "", y = "Jumlah produk (ribuan)\n",
title = "Best Employee 2019",
subtitle = "Lima karyawan dengan produktivitas tertinggi") +
theme(axis.text = element_text(size = 10),
axis.ticks.x = element_blank(),
plot.title = element_text(hjust = 0, size = 18, face="bold"),
panel.background = element_rect(fill = "white"))
options(repr.plt.width = 10, repr.plt.height = 1)
pltLee membantuku dengan memberi hint untuk mengganti jenis grafik batang menjadi grafik garis. Kenapa? Karena jenis inilah yang paling cocok untuk menggambarkan data produktivitas dari waktu ke waktu. Agar desainnya lebih simpel dan mudah dipahami, Lee juga menyarankan agar aku menyederhanakan tampilan grafik tersebut dengan langkah-langkah berikut ini:
Hasil akhir dari perbaikan grafik tersebut dapat dilihat pada Gambar 2.
Dalam memaparkan data untuk rapat manajer tingkat menengah di perusahaan, terdapat sejumlah data yang harus ditampilkan kepada para manajer tersebut. Tampilan grafik manakah yang paling tepat disajikan berikut ini ?
Pilihan
Jawaban Visual 2 adalah benar.
Saat presentasi kepada manajer, data yang perlu dipaparkan adalah ringkasan atau kesimpulan dari sekumpulan data. Penyebutan simpulan analisis data sangat perlu untuk menggiring manajer pada analisis tentang strategi/langkah lanjutan.
Visual 1 akan menyulitkan audiens untuk mencari
rata-rata ataupun puncak data. Bisa menyajikan gambar ini ketika
berdiskusi dengan para analis data. Analis akan mengeksplorasi data
tersebut dengan analisis-analisis lanjutan yang lebih dalam.
Adapun Visual 3 lebih cocok disajikan kepada audiens
umum, misalnya untuk infografik atau materi presentasi kepada klien.
Bisa juga disampaikan untuk level direksi ke atas, dengan catatan
penyaji siap dengan data yang lebih detail.
Di antara grafik-grafik ini, manakah yang paling cocok digunakan untuk menggambarkan jumlah karyawan berdasarkan usia?
Pilihan
Jika memilih Histogram jawabannya adalah
benar.
Ingat, kelompok usia adalah kategori data berantai yang saling berhubungan. Secara psikis, pembaca data akan dapat menghubungkan masing-masing kelompok usia itu berdasarkan urutannya, misal dari usia paling muda (kecil) hingga paling besar. Urutan ini tidak boleh diubah berdasarkan besaran nilai data pada setiap kategori.
Penggunaan pie chart dapat dimaklumi bila pesan yang
ingin disampaikan adalah proporsi jumlah karyawan berdasarkan usia.
Namun, tampilan pie chart di atas menyulitkan pembaca untuk
menelusuri bagian lingkaran dan keterangan kategori usia pada
legenda.
Demikian juga dengan column chart, penggunaan banyak
warna tidak mutlak digunakan, apalagi setiap kelompok tersebut homogen,
yakni dipilah berdasarkan rentang usia.
Histogram horizontal memperlihatkan postur jumlah
karyawan berdasarkan usia. Dari tabel ini terlihat kelompok usia manakah
yang paling dominan.