Serüvenimizin önceki bölümlerinde ham veriyi bir usta gibi yontmayı, onu temizlemeyi ve anlamlı özetler çıkarmayı öğrendik. Artık o yonttuğumuz eserin ruhunu ortaya çıkarma, verinin içinde saklı olan hikayeleri, desenleri ve ilişkileri bir tuvale dökme zamanı.
Bir sonraki durağımız, veri biliminin en keyifli ve en etkili aşaması: Veri Görselleştirme.
Unutmayın, bir tablodaki yüzlerce satır sayının anlatamadığını, iyi tasarlanmış tek bir grafik saniyeler içinde anlatabilir. Bu bölümde amacımız, sadece komutları kullanarak grafik çizmeyi değil, aynı zamanda “Neyi göstermek istiyorum ve bunun için en doğru görsel form hangisidir?” sorusunu sorarak bilinçli görselleştirmeler yapmayı öğrenmek olacak (Wilke, 2019).
Bu yolculuktaki en güçlü fırçamız, tidyverse
ekosisteminin görselleştirme devi olan
ggplot2 paketi olacak. Bu dev pakete
geçmeden önce gelin ustalık öncesi bir keşif yapalım.
esquisse ile Sürükle-Bırak
SanatıKod yazmanın o derin dünyasına dalmadan önce,
ggplot2’nin gücünü ve potansiyelini keşfetmek için sihirli
bir aletimiz var: esquisse paketi. Bu
paket, RStudio içinde bize “sürükle-bırak” yöntemiyle interaktif olarak
grafikler oluşturma imkanı tanır.
Bu, hem ilham almak hem de Grafiklerin Grameri felsefesini sezgisel olarak anlamak için harika bir başlangıç noktasıdır.
esquisse Atölyesini Açmainstall.packages("esquisse")
yazarak paketi kurun.# esquisse paketini install edelim.
install.packages("esquisse")
library(esquisse) komutuyla paketi atölyemize
çağırıyoruz.# paketi programımıza çağrıyoruz.
library(esquisse)
esquisse paketinin en güzel özelliklerinden biri, arayüz
dilini değiştirebilmemizdir. Sihirbazı başlatmadan önce aşağıdaki
set_i18n("tr") komutunu çalıştırarak, tüm menüleri ve
seçenekleri Türkçe olarak kullanabilirsiniz. Bu, özellikle yeni
başlayanlar için harika bir kolaylıktır.# esquisse arayüzünü Türkçe'ye çevirelim
set_i18n("tr")
esquisser()
komutunu çalıştırıyoruz.# esquisse arayüzünü çalıştıralım
esquisser()
esquisser() komutunu çalıştırdığınızda, karşınıza ilk
olarak “Grafik oluşturmak için veri aktarın” başlıklı, son derece
kullanışlı bir pencere gelecektir. Bu pencere, atölyemize hangi
malzemeyle çalışacağımızı söylediğimiz yerdir.
esquisse’de R Ortamında Veri Seti Seçimi
Bu pencere bize veriyi içeri almanın birden fazla yolu olduğunu gösterir. Gelin en sık kullanacağımız iki senaryoyu inceleyelim:
R, iris, mtcars gibi, pratik yapmak için
harika olan birçok yerleşik veri setiyle birlikte gelir.
esquisse ile bu veri setlerine ulaşmak çok kolaydır.
Ortam (</> Environment)
seçeneğinin seçili olduğundan emin olun.iris’i seçeceğiz.Global Environment denen kısımdan iris
veri setinin içinde bulunduğu
datasets,Veri Tablosu
denen kısımdan da iris veri seti
bulunur.Veri al butonuna tıklayarak atölye
tezgâhına geçebiliriz.Eğer kendi .csv veya Excel dosyanızla çalışmak
isteseydiniz, yapmanız gereken tek şey sol taraftaki menüden
Dış dosya seçeneğini seçmek ve ardından
bilgisayarınızdan ilgili dosyayı
bulmaktı.Gözat’a tıklayıp
bilgisayarımızdaki .csv veri setini bulup tıkladığımızda
esquisse dosyanın içeriğini sizin için otomatik olarak
analiz edecektir. Onay: Yeşil kutucukta
“Veri başarıyla içeri alındı!” mesajını gördükten sonra, en alttaki
Veri al butonuna tıklayarak yine atölye
tezgâhına geçebiliriz.
esquisse’de Dış Ortamdan Çekilen Veri Seti
Ve karşınızda, esquisse’in ana kontrol paneli!
Gelin bu paneli birlikte tanıyalım:
esquisse’in Ana Kontrol Paneli
1. Değişkenler (Variables): Veri setimizdeki tüm sütunlar burada listelenir. Bunlar bizim “malzemelerimiz”.
2. Estetik Kutuları (Aesthetics): Burası,
malzemelerimizi grafiğin hangi görsel özelliğine atayacağımızı
belirlediğimiz yerdir. X, Y eksenleri,
Color (renk), Size (boyut) gibi kutucuklar
bulunur.
3. Grafik Tuvali: Sürükle-bırak yaptıkça, grafiğimizin canlı önizlemesi burada anında oluşur.
4. Geometri Seçimi: Sol üstte
auto ile veriyi nasıl göstermek
istediğimizi (nokta, çubuk, çizgi vb.) seçebiliriz.
esquisse genellikle değişken tiplerine göre en uygun
grafiği otomatik olarak seçer.
Eğer seçtiğiniz veri setini görmek isterseniz, üst menüden veri setine göz atma ikonuna tıklayabilirsiniz.
İris veri setiniz aşağıdaki gibi karşınıza gelir.
İris Veri Seti Karşınızda
Amacımız: iris veri setindeki
çiçeklerin taç yaprağı uzunluğu (Petal.Length) ile taç
yaprağı genişliği (Petal.Width) arasındaki ilişkiyi
gösteren bir saçılım grafiği çizmek ve noktaların rengini çiçek türüne
(Species) göre belirlemek.
Variables listesinden
Petal.Length’i sürükleyip X kutusuna
bırakın.Variables listesinden
Petal.Width’i sürükleyip Y kutusuna
bırakın.Variables listesinden
Species’i sürükleyip Color kutusuna
bırakın.Bu üç basit adımı yaptığınızda, tuvalinizde anında aşağıdaki gibi renkli ve anlamlı bir grafiğin oluştuğunu göreceksiniz.
esquisse ile Oluşturulan Saçılım Grafiği
Bu görsel atölyenin en güçlü özelliği, bize sadece bir resim değil,
bu resmi yaratan tarifi, yani ggplot2
kodunu vermesidir.
Ekranın sağ alt köşesindeki
</> Kod butonuna tıklayın.
Karşınıza, oluşturduğunuz grafiğin tam ggplot2 kodunu
içeren bir pencere çıkacaktır.
esquisse’in Ürettiği ggplot2 Kodu
Bu kodu “Panoya kopyala” butonuyla kopyalayıp, kendi
R script’inize veya .Rmd dosyanıza yapıştırarak
analizlerinize devam edebilirsiniz.
Bu bölümle birlikte, R’da veri görselleştirmenin aslında ne kadar
sezgisel ve keyifli olabileceğini görmüş olduk. Bir sonraki bölümde,
esquisse’in bizim için ürettiği bu kodların arkasındaki
“Grafiklerin Grameri” felsefesini öğrenerek, kendi başımıza, sıfırdan bu
sanat eserlerini nasıl yaratacağımızı keşfedeceğiz.
Bu bölümdeki konuların felsefesi ve anlatım yapısı oluşturulurken aşağıdaki değerli eserden ilham alınmıştır.
Wilke, C. O. (2019). Fundamentals of Data Visualization. O’Reilly Media. https://clauswilke.com/dataviz/