Serüvenimizin önceki bölümlerinde ham veriyi bir usta gibi yontmayı, onu temizlemeyi ve anlamlı özetler çıkarmayı öğrendik. Artık o yonttuğumuz eserin ruhunu ortaya çıkarma, verinin içinde saklı olan hikayeleri, desenleri ve ilişkileri bir tuvale dökme zamanı.
Bir sonraki durağımız, veri biliminin en keyifli ve en etkili aşaması: Veri Görselleştirme.
Unutmayın, bir tablodaki yüzlerce satır sayının anlatamadığını, iyi tasarlanmış tek bir grafik saniyeler içinde anlatabilir. Bu bölümde amacımız, sadece komutları kullanarak grafik çizmeyi değil, aynı zamanda “Neyi göstermek istiyorum ve bunun için en doğru görsel form hangisidir?” sorusunu sorarak bilinçli görselleştirmeler yapmayı öğrenmek olacak (Wilke, 2019).
Bu yolculuktaki en güçlü fırçamız, tidyverse
ekosisteminin görselleştirme devi olan
ggplot2
paketi olacak. Bu dev pakete
geçmeden önce gelin ustalık öncesi bir keşif yapalım.
esquisse
ile Sürükle-Bırak
SanatıKod yazmanın o derin dünyasına dalmadan önce,
ggplot2
’nin gücünü ve potansiyelini keşfetmek için sihirli
bir aletimiz var: esquisse
paketi. Bu
paket, RStudio içinde bize “sürükle-bırak” yöntemiyle interaktif olarak
grafikler oluşturma imkanı tanır.
Bu, hem ilham almak hem de Grafiklerin Grameri felsefesini sezgisel olarak anlamak için harika bir başlangıç noktasıdır.
esquisse
Atölyesini Açmainstall.packages("esquisse")
yazarak paketi kurun.# esquisse paketini install edelim.
install.packages("esquisse")
library(esquisse)
komutuyla paketi atölyemize
çağırıyoruz.# paketi programımıza çağrıyoruz.
library(esquisse)
esquisse
paketinin en güzel özelliklerinden biri, arayüz
dilini değiştirebilmemizdir. Sihirbazı başlatmadan önce aşağıdaki
set_i18n("tr")
komutunu çalıştırarak, tüm menüleri ve
seçenekleri Türkçe olarak kullanabilirsiniz. Bu, özellikle yeni
başlayanlar için harika bir kolaylıktır.# esquisse arayüzünü Türkçe'ye çevirelim
set_i18n("tr")
esquisser()
komutunu çalıştırıyoruz.# esquisse arayüzünü çalıştıralım
esquisser()
esquisser()
komutunu çalıştırdığınızda, karşınıza ilk
olarak “Grafik oluşturmak için veri aktarın” başlıklı, son derece
kullanışlı bir pencere gelecektir. Bu pencere, atölyemize hangi
malzemeyle çalışacağımızı söylediğimiz yerdir.
esquisse’de R Ortamında Veri Seti Seçimi
Bu pencere bize veriyi içeri almanın birden fazla yolu olduğunu gösterir. Gelin en sık kullanacağımız iki senaryoyu inceleyelim:
R, iris
, mtcars
gibi, pratik yapmak için
harika olan birçok yerleşik veri setiyle birlikte gelir.
esquisse
ile bu veri setlerine ulaşmak çok kolaydır.
Ortam
(</> Environment
)
seçeneğinin seçili olduğundan emin olun.iris
’i seçeceğiz.Global Environment
denen kısımdan iris
veri setinin içinde bulunduğu
datasets
,Veri Tablosu
denen kısımdan da iris
veri seti
bulunur.Veri al
butonuna tıklayarak atölye
tezgâhına geçebiliriz.Eğer kendi .csv
veya Excel dosyanızla çalışmak
isteseydiniz, yapmanız gereken tek şey sol taraftaki menüden
Dış dosya
seçeneğini seçmek ve ardından
bilgisayarınızdan ilgili dosyayı
bulmaktı.Gözat
’a tıklayıp
bilgisayarımızdaki .csv veri setini bulup tıkladığımızda
esquisse
dosyanın içeriğini sizin için otomatik olarak
analiz edecektir. Onay:
Yeşil kutucukta
“Veri başarıyla içeri alındı!” mesajını gördükten sonra, en alttaki
Veri al
butonuna tıklayarak yine atölye
tezgâhına geçebiliriz.
esquisse’de Dış Ortamdan Çekilen Veri Seti
Ve karşınızda, esquisse
’in ana kontrol paneli!
Gelin bu paneli birlikte tanıyalım:
esquisse’in Ana Kontrol Paneli
1. Değişkenler (Variables): Veri setimizdeki tüm sütunlar burada listelenir. Bunlar bizim “malzemelerimiz”.
2. Estetik Kutuları (Aesthetics): Burası,
malzemelerimizi grafiğin hangi görsel özelliğine atayacağımızı
belirlediğimiz yerdir. X
, Y
eksenleri,
Color
(renk), Size
(boyut) gibi kutucuklar
bulunur.
3. Grafik Tuvali: Sürükle-bırak yaptıkça, grafiğimizin canlı önizlemesi burada anında oluşur.
4. Geometri Seçimi: Sol üstte
auto
ile veriyi nasıl göstermek
istediğimizi (nokta, çubuk, çizgi vb.) seçebiliriz.
esquisse
genellikle değişken tiplerine göre en uygun
grafiği otomatik olarak seçer.
Eğer seçtiğiniz veri setini görmek isterseniz, üst menüden veri setine göz atma ikonuna tıklayabilirsiniz.
İris veri setiniz aşağıdaki gibi karşınıza gelir.
İris Veri Seti Karşınızda
Amacımız: iris
veri setindeki
çiçeklerin taç yaprağı uzunluğu (Petal.Length
) ile taç
yaprağı genişliği (Petal.Width
) arasındaki ilişkiyi
gösteren bir saçılım grafiği çizmek ve noktaların rengini çiçek türüne
(Species
) göre belirlemek.
Variables
listesinden
Petal.Length
’i sürükleyip X
kutusuna
bırakın.Variables
listesinden
Petal.Width
’i sürükleyip Y
kutusuna
bırakın.Variables
listesinden
Species
’i sürükleyip Color
kutusuna
bırakın.Bu üç basit adımı yaptığınızda, tuvalinizde anında aşağıdaki gibi renkli ve anlamlı bir grafiğin oluştuğunu göreceksiniz.
esquisse
ile Oluşturulan Saçılım Grafiği
Bu görsel atölyenin en güçlü özelliği, bize sadece bir resim değil,
bu resmi yaratan tarifi, yani ggplot2
kodunu vermesidir.
Ekranın sağ alt köşesindeki
</> Kod
butonuna tıklayın.
Karşınıza, oluşturduğunuz grafiğin tam ggplot2
kodunu
içeren bir pencere çıkacaktır.
esquisse
’in Ürettiği ggplot2 Kodu
Bu kodu “Panoya kopyala” butonuyla kopyalayıp, kendi
R script’inize veya .Rmd
dosyanıza yapıştırarak
analizlerinize devam edebilirsiniz.
Bu bölümle birlikte, R’da veri görselleştirmenin aslında ne kadar
sezgisel ve keyifli olabileceğini görmüş olduk. Bir sonraki bölümde,
esquisse
’in bizim için ürettiği bu kodların arkasındaki
“Grafiklerin Grameri” felsefesini öğrenerek, kendi başımıza, sıfırdan bu
sanat eserlerini nasıl yaratacağımızı keşfedeceğiz.
Bu bölümdeki konuların felsefesi ve anlatım yapısı oluşturulurken aşağıdaki değerli eserden ilham alınmıştır.
Wilke, C. O. (2019). Fundamentals of Data Visualization. O’Reilly Media. https://clauswilke.com/dataviz/