Giriş
R Paketi Nedir?
R’de paketler, belirli işlevleri ve veri kümelerini içeren birimlerdir. Bu paketler, kullanıcıların R diliyle daha etkili bir şekilde çalışmalarını sağlar. Her bir paket, belirli bir konuda uzmanlaşmış işlevler ve veri kümeleri sağlayarak R programlamacılarına geniş bir işlevsellik yelpazesi sunar.
Neden R Paketleri Önemlidir?
R paketleri, çeşitli analiz, veri manipülasyonu, görselleştirme ve modelleme işlemleri için geliştirilmiş fonksiyonlar ve araçlar içerir. Bu paketler, kullanıcıların kendi işlerini baştan oluşturmaktansa, zaten mevcut olan işlevsellikleri kullanarak daha hızlı ve verimli çalışmalarını sağlar. Ayrıca, R topluluğu tarafından sürekli olarak geliştirilen ve güncellenen birçok paket, kullanıcıların en son yöntemleri ve teknikleri hızla benimsemesini sağlar.
Bu Paketlere Nasıl Erişilir?
R paketlerine erişmek için install.packages() fonksiyonu
kullanılır. Bu fonksiyon, R’nin resmi paket deposundan (CRAN) veya diğer
kaynaklardan paketleri indirip yükler. Yüklenen bir paketi kullanmak
için, library() veya require() fonksiyonları
kullanılabilir. Bu fonksiyonlar, R ortamına yüklenen paketlerin
işlevselliğini mevcut çalışma alanına getirir ve kullanıma hazır hale
getirir.
Proje Açıklaması:
Bu proje, R programlama dili ve ilgili paketler kullanılarak Dünya Kalkınma Göstergeleri (WDI) verilerinin analizini ve görselleştirmesini içermektedir. WDI paketi aracılığıyla çevresel göstergilerin yanı sıra ekonomik ve sosyal göstergeler de dahil olmak üzere çeşitli veriler çekilmektedir. Tidyverse, ggplot2 ve plotly gibi R paketleri, veriyi işlemek ve görselleştirmek için kullanılmaktadır.
Analiz aşamasında, çevresel göstergelerin zaman içindeki değişimleri incelenmekte ve farklı ülkeler arasındaki karşılaştırmalar yapılması amaçlanmaktadır. Örneğin, ormanlık alan yüzdesi ve CO2 emisyonu gibi çevresel faktörlerin trendleri görselleştirilerek, çevresel sürdürülebilirlik üzerindeki etkileri değerlendirilmektedir.
Proje, veri keşfi, işleme, analiz ve görselleştirme adımlarını içerir. Bu adımlar, WDI verilerinin anlaşılmasını ve çeşitli göstergelerin etkisini belirleme sürecini kapsar. Sonuçlar, karar alıcılar ve sivil toplum için çevresel politikaların oluşturulmasında ve sürdürülebilir kalkınma hedeflerinin takip edilmesinde değerli bir kaynak oluşturabilir. Tabii, işte her bir paket hakkında daha fazla açıklama ve yan başlık:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.0 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
##
## Attaching package: 'plotly'
##
## The following object is masked from 'package:ggplot2':
##
## last_plot
##
## The following object is masked from 'package:stats':
##
## filter
##
## The following object is masked from 'package:graphics':
##
## layout
R Paketleri Hakkında:
WDI (Dünya Kalkınma Göstergeleri): Dünya Bankası’nın sunduğu World Development Indicators (WDI) veri tabanından veri çekmek için kullanılan bir R paketidir. Bu paket, dünya çapında ekonomik, sosyal ve çevresel göstergelere erişim sağlar. Örneğin, GDP, nüfus, eğitim, sağlık ve çevre verilerine kolayca erişebilir ve bu verileri analiz edebilirsiniz.
tidyverse: tidyverse, veri analizi ve manipülasyonu için kapsamlı bir R paket koleksiyonudur. Bu paketler, veri analizi süreçlerini kolaylaştıran tutarlı bir veri yapısı ve işlevsel dil sağlar. tidyverse içinde bulunan dplyr, ggplot2, tidyr, readr ve diğer birçok paket, veri analizi sürecini daha etkili hale getirir.
ggplot2: ggplot2, R’de güçlü ve esnek bir veri görselleştirme paketidir. Veriye dayalı grafik oluşturma yaklaşımıyla, kullanıcıların verilerini açıklayan ve keşfeden etkili grafikler oluşturmasını sağlar. ggplot2’nin katmanlar ve estetikler gibi özellikleri, veri görselleştirme sürecini daha esnek hale getirir.
plotly: plotly, interaktif ve dinamik grafikler oluşturmak için kullanılan bir R paketidir. Bu paket, ggplot2’nin grammer of graphics yaklaşımını temel alır ve interaktif grafiklerin oluşturulmasını sağlayan özellikler sunar. plotly ile oluşturulan grafikler, kullanıcıların grafikleri etkileşimli olarak keşfetmesine ve verilere daha derinlemesine bakmasına olanak tanır.
dplyr: dplyr, veri manipülasyonu için tasarlanmış bir R paketidir. Bu paket, veri setlerini filtreleme, toplama, dönüştürme ve özetleme gibi işlemleri kolaylaştırır. Özellikle büyük veri setleriyle çalışırken, dplyr’in hızlı ve etkili işlevleri veri işleme işlemlerini optimize eder. dplyr, veri analizi sürecindeki temel adımları kolaylaştırır ve veri setlerini daha anlaşılır hale getirir.
Bu paketler, R kullanıcılarına veri analizi, görselleştirme ve manipülasyon gibi birçok farklı alanda güçlü araçlar sunar.
WDI Paketi Kullanımı:
- Çevresel Göstergeleri Çekme:
# Çevresel göstergeler için kodlar: 'AG.LND.FRST.ZS' (Ormanlık Alanların Yüzdesi), 'EN.ATM.CO2E.KT' (CO2 Emisyonu), 'EN.ATM.NOXE.KT.CE' (Azot Oksit Emisyonu)
# Ülkeler: Türkiye (TUR), Almanya (DEU), Birleşik Krallık (GBR)
# Yıllar: 2010-2019 arası
data <- WDI(country = c("TUR", "DEU", "GBR"), indicator = c("AG.LND.FRST.ZS", "EN.ATM.CO2E.KT", "EN.ATM.NOXE.KT.CE"), start = 2010, end = 2019)## country iso2c iso3c year
## Length:30 Length:30 Length:30 Min. :2010
## Class :character Class :character Class :character 1st Qu.:2012
## Mode :character Mode :character Mode :character Median :2014
## Mean :2014
## 3rd Qu.:2017
## Max. :2019
## AG.LND.FRST.ZS EN.ATM.CO2E.KT EN.ATM.NOXE.KT.CE
## Min. :12.64 Min. :297814 Min. :26144
## 1st Qu.:13.09 1st Qu.:362128 1st Qu.:29013
## Median :28.03 Median :416854 Median :30897
## Mean :24.55 Mean :502328 Mean :32461
## 3rd Qu.:32.68 3rd Qu.:726096 3rd Qu.:36291
## Max. :32.75 Max. :776152 Max. :39372
## country iso2c iso3c year AG.LND.FRST.ZS EN.ATM.CO2E.KT
## 1 Germany DE DEU 2010 32.73087 773069.1
## 2 Germany DE DEU 2011 32.73755 746477.3
## 3 Germany DE DEU 2012 32.74517 760127.7
## 4 Germany DE DEU 2013 32.71899 776151.8
## 5 Germany DE DEU 2014 32.72284 736011.7
## 6 Germany DE DEU 2015 32.73233 742314.4
## 7 Germany DE DEU 2016 32.68548 747147.2
## 8 Germany DE DEU 2017 32.68455 732204.2
## 9 Germany DE DEU 2018 32.68361 707770.2
## 10 Germany DE DEU 2019 32.68268 658693.5
## 11 Turkiye TR TUR 2010 27.39379 297814.0
## 12 Turkiye TR TUR 2011 27.53599 318641.2
## 13 Turkiye TR TUR 2012 27.67819 329797.8
## 14 Turkiye TR TUR 2013 27.82040 319088.6
## 15 Turkiye TR TUR 2014 27.96260 341671.5
## 16 Turkiye TR TUR 2015 28.10480 353413.8
## 17 Turkiye TR TUR 2016 28.10480 376399.0
## 18 Turkiye TR TUR 2017 28.26353 418098.2
## 19 Turkiye TR TUR 2018 28.46609 414111.9
## 20 Turkiye TR TUR 2019 28.66879 398772.9
## 21 United Kingdom GB GBR 2010 12.64415 482646.2
## 22 United Kingdom GB GBR 2011 12.72352 445648.4
## 23 United Kingdom GB GBR 2012 12.80288 467831.0
## 24 United Kingdom GB GBR 2013 12.88224 453778.1
## 25 United Kingdom GB GBR 2014 12.96160 415609.0
## 26 United Kingdom GB GBR 2015 13.04096 401075.3
## 27 United Kingdom GB GBR 2016 13.05750 382154.9
## 28 United Kingdom GB GBR 2017 13.07816 366844.1
## 29 United Kingdom GB GBR 2018 13.11536 360555.9
## 30 United Kingdom GB GBR 2019 13.15256 345934.3
## EN.ATM.NOXE.KT.CE
## 1 39312.25
## 2 37769.95
## 3 37851.69
## 4 38480.93
## 5 39371.73
## 6 38498.27
## 7 37800.34
## 8 36710.42
## 9 34841.25
## 10 35033.81
## 11 26264.64
## 12 26143.70
## 13 28311.37
## 14 30776.94
## 15 30613.94
## 16 31017.92
## 17 33270.75
## 18 32868.76
## 19 33416.42
## 20 34965.33
## 21 29846.60
## 22 28901.98
## 23 28496.25
## 24 28499.68
## 25 29296.64
## 26 29190.95
## 27 28926.00
## 28 29187.60
## 29 28954.55
## 30 29218.82
tidyverse Paketi Kullanımı (Basitleştirilmiş):
# Veriyi düzenleme
data_tidy <- data %>%
# Sütunları yeniden adlandırma ve seçme
rename(Ülke = country, Yıl = year) %>%
select(Ülke, Yıl, Ormanlık_Alan_Yüzdesi = AG.LND.FRST.ZS, CO2_Emisyonu = EN.ATM.CO2E.KT, NOX_Emisyonu = EN.ATM.NOXE.KT.CE)
# Düzenlenmiş veriyi görüntüleme
print(data_tidy)## Ülke Yıl Ormanlık_Alan_Yüzdesi CO2_Emisyonu NOX_Emisyonu
## 1 Germany 2010 32.73087 773069.1 39312.25
## 2 Germany 2011 32.73755 746477.3 37769.95
## 3 Germany 2012 32.74517 760127.7 37851.69
## 4 Germany 2013 32.71899 776151.8 38480.93
## 5 Germany 2014 32.72284 736011.7 39371.73
## 6 Germany 2015 32.73233 742314.4 38498.27
## 7 Germany 2016 32.68548 747147.2 37800.34
## 8 Germany 2017 32.68455 732204.2 36710.42
## 9 Germany 2018 32.68361 707770.2 34841.25
## 10 Germany 2019 32.68268 658693.5 35033.81
## 11 Turkiye 2010 27.39379 297814.0 26264.64
## 12 Turkiye 2011 27.53599 318641.2 26143.70
## 13 Turkiye 2012 27.67819 329797.8 28311.37
## 14 Turkiye 2013 27.82040 319088.6 30776.94
## 15 Turkiye 2014 27.96260 341671.5 30613.94
## 16 Turkiye 2015 28.10480 353413.8 31017.92
## 17 Turkiye 2016 28.10480 376399.0 33270.75
## 18 Turkiye 2017 28.26353 418098.2 32868.76
## 19 Turkiye 2018 28.46609 414111.9 33416.42
## 20 Turkiye 2019 28.66879 398772.9 34965.33
## 21 United Kingdom 2010 12.64415 482646.2 29846.60
## 22 United Kingdom 2011 12.72352 445648.4 28901.98
## 23 United Kingdom 2012 12.80288 467831.0 28496.25
## 24 United Kingdom 2013 12.88224 453778.1 28499.68
## 25 United Kingdom 2014 12.96160 415609.0 29296.64
## 26 United Kingdom 2015 13.04096 401075.3 29190.95
## 27 United Kingdom 2016 13.05750 382154.9 28926.00
## 28 United Kingdom 2017 13.07816 366844.1 29187.60
## 29 United Kingdom 2018 13.11536 360555.9 28954.55
## 30 United Kingdom 2019 13.15256 345934.3 29218.82
Veri Görselleştirme:
# ggplot2 ve plotly paketlerini yükleme
library(ggplot2)
library(plotly)
# ggplot2 ile basit bir çizim oluşturma
ggplot(data_tidy, aes(x = Yıl)) +
geom_line(aes(y = Ormanlık_Alan_Yüzdesi, color = Ülke)) +
labs(title = "Ormanlık Alan Yüzdesi",
x = "Yıl",
y = "Ormanlık Alan Yüzdesi",
color = "Ülke") +
theme_minimal()# plotly ile interaktif bir çizim oluşturma
plot_ly(data_tidy, x = ~Yıl, y = ~CO2_Emisyonu, color = ~Ülke, type = 'scatter', mode = 'lines') %>%
add_lines() %>%
layout(title = "CO2 Emisyonu",
xaxis = list(title = "Yıl"),
yaxis = list(title = "CO2 Emisyonu"),
legend = list(title = "Ülke"))Bu kod parçacığı, veriyi ggplot2 ve plotly paketleriyle görselleştirir. İlk olarak, ggplot2 ile basit bir çizim oluşturulur. Bu çizim, yıllara göre ormanlık alan yüzdesini farklı ülkelerin renklerine göre gösterir. Daha sonra, plotly ile interaktif bir çizim oluşturulur. Bu çizim, yıllara göre CO2 emisyonunu farklı ülkelerin renklerine göre gösterir ve kullanıcıların çizime yakınlaştırma, kaydırma ve daha fazla etkileşimli özelliklere erişmesine olanak tanır.
dplyr Paketi Kullanımı:
# dplyr paketini yükleme
library(dplyr)
# Veriyi işleme
data_processed <- data_tidy %>%
# Veriyi filtreleme: Yıllara göre 2015 ve sonrasını seçme
filter(Yıl >= 2015) %>%
# Veriyi düzenleme: Ülkeleri gruplama ve her bir ülke için CO2 emisyonunun ortalamasını hesaplama
group_by(Ülke) %>%
summarize(Ortalama_CO2_Emisyonu = mean(CO2_Emisyonu, na.rm = TRUE))
# İşlenmiş veriyi görüntüleme
print(data_processed)## # A tibble: 3 × 2
## Ülke Ortalama_CO2_Emisyonu
## <chr> <dbl>
## 1 Germany 717626.
## 2 Turkiye 392159.
## 3 United Kingdom 371313.
Bu kod parçacığı, dplyr paketini kullanarak veriyi işler. İlk olarak, filter() işleviyle yalnızca 2015 ve sonrasındaki verileri filtreleriz. Daha sonra, group_by() ve summarize() işlevlerini kullanarak ülkeleri gruplarız ve her bir ülke için CO2 emisyonunun ortalamasını hesaplarız.
Sonuçlar, her bir ülkenin 2015 ve sonrası dönemdeki CO2 emisyonunun ortalamasını içeren bir veri çerçevesi olarak görüntülenir. Bu adımlar, veriyi daha anlaşılır bir şekilde işlememize ve sonuçları okunabilir bir şekilde görüntülememize olanak tanır.
# Veriyi görselleştirme
ggplot(data_processed, aes(x = Ülke, y = Ortalama_CO2_Emisyonu)) +
geom_bar(stat = "identity", fill = "skyblue") +
labs(title = "2015 ve Sonrası Ortalama CO2 Emisyonu",
x = "Ülke",
y = "Ortalama CO2 Emisyonu") +
theme_minimal()grafikte gösterilen bilgilerin anlaşılmasına yardımcı olacak ve grafik üzerinde yapılan karşılaştırmaların amacını açıklayacaktır.