EKONOMETRI 2 VIZE PROJESI

IDDRISS ALI YASSIR

2024-04-15

Giriş

R Paketi Nedir?

R’de paketler, belirli işlevleri ve veri kümelerini içeren birimlerdir. Bu paketler, kullanıcıların R diliyle daha etkili bir şekilde çalışmalarını sağlar. Her bir paket, belirli bir konuda uzmanlaşmış işlevler ve veri kümeleri sağlayarak R programlamacılarına geniş bir işlevsellik yelpazesi sunar.

Neden R Paketleri Önemlidir?

R paketleri, çeşitli analiz, veri manipülasyonu, görselleştirme ve modelleme işlemleri için geliştirilmiş fonksiyonlar ve araçlar içerir. Bu paketler, kullanıcıların kendi işlerini baştan oluşturmaktansa, zaten mevcut olan işlevsellikleri kullanarak daha hızlı ve verimli çalışmalarını sağlar. Ayrıca, R topluluğu tarafından sürekli olarak geliştirilen ve güncellenen birçok paket, kullanıcıların en son yöntemleri ve teknikleri hızla benimsemesini sağlar.

Bu Paketlere Nasıl Erişilir?

R paketlerine erişmek için install.packages() fonksiyonu kullanılır. Bu fonksiyon, R’nin resmi paket deposundan (CRAN) veya diğer kaynaklardan paketleri indirip yükler. Yüklenen bir paketi kullanmak için, library() veya require() fonksiyonları kullanılabilir. Bu fonksiyonlar, R ortamına yüklenen paketlerin işlevselliğini mevcut çalışma alanına getirir ve kullanıma hazır hale getirir.

Proje Açıklaması:

Bu proje, R programlama dili ve ilgili paketler kullanılarak Dünya Kalkınma Göstergeleri (WDI) verilerinin analizini ve görselleştirmesini içermektedir. WDI paketi aracılığıyla çevresel göstergilerin yanı sıra ekonomik ve sosyal göstergeler de dahil olmak üzere çeşitli veriler çekilmektedir. Tidyverse, ggplot2 ve plotly gibi R paketleri, veriyi işlemek ve görselleştirmek için kullanılmaktadır.

Analiz aşamasında, çevresel göstergelerin zaman içindeki değişimleri incelenmekte ve farklı ülkeler arasındaki karşılaştırmalar yapılması amaçlanmaktadır. Örneğin, ormanlık alan yüzdesi ve CO2 emisyonu gibi çevresel faktörlerin trendleri görselleştirilerek, çevresel sürdürülebilirlik üzerindeki etkileri değerlendirilmektedir.

Proje, veri keşfi, işleme, analiz ve görselleştirme adımlarını içerir. Bu adımlar, WDI verilerinin anlaşılmasını ve çeşitli göstergelerin etkisini belirleme sürecini kapsar. Sonuçlar, karar alıcılar ve sivil toplum için çevresel politikaların oluşturulmasında ve sürdürülebilir kalkınma hedeflerinin takip edilmesinde değerli bir kaynak oluşturabilir. Tabii, işte her bir paket hakkında daha fazla açıklama ve yan başlık:

# Yüklenen paketleri içe aktarın

library(WDI)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.0     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggplot2)
library(plotly)
## 
## Attaching package: 'plotly'
## 
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## 
## The following object is masked from 'package:stats':
## 
##     filter
## 
## The following object is masked from 'package:graphics':
## 
##     layout
library(dplyr)

R Paketleri Hakkında:

WDI (Dünya Kalkınma Göstergeleri): Dünya Bankası’nın sunduğu World Development Indicators (WDI) veri tabanından veri çekmek için kullanılan bir R paketidir. Bu paket, dünya çapında ekonomik, sosyal ve çevresel göstergelere erişim sağlar. Örneğin, GDP, nüfus, eğitim, sağlık ve çevre verilerine kolayca erişebilir ve bu verileri analiz edebilirsiniz.

tidyverse: tidyverse, veri analizi ve manipülasyonu için kapsamlı bir R paket koleksiyonudur. Bu paketler, veri analizi süreçlerini kolaylaştıran tutarlı bir veri yapısı ve işlevsel dil sağlar. tidyverse içinde bulunan dplyr, ggplot2, tidyr, readr ve diğer birçok paket, veri analizi sürecini daha etkili hale getirir.

ggplot2: ggplot2, R’de güçlü ve esnek bir veri görselleştirme paketidir. Veriye dayalı grafik oluşturma yaklaşımıyla, kullanıcıların verilerini açıklayan ve keşfeden etkili grafikler oluşturmasını sağlar. ggplot2’nin katmanlar ve estetikler gibi özellikleri, veri görselleştirme sürecini daha esnek hale getirir.

plotly: plotly, interaktif ve dinamik grafikler oluşturmak için kullanılan bir R paketidir. Bu paket, ggplot2’nin grammer of graphics yaklaşımını temel alır ve interaktif grafiklerin oluşturulmasını sağlayan özellikler sunar. plotly ile oluşturulan grafikler, kullanıcıların grafikleri etkileşimli olarak keşfetmesine ve verilere daha derinlemesine bakmasına olanak tanır.

dplyr: dplyr, veri manipülasyonu için tasarlanmış bir R paketidir. Bu paket, veri setlerini filtreleme, toplama, dönüştürme ve özetleme gibi işlemleri kolaylaştırır. Özellikle büyük veri setleriyle çalışırken, dplyr’in hızlı ve etkili işlevleri veri işleme işlemlerini optimize eder. dplyr, veri analizi sürecindeki temel adımları kolaylaştırır ve veri setlerini daha anlaşılır hale getirir.

Bu paketler, R kullanıcılarına veri analizi, görselleştirme ve manipülasyon gibi birçok farklı alanda güçlü araçlar sunar.

WDI Paketi Kullanımı:

  • Çevresel Göstergeleri Çekme:
# Çevresel göstergeler için kodlar: 'AG.LND.FRST.ZS' (Ormanlık Alanların Yüzdesi), 'EN.ATM.CO2E.KT' (CO2 Emisyonu), 'EN.ATM.NOXE.KT.CE' (Azot Oksit Emisyonu)
# Ülkeler: Türkiye (TUR), Almanya (DEU), Birleşik Krallık (GBR)
# Yıllar: 2010-2019 arası
data <- WDI(country = c("TUR", "DEU", "GBR"), indicator = c("AG.LND.FRST.ZS", "EN.ATM.CO2E.KT", "EN.ATM.NOXE.KT.CE"), start = 2010, end = 2019)
# Çekilen verileri gösterme

summary(data)
##    country             iso2c              iso3c                year     
##  Length:30          Length:30          Length:30          Min.   :2010  
##  Class :character   Class :character   Class :character   1st Qu.:2012  
##  Mode  :character   Mode  :character   Mode  :character   Median :2014  
##                                                           Mean   :2014  
##                                                           3rd Qu.:2017  
##                                                           Max.   :2019  
##  AG.LND.FRST.ZS  EN.ATM.CO2E.KT   EN.ATM.NOXE.KT.CE
##  Min.   :12.64   Min.   :297814   Min.   :26144    
##  1st Qu.:13.09   1st Qu.:362128   1st Qu.:29013    
##  Median :28.03   Median :416854   Median :30897    
##  Mean   :24.55   Mean   :502328   Mean   :32461    
##  3rd Qu.:32.68   3rd Qu.:726096   3rd Qu.:36291    
##  Max.   :32.75   Max.   :776152   Max.   :39372
print(data)
##           country iso2c iso3c year AG.LND.FRST.ZS EN.ATM.CO2E.KT
## 1         Germany    DE   DEU 2010       32.73087       773069.1
## 2         Germany    DE   DEU 2011       32.73755       746477.3
## 3         Germany    DE   DEU 2012       32.74517       760127.7
## 4         Germany    DE   DEU 2013       32.71899       776151.8
## 5         Germany    DE   DEU 2014       32.72284       736011.7
## 6         Germany    DE   DEU 2015       32.73233       742314.4
## 7         Germany    DE   DEU 2016       32.68548       747147.2
## 8         Germany    DE   DEU 2017       32.68455       732204.2
## 9         Germany    DE   DEU 2018       32.68361       707770.2
## 10        Germany    DE   DEU 2019       32.68268       658693.5
## 11        Turkiye    TR   TUR 2010       27.39379       297814.0
## 12        Turkiye    TR   TUR 2011       27.53599       318641.2
## 13        Turkiye    TR   TUR 2012       27.67819       329797.8
## 14        Turkiye    TR   TUR 2013       27.82040       319088.6
## 15        Turkiye    TR   TUR 2014       27.96260       341671.5
## 16        Turkiye    TR   TUR 2015       28.10480       353413.8
## 17        Turkiye    TR   TUR 2016       28.10480       376399.0
## 18        Turkiye    TR   TUR 2017       28.26353       418098.2
## 19        Turkiye    TR   TUR 2018       28.46609       414111.9
## 20        Turkiye    TR   TUR 2019       28.66879       398772.9
## 21 United Kingdom    GB   GBR 2010       12.64415       482646.2
## 22 United Kingdom    GB   GBR 2011       12.72352       445648.4
## 23 United Kingdom    GB   GBR 2012       12.80288       467831.0
## 24 United Kingdom    GB   GBR 2013       12.88224       453778.1
## 25 United Kingdom    GB   GBR 2014       12.96160       415609.0
## 26 United Kingdom    GB   GBR 2015       13.04096       401075.3
## 27 United Kingdom    GB   GBR 2016       13.05750       382154.9
## 28 United Kingdom    GB   GBR 2017       13.07816       366844.1
## 29 United Kingdom    GB   GBR 2018       13.11536       360555.9
## 30 United Kingdom    GB   GBR 2019       13.15256       345934.3
##    EN.ATM.NOXE.KT.CE
## 1           39312.25
## 2           37769.95
## 3           37851.69
## 4           38480.93
## 5           39371.73
## 6           38498.27
## 7           37800.34
## 8           36710.42
## 9           34841.25
## 10          35033.81
## 11          26264.64
## 12          26143.70
## 13          28311.37
## 14          30776.94
## 15          30613.94
## 16          31017.92
## 17          33270.75
## 18          32868.76
## 19          33416.42
## 20          34965.33
## 21          29846.60
## 22          28901.98
## 23          28496.25
## 24          28499.68
## 25          29296.64
## 26          29190.95
## 27          28926.00
## 28          29187.60
## 29          28954.55
## 30          29218.82

tidyverse Paketi Kullanımı (Basitleştirilmiş):

# Veriyi düzenleme
data_tidy <- data %>%
  # Sütunları yeniden adlandırma ve seçme
  renamelke = country, Yıl = year) %>%
  select(Ülke, Yıl, Ormanlık_Alan_Yüzdesi = AG.LND.FRST.ZS, CO2_Emisyonu = EN.ATM.CO2E.KT, NOX_Emisyonu = EN.ATM.NOXE.KT.CE)

# Düzenlenmiş veriyi görüntüleme
print(data_tidy)
##              Ülke  Yıl Ormanlık_Alan_Yüzdesi CO2_Emisyonu NOX_Emisyonu
## 1         Germany 2010              32.73087     773069.1     39312.25
## 2         Germany 2011              32.73755     746477.3     37769.95
## 3         Germany 2012              32.74517     760127.7     37851.69
## 4         Germany 2013              32.71899     776151.8     38480.93
## 5         Germany 2014              32.72284     736011.7     39371.73
## 6         Germany 2015              32.73233     742314.4     38498.27
## 7         Germany 2016              32.68548     747147.2     37800.34
## 8         Germany 2017              32.68455     732204.2     36710.42
## 9         Germany 2018              32.68361     707770.2     34841.25
## 10        Germany 2019              32.68268     658693.5     35033.81
## 11        Turkiye 2010              27.39379     297814.0     26264.64
## 12        Turkiye 2011              27.53599     318641.2     26143.70
## 13        Turkiye 2012              27.67819     329797.8     28311.37
## 14        Turkiye 2013              27.82040     319088.6     30776.94
## 15        Turkiye 2014              27.96260     341671.5     30613.94
## 16        Turkiye 2015              28.10480     353413.8     31017.92
## 17        Turkiye 2016              28.10480     376399.0     33270.75
## 18        Turkiye 2017              28.26353     418098.2     32868.76
## 19        Turkiye 2018              28.46609     414111.9     33416.42
## 20        Turkiye 2019              28.66879     398772.9     34965.33
## 21 United Kingdom 2010              12.64415     482646.2     29846.60
## 22 United Kingdom 2011              12.72352     445648.4     28901.98
## 23 United Kingdom 2012              12.80288     467831.0     28496.25
## 24 United Kingdom 2013              12.88224     453778.1     28499.68
## 25 United Kingdom 2014              12.96160     415609.0     29296.64
## 26 United Kingdom 2015              13.04096     401075.3     29190.95
## 27 United Kingdom 2016              13.05750     382154.9     28926.00
## 28 United Kingdom 2017              13.07816     366844.1     29187.60
## 29 United Kingdom 2018              13.11536     360555.9     28954.55
## 30 United Kingdom 2019              13.15256     345934.3     29218.82

Veri Görselleştirme:

# ggplot2 ve plotly paketlerini yükleme
library(ggplot2)
library(plotly)

# ggplot2 ile basit bir çizim oluşturma
ggplot(data_tidy, aes(x = Yıl)) +
  geom_line(aes(y = Ormanlık_Alan_Yüzdesi, color = Ülke)) +
  labs(title = "Ormanlık Alan Yüzdesi",
       x = "Yıl",
       y = "Ormanlık Alan Yüzdesi",
       color = "Ülke") +
  theme_minimal()

# plotly ile interaktif bir çizim oluşturma
plot_ly(data_tidy, x = ~Yıl, y = ~CO2_Emisyonu, color = ~Ülke, type = 'scatter', mode = 'lines') %>%
  add_lines() %>%
  layout(title = "CO2 Emisyonu",
         xaxis = list(title = "Yıl"),
         yaxis = list(title = "CO2 Emisyonu"),
         legend = list(title = "Ülke"))

Bu kod parçacığı, veriyi ggplot2 ve plotly paketleriyle görselleştirir. İlk olarak, ggplot2 ile basit bir çizim oluşturulur. Bu çizim, yıllara göre ormanlık alan yüzdesini farklı ülkelerin renklerine göre gösterir. Daha sonra, plotly ile interaktif bir çizim oluşturulur. Bu çizim, yıllara göre CO2 emisyonunu farklı ülkelerin renklerine göre gösterir ve kullanıcıların çizime yakınlaştırma, kaydırma ve daha fazla etkileşimli özelliklere erişmesine olanak tanır.

dplyr Paketi Kullanımı:

# dplyr paketini yükleme
library(dplyr)

# Veriyi işleme
data_processed <- data_tidy %>%
  # Veriyi filtreleme: Yıllara göre 2015 ve sonrasını seçme
  filter(Yıl >= 2015) %>%
  # Veriyi düzenleme: Ülkeleri gruplama ve her bir ülke için CO2 emisyonunun ortalamasını hesaplama
  group_by(Ülke) %>%
  summarize(Ortalama_CO2_Emisyonu = mean(CO2_Emisyonu, na.rm = TRUE))

# İşlenmiş veriyi görüntüleme
print(data_processed)
## # A tibble: 3 × 2
##   Ülke           Ortalama_CO2_Emisyonu
##   <chr>                          <dbl>
## 1 Germany                      717626.
## 2 Turkiye                      392159.
## 3 United Kingdom               371313.

Bu kod parçacığı, dplyr paketini kullanarak veriyi işler. İlk olarak, filter() işleviyle yalnızca 2015 ve sonrasındaki verileri filtreleriz. Daha sonra, group_by() ve summarize() işlevlerini kullanarak ülkeleri gruplarız ve her bir ülke için CO2 emisyonunun ortalamasını hesaplarız.

Sonuçlar, her bir ülkenin 2015 ve sonrası dönemdeki CO2 emisyonunun ortalamasını içeren bir veri çerçevesi olarak görüntülenir. Bu adımlar, veriyi daha anlaşılır bir şekilde işlememize ve sonuçları okunabilir bir şekilde görüntülememize olanak tanır.

# Veriyi görselleştirme
ggplot(data_processed, aes(x = Ülke, y = Ortalama_CO2_Emisyonu)) +
  geom_bar(stat = "identity", fill = "skyblue") +
  labs(title = "2015 ve Sonrası Ortalama CO2 Emisyonu",
       x = "Ülke",
       y = "Ortalama CO2 Emisyonu") +
  theme_minimal()

grafikte gösterilen bilgilerin anlaşılmasına yardımcı olacak ve grafik üzerinde yapılan karşılaştırmaların amacını açıklayacaktır.