GEREKLİ PAKETLERİN YÜKLENMESİ

library(WDI)

WDI → Dünya Bankası (World Bank) verilerini indirmek için

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

tidyverse → veri temizleme, filtreleme ve düzenleme işlemleri için

library(ggplot2)

ggplot2 → grafik çizimleri için

DÜNYA BANKASINDAN VERİLERİN İNDİRİLMESİ

data <- WDI(
  indicator = c(
    "AG.LND.AGRI.ZS",    # Tarımsal Arazi (%)
    "AG.LND.FRST.K2"    # Orman Alanı (km²)
  ),
  start = 2000,
  end = 2020
)

Açıklama:

. Dünya Bankası’ndan 2000–2020 yılları arasındaki veriler çekilmektedir.

. AG.LND.AGRI.ZS → Tarımsal Arazi Oranı

. AG.LND.FRST.K2 → Orman Alanı Büyüklüğü

EKSİK GÖZLEMLERİN TEMİZLENMESİ

data <- data %>%
  filter(
    !is.na(AG.LND.AGRI.ZS),
    !is.na(AG.LND.FRST.K2)
  )

Açıklama:

. Regresyon ve grafiklerde hata almamak için.

. Tarımsal arazi veya orman alanı bilgisi eksik olan gözlemler veri setinden çıkarılır.

TÜRKİYE İÇİN ZAMAN SERİSİ VERİSİ

dataTR <- data %>% filter(country == "Turkiye")

Açıklama:

. Sadece Türkiye gözlemleri seçilerek.

. Türkiye’nin yıllar içindeki değişimi incelenir (zaman serisi analizi).

TÜRKİYE ZAMAN SERİSİ GRAFİKLERİ

Tarımsal Arazi (%)

ggplot(dataTR, aes(x = year, y = AG.LND.AGRI.ZS)) +
  geom_line()

Açıklama:

. Türkiye’de tarımsal arazi oranının yıllar içindeki seyrini gösterir.

Orman Alanı (km²)

ggplot(dataTR, aes(x = year, y = AG.LND.FRST.K2)) +
  geom_line()

Açıklama:

. Türkiye’de orman alanının zaman içindeki değişimini gösterir.

KESİT VERİLERİN OLUŞTURULMASI

Seçilen Yıllar: 2000 – 2005 – 2010 – 2015 – 2020

data2000 <- data %>% filter(year == 2000)
data2005 <- data %>% filter(year == 2005)
data2010 <- data %>% filter(year == 2010)
data2015 <- data %>% filter(year == 2015)
data2020 <- data %>% filter(year == 2020)

Açıklama:

. Her bir veri seti aynı yıl içinde farklı ülkeleri içerir.

. Bu veri yapısı kesit veri (cross-section) olarak adlandırılır.

KESİT VERİLER İÇİN GRAFİKSEL KARŞILAŞTIRMA (ÖRNEK: 2005)

ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)
## `geom_smooth()` using formula = 'y ~ x'

Açıklama:

. 2005 yılında ülkeler arasında.

. Orman alanı ile tarımsal arazi oranı arasındaki ilişkiyi görsel olarak gösterir.

. geom_smooth(method = “lm”) → doğrusal regresyon çizgisi ekler.

BASİT DOĞRUSAL REGRESYON MODELLERİ

Kurulan model:

                        AG.LND.AGRI.ZS=β0​+β1​⋅AG.LND.FRST.K2
m2000 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2000)
summary(m2000)
## 
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2000)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -37.281 -16.931   0.582  12.889  47.626 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     3.784e+01  1.385e+00  27.328   <2e-16 ***
## AG.LND.FRST.K2 -7.192e-08  2.758e-07  -0.261    0.794    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.86 on 251 degrees of freedom
## Multiple R-squared:  0.0002709,  Adjusted R-squared:  -0.003712 
## F-statistic: 0.06801 on 1 and 251 DF,  p-value: 0.7945

Açıklama:

. 2000 yılında orman alanının tarımsal arazi üzerindeki etkisi ölçülür.

m2005 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2005)
summary(m2005)
## 
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2005)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -36.907 -16.915   0.994  11.687  47.376 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     3.737e+01  1.370e+00  27.274   <2e-16 ***
## AG.LND.FRST.K2 -6.201e-08  2.751e-07  -0.225    0.822    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.65 on 251 degrees of freedom
## Multiple R-squared:  0.0002024,  Adjusted R-squared:  -0.003781 
## F-statistic: 0.05081 on 1 and 251 DF,  p-value: 0.8218

Açıklama:

. 2005 yılı için aynı ilişkinin regresyon analizi yapılır.

m2010 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2010)
summary(m2010)
## 
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2010)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -36.817 -16.117   1.054  11.132  45.152 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     3.731e+01  1.362e+00  27.393   <2e-16 ***
## AG.LND.FRST.K2 -5.845e-08  2.765e-07  -0.211    0.833    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.62 on 253 degrees of freedom
## Multiple R-squared:  0.0001766,  Adjusted R-squared:  -0.003775 
## F-statistic: 0.0447 on 1 and 253 DF,  p-value: 0.8327

Açıklama:

. 2010 yılında ilişkinin yönü ve gücü incelenir.

m2015 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2015)
summary(m2015)
## 
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2015)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -37.138 -16.324   1.592  11.876  44.975 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     3.769e+01  1.363e+00  27.654   <2e-16 ***
## AG.LND.FRST.K2 -5.196e-08  2.777e-07  -0.187    0.852    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.71 on 255 degrees of freedom
## Multiple R-squared:  0.0001372,  Adjusted R-squared:  -0.003784 
## F-statistic: 0.03499 on 1 and 255 DF,  p-value: 0.8518

Açıklama:

. 2015 yılı kesit verisi için basit regresyon modeli kurulur.

m2020 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2020)
summary(m2020)
## 
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2020)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -37.229 -16.402   1.707  11.656  46.826 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     3.774e+01  1.375e+00  27.452   <2e-16 ***
## AG.LND.FRST.K2 -5.338e-08  2.821e-07  -0.189     0.85    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.9 on 255 degrees of freedom
## Multiple R-squared:  0.0001404,  Adjusted R-squared:  -0.003781 
## F-statistic: 0.03581 on 1 and 255 DF,  p-value: 0.8501

Açıklama:

. 2020 yılında ülkeler arası ilişki analiz edilir.

GENEL DEĞERLENDİRME

Beş farklı yıl için yapılan kesit regresyon analizleri, orman alanı ile tarımsal arazi oranı arasındaki ilişkinin zaman içinde değiştiğini göstermektedir. Bu durum ülkelerin arazi kullanım politikalarının ve ekonomik yapıların yıllar itibarıyla farklılaşmasından kaynaklanmaktadır.

1. TÜRKİYE – ZAMAN SERİSİ (TARIMSAL ARAZİ)

ggplot(dataTR, aes(x = year, y = AG.LND.AGRI.ZS)) +
  geom_line(size = 1) +
  geom_point() +
  labs(
    title = "Türkiye'de Tarımsal Arazi Oranı (Zaman Serisi)",
    x = "Yıl",
    y = "Tarımsal Arazi (%)"
  )
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Amaç:

. Türkiye’de tarımsal arazi oranının yıllar içindeki eğilimini göstermek.

2. TÜRKİYE – ZAMAN SERİSİ (ORMAN ALANI)

ggplot(dataTR, aes(x = year, y = AG.LND.FRST.K2)) +
  geom_line(size = 1) +
  geom_point() +
  labs(
    title = "Türkiye'de Orman Alanı (Zaman Serisi)",
    x = "Yıl",
    y = "Orman Alanı (km²)"
  )

Amaç:

. Türkiye’de orman alanının zaman içindeki değişimini analiz etmek.

3. TÜRKİYE – İKİ DEĞİŞKEN BİRLİKTE

ggplot(dataTR, aes(x = year)) +
  geom_line(aes(y = AG.LND.AGRI.ZS, color = "Tarımsal Arazi (%)"), size = 1) +
  geom_line(aes(y = AG.LND.FRST.K2 / 1000, color = "Orman Alanı (km² / 1000)"), size = 1) +
  labs(
    title = "Türkiye'de Tarımsal Arazi ve Orman Alanı",
    x = "Yıl",
    y = "Değer",
    color = "Değişken"
  )

Amaç:

. İki değişkenin birlikte hareketini görmek (karşılaştırmalı zaman serisi).

4. KESİT VERİ – DAĞILIM GRAFİĞİ (2005)

ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
  geom_point(alpha = 0.6) +
  labs(
    title = "2005 Yılı: Orman Alanı ve Tarımsal Arazi (Kesit Veri)",
    x = "Orman Alanı (km²)",
    y = "Tarımsal Arazi (%)"
  )

Amaç:

. 2005 yılında ülkeler arası ilişkinin dağılımını görmek.

5. REGRESYON GRAFİĞİ (2005)

ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
  geom_point(alpha = 0.6) +
  geom_smooth(method = "lm", se = TRUE) +
  labs(
    title = "2005 Yılı: Regresyon Grafiği",
    x = "Orman Alanı (km²)",
    y = "Tarımsal Arazi (%)"
  )
## `geom_smooth()` using formula = 'y ~ x'

Amaç:

.Regresyon sonucunu görsel olarak desteklemek.

6. KESİT VERİ – YILLARA GÖRE KUTU GRAFİĞİ

Tarımsal Arazi

data_selected <- data %>%
  filter(year %in% c(2000, 2005, 2010, 2015, 2020))

ggplot(data_selected, aes(x = factor(year), y = AG.LND.AGRI.ZS)) +
  geom_boxplot() +
  labs(
    title = "Yıllara Göre Tarımsal Arazi Dağılımı",
    x = "Yıl",
    y = "Tarımsal Arazi (%)"
  )

Amaç:

.Yıllar itibarıyla ülkeler arası dağılımın değişimini göstermek.

7. KESİT VERİ – KUTU GRAFİĞİ

Orman Alanı

ggplot(data_selected, aes(x = factor(year), y = AG.LND.FRST.K2)) +
  geom_boxplot() +
  labs(
    title = "Yıllara Göre Orman Alanı Dağılımı",
    x = "Yıl",
    y = "Orman Alanı (km²)"
  )

Amaç:

.Orman alanının ülkeler arasında yıllara göre nasıl farklılaştığını göstermek.

8. TÜRKİYE – REGRESYON GRAFİĞİ (ZAMAN SERİSİ)

ggplot(dataTR, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  labs(
    title = "Türkiye: Orman Alanı ve Tarımsal Arazi İlişkisi",
    x = "Orman Alanı (km²)",
    y = "Tarımsal Arazi (%)"
  )
## `geom_smooth()` using formula = 'y ~ x'

Amaç:

.Türkiye özelinde iki değişken arasındaki uzun dönemli ilişkiyi görmek.

SONUÇ

Grafikler, hem zaman serisi hem de kesit veri perspektifinden oluşturularak analiz zenginleştirilmiştir. Zaman serisi grafiklerinde Türkiye’de tarımsal arazi ve orman alanının yıllar içindeki eğilimleri incelenmiş, kesit veri grafiklerinde ise ülkeler arası dağılım ve regresyon ilişkisi görselleştirilmiştir.