library(WDI)
WDI → Dünya Bankası (World Bank) verilerini indirmek için
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
tidyverse → veri temizleme, filtreleme ve düzenleme işlemleri için
library(ggplot2)
ggplot2 → grafik çizimleri için
data <- WDI(
indicator = c(
"AG.LND.AGRI.ZS", # Tarımsal Arazi (%)
"AG.LND.FRST.K2" # Orman Alanı (km²)
),
start = 2000,
end = 2020
)
Açıklama:
. Dünya Bankası’ndan 2000–2020 yılları arasındaki veriler çekilmektedir.
. AG.LND.AGRI.ZS → Tarımsal Arazi Oranı
. AG.LND.FRST.K2 → Orman Alanı Büyüklüğü
data <- data %>%
filter(
!is.na(AG.LND.AGRI.ZS),
!is.na(AG.LND.FRST.K2)
)
Açıklama:
. Regresyon ve grafiklerde hata almamak için.
. Tarımsal arazi veya orman alanı bilgisi eksik olan gözlemler veri setinden çıkarılır.
dataTR <- data %>% filter(country == "Turkiye")
Açıklama:
. Sadece Türkiye gözlemleri seçilerek.
. Türkiye’nin yıllar içindeki değişimi incelenir (zaman serisi analizi).
Tarımsal Arazi (%)
ggplot(dataTR, aes(x = year, y = AG.LND.AGRI.ZS)) +
geom_line()
Açıklama:
. Türkiye’de tarımsal arazi oranının yıllar içindeki seyrini gösterir.
Orman Alanı (km²)
ggplot(dataTR, aes(x = year, y = AG.LND.FRST.K2)) +
geom_line()
Açıklama:
. Türkiye’de orman alanının zaman içindeki değişimini gösterir.
Seçilen Yıllar: 2000 – 2005 – 2010 – 2015 – 2020
data2000 <- data %>% filter(year == 2000)
data2005 <- data %>% filter(year == 2005)
data2010 <- data %>% filter(year == 2010)
data2015 <- data %>% filter(year == 2015)
data2020 <- data %>% filter(year == 2020)
Açıklama:
. Her bir veri seti aynı yıl içinde farklı ülkeleri içerir.
. Bu veri yapısı kesit veri (cross-section) olarak adlandırılır.
ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
## `geom_smooth()` using formula = 'y ~ x'
Açıklama:
. 2005 yılında ülkeler arasında.
. Orman alanı ile tarımsal arazi oranı arasındaki ilişkiyi görsel olarak gösterir.
. geom_smooth(method = “lm”) → doğrusal regresyon çizgisi ekler.
Kurulan model:
AG.LND.AGRI.ZS=β0+β1⋅AG.LND.FRST.K2
m2000 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2000)
summary(m2000)
##
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2000)
##
## Residuals:
## Min 1Q Median 3Q Max
## -37.281 -16.931 0.582 12.889 47.626
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.784e+01 1.385e+00 27.328 <2e-16 ***
## AG.LND.FRST.K2 -7.192e-08 2.758e-07 -0.261 0.794
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.86 on 251 degrees of freedom
## Multiple R-squared: 0.0002709, Adjusted R-squared: -0.003712
## F-statistic: 0.06801 on 1 and 251 DF, p-value: 0.7945
Açıklama:
. 2000 yılında orman alanının tarımsal arazi üzerindeki etkisi ölçülür.
m2005 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2005)
summary(m2005)
##
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2005)
##
## Residuals:
## Min 1Q Median 3Q Max
## -36.907 -16.915 0.994 11.687 47.376
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.737e+01 1.370e+00 27.274 <2e-16 ***
## AG.LND.FRST.K2 -6.201e-08 2.751e-07 -0.225 0.822
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.65 on 251 degrees of freedom
## Multiple R-squared: 0.0002024, Adjusted R-squared: -0.003781
## F-statistic: 0.05081 on 1 and 251 DF, p-value: 0.8218
Açıklama:
. 2005 yılı için aynı ilişkinin regresyon analizi yapılır.
m2010 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2010)
summary(m2010)
##
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2010)
##
## Residuals:
## Min 1Q Median 3Q Max
## -36.817 -16.117 1.054 11.132 45.152
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.731e+01 1.362e+00 27.393 <2e-16 ***
## AG.LND.FRST.K2 -5.845e-08 2.765e-07 -0.211 0.833
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.62 on 253 degrees of freedom
## Multiple R-squared: 0.0001766, Adjusted R-squared: -0.003775
## F-statistic: 0.0447 on 1 and 253 DF, p-value: 0.8327
Açıklama:
. 2010 yılında ilişkinin yönü ve gücü incelenir.
m2015 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2015)
summary(m2015)
##
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2015)
##
## Residuals:
## Min 1Q Median 3Q Max
## -37.138 -16.324 1.592 11.876 44.975
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.769e+01 1.363e+00 27.654 <2e-16 ***
## AG.LND.FRST.K2 -5.196e-08 2.777e-07 -0.187 0.852
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.71 on 255 degrees of freedom
## Multiple R-squared: 0.0001372, Adjusted R-squared: -0.003784
## F-statistic: 0.03499 on 1 and 255 DF, p-value: 0.8518
Açıklama:
. 2015 yılı kesit verisi için basit regresyon modeli kurulur.
m2020 <- lm(AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2020)
summary(m2020)
##
## Call:
## lm(formula = AG.LND.AGRI.ZS ~ AG.LND.FRST.K2, data = data2020)
##
## Residuals:
## Min 1Q Median 3Q Max
## -37.229 -16.402 1.707 11.656 46.826
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.774e+01 1.375e+00 27.452 <2e-16 ***
## AG.LND.FRST.K2 -5.338e-08 2.821e-07 -0.189 0.85
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.9 on 255 degrees of freedom
## Multiple R-squared: 0.0001404, Adjusted R-squared: -0.003781
## F-statistic: 0.03581 on 1 and 255 DF, p-value: 0.8501
Açıklama:
. 2020 yılında ülkeler arası ilişki analiz edilir.
Beş farklı yıl için yapılan kesit regresyon analizleri, orman alanı ile tarımsal arazi oranı arasındaki ilişkinin zaman içinde değiştiğini göstermektedir. Bu durum ülkelerin arazi kullanım politikalarının ve ekonomik yapıların yıllar itibarıyla farklılaşmasından kaynaklanmaktadır.
ggplot(dataTR, aes(x = year, y = AG.LND.AGRI.ZS)) +
geom_line(size = 1) +
geom_point() +
labs(
title = "Türkiye'de Tarımsal Arazi Oranı (Zaman Serisi)",
x = "Yıl",
y = "Tarımsal Arazi (%)"
)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Amaç:
. Türkiye’de tarımsal arazi oranının yıllar içindeki eğilimini göstermek.
ggplot(dataTR, aes(x = year, y = AG.LND.FRST.K2)) +
geom_line(size = 1) +
geom_point() +
labs(
title = "Türkiye'de Orman Alanı (Zaman Serisi)",
x = "Yıl",
y = "Orman Alanı (km²)"
)
Amaç:
. Türkiye’de orman alanının zaman içindeki değişimini analiz etmek.
ggplot(dataTR, aes(x = year)) +
geom_line(aes(y = AG.LND.AGRI.ZS, color = "Tarımsal Arazi (%)"), size = 1) +
geom_line(aes(y = AG.LND.FRST.K2 / 1000, color = "Orman Alanı (km² / 1000)"), size = 1) +
labs(
title = "Türkiye'de Tarımsal Arazi ve Orman Alanı",
x = "Yıl",
y = "Değer",
color = "Değişken"
)
Amaç:
. İki değişkenin birlikte hareketini görmek (karşılaştırmalı zaman serisi).
ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
geom_point(alpha = 0.6) +
labs(
title = "2005 Yılı: Orman Alanı ve Tarımsal Arazi (Kesit Veri)",
x = "Orman Alanı (km²)",
y = "Tarımsal Arazi (%)"
)
Amaç:
. 2005 yılında ülkeler arası ilişkinin dağılımını görmek.
ggplot(data2005, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
geom_point(alpha = 0.6) +
geom_smooth(method = "lm", se = TRUE) +
labs(
title = "2005 Yılı: Regresyon Grafiği",
x = "Orman Alanı (km²)",
y = "Tarımsal Arazi (%)"
)
## `geom_smooth()` using formula = 'y ~ x'
Amaç:
.Regresyon sonucunu görsel olarak desteklemek.
Tarımsal Arazi
data_selected <- data %>%
filter(year %in% c(2000, 2005, 2010, 2015, 2020))
ggplot(data_selected, aes(x = factor(year), y = AG.LND.AGRI.ZS)) +
geom_boxplot() +
labs(
title = "Yıllara Göre Tarımsal Arazi Dağılımı",
x = "Yıl",
y = "Tarımsal Arazi (%)"
)
Amaç:
.Yıllar itibarıyla ülkeler arası dağılımın değişimini göstermek.
Orman Alanı
ggplot(data_selected, aes(x = factor(year), y = AG.LND.FRST.K2)) +
geom_boxplot() +
labs(
title = "Yıllara Göre Orman Alanı Dağılımı",
x = "Yıl",
y = "Orman Alanı (km²)"
)
Amaç:
.Orman alanının ülkeler arasında yıllara göre nasıl farklılaştığını göstermek.
ggplot(dataTR, aes(x = AG.LND.FRST.K2, y = AG.LND.AGRI.ZS)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
labs(
title = "Türkiye: Orman Alanı ve Tarımsal Arazi İlişkisi",
x = "Orman Alanı (km²)",
y = "Tarımsal Arazi (%)"
)
## `geom_smooth()` using formula = 'y ~ x'
Amaç:
.Türkiye özelinde iki değişken arasındaki uzun dönemli ilişkiyi görmek.
Grafikler, hem zaman serisi hem de kesit veri perspektifinden oluşturularak analiz zenginleştirilmiştir. Zaman serisi grafiklerinde Türkiye’de tarımsal arazi ve orman alanının yıllar içindeki eğilimleri incelenmiş, kesit veri grafiklerinde ise ülkeler arası dağılım ve regresyon ilişkisi görselleştirilmiştir.