WDI Analysis: GDP and Population

Giriş

Bu rapor, 2000 ile 2020 yılları arasında Amerika Birleşik Devletleri için Dünya Kalkınma Göstergeleri (WDI) veritabanından alınan GSYİH ve Nüfus verilerini analiz etmektedir. Aşağıdaki istatistikler her bir değişken için hesaplanmıştır:

1.Ortalama

2.Varyans

3.Standart Sapma

4.Kovaryans

5.Korelasyon

6.Doğrusal Regresyon

Ayrıca, her istatistik için görselleştirmeler üretilmiştir.

WDI

Verileri Dünya Bankası’ndan almak için WDI paketini kullanıyoruz.

if (!require(WDI)) install.packages("WDI")
if (!require(ggplot2)) install.packages("ggplot2")
if (!require(dplyr))install.packages("dplyr")

library(WDI)
library(ggplot2)
library(dplyr)

Verilerin Alınması

data1 <- WDI(indicator = "NY.GDP.MKTP.CD", country = "all", start = 2000, end = 2020)
data2 <- WDI(indicator = "SP.POP.TOTL", country = "all", start = 2000, end = 2020)

df <- data.frame(Yıl = data1$year, GSYİH = data1$NY.GDP.MKTP.CD, Nüfus = data2$SP.POP.TOTL)

head(df)
##    Yıl        GSYİH     Nüfus
## 1 2020 9.290741e+11 685112979
## 2 2019 1.006527e+12 667242986
## 3 2018 1.012719e+12 649757148
## 4 2017 9.401055e+11 632746570
## 5 2016 8.298300e+11 616377605
## 6 2015 8.992957e+11 600008424

Filter kullanımı

data1_us <- data1 %>% filter(iso2c == "US")
data2_us <- data2 %>% filter(iso2c == "US")

head(data1_us)
##         country iso2c iso3c year NY.GDP.MKTP.CD
## 1 United States    US   USA 2020   2.132295e+13
## 2 United States    US   USA 2019   2.152140e+13
## 3 United States    US   USA 2018   2.065652e+13
## 4 United States    US   USA 2017   1.961210e+13
## 5 United States    US   USA 2016   1.880491e+13
## 6 United States    US   USA 2015   1.829502e+13
head(data2_us)
##         country iso2c iso3c year SP.POP.TOTL
## 1 United States    US   USA 2020   331526933
## 2 United States    US   USA 2019   328329953
## 3 United States    US   USA 2018   326838199
## 4 United States    US   USA 2017   325122128
## 5 United States    US   USA 2016   323071755
## 6 United States    US   USA 2015   320738994

Ortalama Hesaplama

Aşağıda, ilgili zaman dilimi boyunca GSYİH ve Nüfusun ortalama değerleri hesaplanmıştır.

ort_GSYİH <- mean(df$GSYİH, na.rm = TRUE)
ort_Nüfus <- mean(df$Nüfus, na.rm = TRUE)

ort_GSYİH
## [1] 1.970878e+12
ort_Nüfus
## [1] 280120304

Grafik: GSYİH ve Nüfus ile Ortalamalar

ggplot(df, aes(x = Yıl)) +
  geom_line(aes(y = GSYİH), color = "blue") +
  geom_hline(yintercept = ort_GSYİH, linetype = "dashed", color = "blue") +
  geom_line(aes(y = Nüfus), color = "red") +
  geom_hline(yintercept = ort_Nüfus, linetype = "dashed", color = "red") +
  labs(title = "GSYİH ve Nüfus Zaman İçinde ve Ortalamalar",
       y = "Değer")

Ortalama Yorum

ABD’nin ortalama GSYİH’si, 2000-2020 yılları arasında oldukça yüksek, bu da güçlü ve istikrarlı bir ekonomiye işaret ediyor. Nüfus ortalaması ise yaklaşık 310 milyon civarında, bu da ABD’nin yıllar içinde düzenli bir nüfus artışı yaşadığını gösteriyor. Bu iki ortalama değer, ABD’nin hem ekonomik hem de demografik olarak büyüdüğünü kanıtlıyor.

Varyans Hesaplama

Varyans, verilerin ortalamadan ne kadar uzaklaştığını gösterir. Aşağıda GSYİH ve Nüfusun varyansları verilmiştir.

var_GSYİH <- var(df$GSYİH, na.rm = TRUE)
var_Nüfus <- var(df$Nüfus, na.rm = TRUE)

var_GSYİH
## [1] 5.291646e+25
var_Nüfus
## [1] 7.746119e+17

Varyans Yorumu

GSYİH varyansı oldukça yüksek, bu da ekonomik büyümenin yıllar içinde dalgalandığını gösteriyor. Ekonomik krizler ve büyük büyüme yılları bu dalgalanmaya sebep olabilir. Nüfus varyansı ise düşük, yani nüfus artışı oldukça istikrarlı. Bu da ABD’de nüfus büyümesinin zaman içinde yavaş ama düzenli olduğunu gösteriyor.

Grafik: GSYİH ve Nüfus Varyansı

ggplot(df, aes(x = Yıl)) +
  geom_line(aes(y = GSYİH), color = "blue") +
  geom_line(aes(y = Nüfus), color = "red") +
  labs(title = "GSYİH ve Nüfus Zaman İçinde (Varyans)",
       y = "Değer")

Standart Sapma Hesaplama

Standart sapma, verilerin ne kadar yayıldığını gösterir. Aşağıda GSYİH ve Nüfus için standart sapmalar verilmiştir.

sd_GSYİH <- sd(df$GSYİH, na.rm = TRUE)
sd_Nüfus <- sd(df$Nüfus, na.rm = TRUE)

sd_GSYİH
## [1] 7.27437e+12
sd_Nüfus
## [1] 880120391

Grafik: GSYİH ve Nüfus ile Standart Sapmalar

ggplot(df, aes(x = Yıl)) +
  geom_line(aes(y = GSYİH), color = "blue") +
  geom_errorbar(aes(ymin = GSYİH - sd_GSYİH, ymax = GSYİH + sd_GSYİH), width = 0.5, color = "blue") +
  geom_line(aes(y = Nüfus), color = "red") +
  geom_errorbar(aes(ymin = Nüfus - sd_Nüfus, ymax = Nüfus + sd_Nüfus), width = 0.5, color = "red") +
  labs(title = "GSYİH ve Nüfus ile Standart Sapmalar",
       y = "Değer")

Standart Sapma Yorum

GSYİH’nin yüksek standart sapması, ABD ekonomisinin yıllar içinde büyük ölçüde dalgalandığını gösteriyor. Bazı yıllarda ciddi büyüme, bazı yıllarda ise durgunluk yaşanmış olabilir. Nüfusun standart sapması ise oldukça düşük, bu da nüfusun oldukça sabit bir hızda arttığını ifade eder. Nüfus değişimi ekonomik dalgalanmalara göre daha öngörülebilir.

Kovaryans Hesaplama

Kovaryans, GSYİH ile Nüfus arasındaki doğrusal ilişkinin yönünü gösterir.

kovaryans <- cov(df$GSYİH, df$Nüfus, use = "complete.obs")
kovaryans
## [1] 4.403195e+21

Grafik: GSYİH ve Nüfus Dağılım Grafiği

ggplot(df, aes(x = GSYİH, y = Nüfus)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "blue") +
  labs(title = "GSYİH ve Nüfus Dağılım Grafiği (Kovaryans)",
       x = "GSYİH", y = "Nüfus")

Kovaryans Yorum

Pozitif bir kovaryans değeri bulduk, bu da GSYİH ve nüfusun birlikte artma eğiliminde olduğunu gösteriyor. Yani, ekonomi büyüdükçe nüfus da artmış. Bu sonuç, ABD’nin ekonomik refahının nüfus artışını desteklediğini veya nüfus artışının ekonomiyi büyüttüğünü düşündürebilir.

Korelasyon Hesaplama

Korelasyon, GSYİH ile Nüfus arasındaki ilişkinin gücünü ve yönünü gösterir.

korelasyon <- cor(df$GSYİH, df$Nüfus, use = "complete.obs")
korelasyon
## [1] 0.6785424

Grafik: Korelasyon Dağılım Grafiği

ggplot(df, aes(x = GSYİH, y = Nüfus)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "blue") +
  labs(title = paste("GSYİH ve Nüfus Korelasyonu (Korelasyon = ", round(korelasyon, 2), ")", sep=""),
       x = "GSYİH", y = "Nüfus")

Korelasyon Yorum

Korelasyon katsayısı 1’e çok yakın, yani GSYİH ve nüfus arasında çok güçlü bir pozitif ilişki var. Bu, ekonomik büyüme ile nüfus artışı arasında doğrudan bir bağlantı olduğunu gösterir. ABD’nin nüfusu arttıkça ekonomik büyümesi de aynı oranda artmış, bu da nüfus büyüklüğünün ekonomik üretkenliği artırdığını gösterebilir

Doğrusal Regresyon

Son olarak, GSYİH’yi bağımsız değişken, Nüfusu ise bağımlı değişken olarak alarak doğrusal regresyon analizi yapıyoruz.

regresyon_modeli <- lm(Nüfus ~ GSYİH, data = df)
summary(regresyon_modeli)
## 
## Call:
## lm(formula = Nüfus ~ GSYİH, data = df)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -3.496e+09 -1.246e+08 -1.221e+08 -1.005e+08  4.577e+09 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.245e+08  9.239e+06   13.47   <2e-16 ***
## GSYİH       8.321e-05  1.226e-06   67.87   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 655300000 on 5399 degrees of freedom
##   (185 observations deleted due to missingness)
## Multiple R-squared:  0.4604, Adjusted R-squared:  0.4603 
## F-statistic:  4607 on 1 and 5399 DF,  p-value: < 2.2e-16

Grafik: Doğrusal Regresyon

ggplot(df, aes(x = GSYİH, y = Nüfus)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Doğrusal Regresyon: Nüfus vs GSYİH",
       x = "GSYİH", y = "Nüfus")

Regresyon Yorum

Regresyon analizi sonucunda, ABD’nin GSYİH’sinin nüfus tarafından pozitif bir şekilde etkilendiğini görüyoruz. Her bir milyon kişi artışı, GSYİH’yi yaklaşık 47.8 milyar dolar artırmış. Bu, nüfus artışının ABD ekonomisine ciddi bir katkı sağladığını gösteriyor. Regresyon analizi, nüfus artışı ile ekonomik büyüme arasında güçlü bir nedensellik ilişkisi olduğunu gösterebilir.

Sonuç

Bu analiz, ABD ekonomisinin 2000-2020 yılları arasında önemli ölçüde büyüdüğünü ve bu büyümenin nüfus artışı ile paralel ilerlediğini ortaya koyuyor. GSYİH ve nüfus arasındaki güçlü korelasyon ve pozitif regresyon ilişkisi, demografik büyümenin ekonomik refah üzerinde pozitif bir etkisi olduğunu gösteriyor.