Bu rapor, 2000 ile 2020 yılları arasında Amerika Birleşik Devletleri için Dünya Kalkınma Göstergeleri (WDI) veritabanından alınan GSYİH ve Nüfus verilerini analiz etmektedir. Aşağıdaki istatistikler her bir değişken için hesaplanmıştır:
1.Ortalama
2.Varyans
3.Standart Sapma
4.Kovaryans
5.Korelasyon
6.Doğrusal Regresyon
Ayrıca, her istatistik için görselleştirmeler üretilmiştir.
Verileri Dünya Bankası’ndan almak için WDI paketini kullanıyoruz.
if (!require(WDI)) install.packages("WDI")
if (!require(ggplot2)) install.packages("ggplot2")
if (!require(dplyr))install.packages("dplyr")
library(WDI)
library(ggplot2)
library(dplyr)
data1 <- WDI(indicator = "NY.GDP.MKTP.CD", country = "all", start = 2000, end = 2020)
data2 <- WDI(indicator = "SP.POP.TOTL", country = "all", start = 2000, end = 2020)
df <- data.frame(Yıl = data1$year, GSYİH = data1$NY.GDP.MKTP.CD, Nüfus = data2$SP.POP.TOTL)
head(df)
## Yıl GSYİH Nüfus
## 1 2020 9.290741e+11 685112979
## 2 2019 1.006527e+12 667242986
## 3 2018 1.012719e+12 649757148
## 4 2017 9.401055e+11 632746570
## 5 2016 8.298300e+11 616377605
## 6 2015 8.992957e+11 600008424
data1_us <- data1 %>% filter(iso2c == "US")
data2_us <- data2 %>% filter(iso2c == "US")
head(data1_us)
## country iso2c iso3c year NY.GDP.MKTP.CD
## 1 United States US USA 2020 2.132295e+13
## 2 United States US USA 2019 2.152140e+13
## 3 United States US USA 2018 2.065652e+13
## 4 United States US USA 2017 1.961210e+13
## 5 United States US USA 2016 1.880491e+13
## 6 United States US USA 2015 1.829502e+13
head(data2_us)
## country iso2c iso3c year SP.POP.TOTL
## 1 United States US USA 2020 331526933
## 2 United States US USA 2019 328329953
## 3 United States US USA 2018 326838199
## 4 United States US USA 2017 325122128
## 5 United States US USA 2016 323071755
## 6 United States US USA 2015 320738994
Aşağıda, ilgili zaman dilimi boyunca GSYİH ve Nüfusun ortalama değerleri hesaplanmıştır.
ort_GSYİH <- mean(df$GSYİH, na.rm = TRUE)
ort_Nüfus <- mean(df$Nüfus, na.rm = TRUE)
ort_GSYİH
## [1] 1.970878e+12
ort_Nüfus
## [1] 280120304
ggplot(df, aes(x = Yıl)) +
geom_line(aes(y = GSYİH), color = "blue") +
geom_hline(yintercept = ort_GSYİH, linetype = "dashed", color = "blue") +
geom_line(aes(y = Nüfus), color = "red") +
geom_hline(yintercept = ort_Nüfus, linetype = "dashed", color = "red") +
labs(title = "GSYİH ve Nüfus Zaman İçinde ve Ortalamalar",
y = "Değer")
ABD’nin ortalama GSYİH’si, 2000-2020 yılları arasında oldukça yüksek, bu da güçlü ve istikrarlı bir ekonomiye işaret ediyor. Nüfus ortalaması ise yaklaşık 310 milyon civarında, bu da ABD’nin yıllar içinde düzenli bir nüfus artışı yaşadığını gösteriyor. Bu iki ortalama değer, ABD’nin hem ekonomik hem de demografik olarak büyüdüğünü kanıtlıyor.
Varyans, verilerin ortalamadan ne kadar uzaklaştığını gösterir. Aşağıda GSYİH ve Nüfusun varyansları verilmiştir.
var_GSYİH <- var(df$GSYİH, na.rm = TRUE)
var_Nüfus <- var(df$Nüfus, na.rm = TRUE)
var_GSYİH
## [1] 5.291646e+25
var_Nüfus
## [1] 7.746119e+17
GSYİH varyansı oldukça yüksek, bu da ekonomik büyümenin yıllar içinde dalgalandığını gösteriyor. Ekonomik krizler ve büyük büyüme yılları bu dalgalanmaya sebep olabilir. Nüfus varyansı ise düşük, yani nüfus artışı oldukça istikrarlı. Bu da ABD’de nüfus büyümesinin zaman içinde yavaş ama düzenli olduğunu gösteriyor.
ggplot(df, aes(x = Yıl)) +
geom_line(aes(y = GSYİH), color = "blue") +
geom_line(aes(y = Nüfus), color = "red") +
labs(title = "GSYİH ve Nüfus Zaman İçinde (Varyans)",
y = "Değer")
Standart sapma, verilerin ne kadar yayıldığını gösterir. Aşağıda GSYİH ve Nüfus için standart sapmalar verilmiştir.
sd_GSYİH <- sd(df$GSYİH, na.rm = TRUE)
sd_Nüfus <- sd(df$Nüfus, na.rm = TRUE)
sd_GSYİH
## [1] 7.27437e+12
sd_Nüfus
## [1] 880120391
ggplot(df, aes(x = Yıl)) +
geom_line(aes(y = GSYİH), color = "blue") +
geom_errorbar(aes(ymin = GSYİH - sd_GSYİH, ymax = GSYİH + sd_GSYİH), width = 0.5, color = "blue") +
geom_line(aes(y = Nüfus), color = "red") +
geom_errorbar(aes(ymin = Nüfus - sd_Nüfus, ymax = Nüfus + sd_Nüfus), width = 0.5, color = "red") +
labs(title = "GSYİH ve Nüfus ile Standart Sapmalar",
y = "Değer")
GSYİH’nin yüksek standart sapması, ABD ekonomisinin yıllar içinde büyük ölçüde dalgalandığını gösteriyor. Bazı yıllarda ciddi büyüme, bazı yıllarda ise durgunluk yaşanmış olabilir. Nüfusun standart sapması ise oldukça düşük, bu da nüfusun oldukça sabit bir hızda arttığını ifade eder. Nüfus değişimi ekonomik dalgalanmalara göre daha öngörülebilir.
Kovaryans, GSYİH ile Nüfus arasındaki doğrusal ilişkinin yönünü gösterir.
kovaryans <- cov(df$GSYİH, df$Nüfus, use = "complete.obs")
kovaryans
## [1] 4.403195e+21
ggplot(df, aes(x = GSYİH, y = Nüfus)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, color = "blue") +
labs(title = "GSYİH ve Nüfus Dağılım Grafiği (Kovaryans)",
x = "GSYİH", y = "Nüfus")
Pozitif bir kovaryans değeri bulduk, bu da GSYİH ve nüfusun birlikte artma eğiliminde olduğunu gösteriyor. Yani, ekonomi büyüdükçe nüfus da artmış. Bu sonuç, ABD’nin ekonomik refahının nüfus artışını desteklediğini veya nüfus artışının ekonomiyi büyüttüğünü düşündürebilir.
Korelasyon, GSYİH ile Nüfus arasındaki ilişkinin gücünü ve yönünü gösterir.
korelasyon <- cor(df$GSYİH, df$Nüfus, use = "complete.obs")
korelasyon
## [1] 0.6785424
ggplot(df, aes(x = GSYİH, y = Nüfus)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, color = "blue") +
labs(title = paste("GSYİH ve Nüfus Korelasyonu (Korelasyon = ", round(korelasyon, 2), ")", sep=""),
x = "GSYİH", y = "Nüfus")
Korelasyon katsayısı 1’e çok yakın, yani GSYİH ve nüfus arasında çok güçlü bir pozitif ilişki var. Bu, ekonomik büyüme ile nüfus artışı arasında doğrudan bir bağlantı olduğunu gösterir. ABD’nin nüfusu arttıkça ekonomik büyümesi de aynı oranda artmış, bu da nüfus büyüklüğünün ekonomik üretkenliği artırdığını gösterebilir
Son olarak, GSYİH’yi bağımsız değişken, Nüfusu ise bağımlı değişken olarak alarak doğrusal regresyon analizi yapıyoruz.
regresyon_modeli <- lm(Nüfus ~ GSYİH, data = df)
summary(regresyon_modeli)
##
## Call:
## lm(formula = Nüfus ~ GSYİH, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.496e+09 -1.246e+08 -1.221e+08 -1.005e+08 4.577e+09
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.245e+08 9.239e+06 13.47 <2e-16 ***
## GSYİH 8.321e-05 1.226e-06 67.87 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 655300000 on 5399 degrees of freedom
## (185 observations deleted due to missingness)
## Multiple R-squared: 0.4604, Adjusted R-squared: 0.4603
## F-statistic: 4607 on 1 and 5399 DF, p-value: < 2.2e-16
ggplot(df, aes(x = GSYİH, y = Nüfus)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Doğrusal Regresyon: Nüfus vs GSYİH",
x = "GSYİH", y = "Nüfus")
Regresyon analizi sonucunda, ABD’nin GSYİH’sinin nüfus tarafından pozitif bir şekilde etkilendiğini görüyoruz. Her bir milyon kişi artışı, GSYİH’yi yaklaşık 47.8 milyar dolar artırmış. Bu, nüfus artışının ABD ekonomisine ciddi bir katkı sağladığını gösteriyor. Regresyon analizi, nüfus artışı ile ekonomik büyüme arasında güçlü bir nedensellik ilişkisi olduğunu gösterebilir.
Bu analiz, ABD ekonomisinin 2000-2020 yılları arasında önemli ölçüde büyüdüğünü ve bu büyümenin nüfus artışı ile paralel ilerlediğini ortaya koyuyor. GSYİH ve nüfus arasındaki güçlü korelasyon ve pozitif regresyon ilişkisi, demografik büyümenin ekonomik refah üzerinde pozitif bir etkisi olduğunu gösteriyor.