Rmarkdown projesi hazırladım.
Projemi rmarkdownda hazırladım, ve internet siteme yükledim.
Dünya bankası verileri nelerdir?
Dünya Bankası’nın veritabanı, 217 ekonomi ve 40’tan fazla ülke grubu için 50 yılı aşkın veriyi kapsayan 1,400’den fazla zaman serisi göstergeden oluşmaktadır. https://data.worldbank.org/ adresini ziyaret ettiğinizde, verilere ‘ülke’ ve ‘gösterge’ye dayalı olarak göz atabilirsiniz. ’Ülkeye veya Göstergelere Göre Göz At’ seçeneği altında, ‘gösterge’ bölümüne inerek farklı başlıklar altında birçok zaman serisine erişim sağlanabilir. İlk başlıklar, ‘Tarım ve Kırsal Kalkınma,’ ‘Yardım Etkinliği’ ve ‘İklim Değişikliği’ gibi çeşitli alanları kapsar ve toplamda 20 başlık ve 1,400 zaman serisini içerir.
library(WDI)
data_WDI <- WDI(country = "all", indicator = c("NY.GDP.MKTP.CD", "SP.POP.TOTL"))
str(data_WDI)
## 'data.frame': 17024 obs. of 6 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
## $ NY.GDP.MKTP.CD: num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "GDP (current US$)"
## $ SP.POP.TOTL : num 8622466 8790140 8969047 9157465 9355514 ...
## ..- attr(*, "label")= chr "Population, total"
library(explore)
describe_all(data_WDI)
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 64 1960 1.99e 3 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 3045 17.9 13857 11503. 1.21e12 1.05e14
## 6 SP.POP.TOTL dbl 94 0.6 16722 2646 2.16e 8 8.02e 9
df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.0 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
data_WDI %>% describe_all()
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 64 1960 1.99e 3 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 3045 17.9 13857 11503. 1.21e12 1.05e14
## 6 SP.POP.TOTL dbl 94 0.6 16722 2646 2.16e 8 8.02e 9
data_kesitveri <- data_WDI%>%filter(year == 2019)
ggplot(data_kesitveri, aes(x= NY.GDP.MKTP.CD , y= SP.POP.TOTL)) + geom_line()
## Warning: Removed 8 rows containing missing values or values outside the scale range
## (`geom_line()`).
ek_bilgi <- WDI_data$country
df <- left_join(data_WDI, ek_bilgi)
## Joining with `by = join_by(country, iso2c, iso3c)`
df <- df %>% filter(region != "Aggregates")
df %>% describe_all()
## # A tibble: 12 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 215 NA NA NA
## 2 iso2c chr 0 0 215 NA NA NA
## 3 iso3c chr 0 0 215 NA NA NA
## 4 year int 0 0 64 1960 1992. 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 2687 19.5 11070 11503. 189939811648. 2.74e13
## 6 SP.POP.TOTL dbl 30 0.2 13682 2646 24947312. 1.43e 9
## 7 region chr 0 0 7 NA NA NA
## 8 capital chr 0 0 210 NA NA NA
## 9 longitude chr 0 0 210 NA NA NA
## 10 latitude chr 0 0 210 NA NA NA
## 11 income chr 0 0 5 NA NA NA
## 12 lending chr 0 0 4 NA NA NA
library(ggplot2)
# Örnek veri oluşturma
year <- c(2000:2020)
GDP_TR <- c(230.23, 303.19, 237.89, 302.11, 355.89, 401.45, 432.21, 476.90, 516.32, 589.32, 656.21, 729.32, 801.23, 860.19, 912.56, 976.23, 1045.89, 1101.34, 1167.56, 1245.34, 1303.23) # Türkiye'nin GSMH verileri (örnek)
GDP_SN <- c(32.45, 38.21, 42.89, 45.67, 49.78, 55.32, 62.78, 70.89, 78.21, 85.32, 93.21, 100.32, 108.23, 115.78, 123.32, 132.45, 140.21, 148.89, 156.32, 163.21, 170.98) # Senegal'in GSMH verileri (örnek)
# Verileri birleştirme
df <- data.frame(year, GDP_TR, GDP_SN)
# Veri görselleştirme
ggplot(df, aes(x = year)) +
geom_line(aes(y = GDP_TR, color = "Turkey"), size = 1.2) +
geom_line(aes(y = GDP_SN, color = "Senegal"), size = 1.2) +
labs(x = "Year", y = "GDP (Current US$)", title = "GDP Comparison between Turkey and Senegal") +
scale_color_manual(values = c("Turkey" = "blue", "Senegal" = "green")) +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.