Ekonometri Vize Projesi

R ve R Studio

-R’yi yükledim

-R Studio’yi yükledim

-Yeni proje oluşturup yazmaya başladım

R Markdown

-R Markdown’ı yükledim

-Tema değistirdim

Dünya Ekonomisi Projesi

Paketler

Paket Nedir

R paketleri, R işlevlerinin, uyumlu kodların ve örnek verilerin bir koleksiyonudur. R ortamında “Library” adı verilen bir dizin altında saklanırlar. Varsayılan olarak R, kurulum sırasında bir dizi paket yükler. Daha sonra belirli bir amaç için ihtiyaç duyulduğunda daha fazla paket eklenir. R konsolunu başlattığımızda varsayılan olarak yalnızca varsayılan paketler mevcuttur. Zaten kurulu olan diğer paketlerin, onları kullanacak R programı tarafından kullanılabilmesi için açıkça yüklenmesi gerekir. R dilinde mevcut olan tüm paketler R Paketleri’nde listelenir.

Paket Niye Kullanılır

Fonksiyonlar ve Arayüzler:

R paketleri, belirli analizleri gerçekleştirmek için önceden yazılmış fonksiyonlar içerir. Bu fonksiyonlar, belirli istatistiksel hesaplamalar, veri manipülasyonları, görselleştirmeler ve diğer analiz tekniklerini kolaylaştırır.

Veri Setleri:

Birçok R paketi, örnek veri setleri içerir. Bu veri setleri, belirli analizleri denemek veya örnek çalışmalar oluşturmak için kullanılabilir.

Görselleştirme Araçları:

R paketleri, verileri görselleştirmek için çeşitli araçlar sağlar. ggplot2 gibi paketler, etkili ve özelleştirilebilir grafikler oluşturmak için kullanılır.

İleri Analiz Teknikleri:

R paketleri, makine öğrenimi, derin öğrenme, zaman serisi analizi, büyük veri analizi gibi ileri analiz tekniklerini uygulamak için kullanılabilir.

Topluluk Katkısı:

R topluluğu sürekli olarak yeni paketler geliştirir ve mevcut paketleri günceller. Bu, kullanıcıların yeni ve gelişmiş araçlara erişimini sağlar.

Kodu Düzenleme ve Tekrar Kullanımı:

R paketleri, kodun yeniden kullanılabilirliğini artırır ve projeler arasında kod parçalarını kolayca taşımayı sağlar. Bu, veri bilimcilerin ve analistlerin daha verimli çalışmasına yardımcı olur.

Performans ve Optimizasyon:

Bazı R paketleri, belirli analizlerin performansını artırmak ve hesaplama sürelerini azaltmak için optimize edilmiştir.

R Paketlerin Örnekleri

ggplot2

ggplot2, veri görselleştirmesi için popüler bir R paketidir. Grafik Dilbilgisi’ne dayanır ve kullanıcıların verilere katmanlar, estetikler ve eşlemeler ekleyerek karmaşık grafikler oluşturmasını sağlar.

dplyr

dplyr, R’de veri manipülasyonu için bir pakettir. Ortak veri işleme görevlerini daha kolay ve sezgisel hale getirmek için tasarlanmış bir dizi işlev sağlar. dplyr işlevleri, veri filtreleme, seçme, düzenleme, değiştirme ve özetleme gibi görevler için kullanılır.

caret

caret, Sınıflandırma ve Regresyon Eğitimi anlamına gelir. R’de makine öğrenimi modellerini eğitmek ve ayarlamak için birleşik bir arayüz sağlar. caret, veri ön işleme, özellik seçimi, model eğitimi, model ayarlama ve performans değerlendirmesi için işlevler içerir.

tidyr

tidyr, veri düzenlemesi için bir R paketidir. Veri çerçevelerini analiz ve görselleştirme için daha kolay bir formata getirmek için araçlar sağlar. tidyr işlevleri genellikle veriyi geniş ve uzun formatlar arasında dönüştürmek, sütunları ayırmak ve birleştirmek, eksik değerlerle başa çıkmak için kullanılır.

randomForest

randomForest, sınıflandırma ve regresyon görevleri için random forest algoritmasını uygulayan bir R paketidir. Rastgele ormanlar, eğitim sırasında birden fazla karar ağacı oluşturan ve tahminlerini iyileştirmek için bunların tahminlerini birleştiren bir topluluk öğrenme yöntemidir. R’deki randomForest paketi, rastgele orman modelleri oluşturmak, tahminler yapmak ve model performansını değerlendirmek için işlevler sağlar.

Proje

İşsizlik Oranı

2 Ülkeler arasında İşsizlik Oranı Farklılıkları

chooseCRANmirror(ind = 62)
install.packages(c("WDI", "dplyr", "tidyr", "ggplot2"))
## package 'WDI' successfully unpacked and MD5 sums checked
## package 'dplyr' successfully unpacked and MD5 sums checked
## package 'tidyr' successfully unpacked and MD5 sums checked
## package 'ggplot2' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\RtmpcDUg4L\downloaded_packages
library(WDI)      
library(dplyr)    
library(tidyr)    
library(ggplot2)  

countries <- c("ES", "CH") 
indicators <- "SL.UEM.TOTL.ZS"  

unemployment_data <- WDI(country = countries, indicator = indicators, start = 1990, end = 2022)

print(unemployment_data)
##        country iso2c iso3c year SL.UEM.TOTL.ZS
## 1  Switzerland    CH   CHE 2022           4.30
## 2  Switzerland    CH   CHE 2021           5.10
## 3  Switzerland    CH   CHE 2020           4.82
## 4  Switzerland    CH   CHE 2019           4.39
## 5  Switzerland    CH   CHE 2018           4.71
## 6  Switzerland    CH   CHE 2017           4.80
## 7  Switzerland    CH   CHE 2016           4.92
## 8  Switzerland    CH   CHE 2015           4.80
## 9  Switzerland    CH   CHE 2014           4.83
## 10 Switzerland    CH   CHE 2013           4.75
## 11 Switzerland    CH   CHE 2012           4.49
## 12 Switzerland    CH   CHE 2011           4.41
## 13 Switzerland    CH   CHE 2010           4.81
## 14 Switzerland    CH   CHE 2009           4.11
## 15 Switzerland    CH   CHE 2008           3.35
## 16 Switzerland    CH   CHE 2007           3.64
## 17 Switzerland    CH   CHE 2006           3.99
## 18 Switzerland    CH   CHE 2005           4.44
## 19 Switzerland    CH   CHE 2004           4.32
## 20 Switzerland    CH   CHE 2003           4.12
## 21 Switzerland    CH   CHE 2002           2.92
## 22 Switzerland    CH   CHE 2001           2.49
## 23 Switzerland    CH   CHE 2000           2.66
## 24 Switzerland    CH   CHE 1999           3.05
## 25 Switzerland    CH   CHE 1998           3.57
## 26 Switzerland    CH   CHE 1997           4.13
## 27 Switzerland    CH   CHE 1996           3.68
## 28 Switzerland    CH   CHE 1995           3.09
## 29 Switzerland    CH   CHE 1994           3.58
## 30 Switzerland    CH   CHE 1993           3.55
## 31 Switzerland    CH   CHE 1992           2.34
## 32 Switzerland    CH   CHE 1991           1.82
## 33 Switzerland    CH   CHE 1990             NA
## 34       Spain    ES   ESP 2022          12.92
## 35       Spain    ES   ESP 2021          14.78
## 36       Spain    ES   ESP 2020          15.53
## 37       Spain    ES   ESP 2019          14.10
## 38       Spain    ES   ESP 2018          15.25
## 39       Spain    ES   ESP 2017          17.22
## 40       Spain    ES   ESP 2016          19.64
## 41       Spain    ES   ESP 2015          22.06
## 42       Spain    ES   ESP 2014          24.44
## 43       Spain    ES   ESP 2013          26.09
## 44       Spain    ES   ESP 2012          24.79
## 45       Spain    ES   ESP 2011          21.39
## 46       Spain    ES   ESP 2010          19.86
## 47       Spain    ES   ESP 2009          17.86
## 48       Spain    ES   ESP 2008          11.25
## 49       Spain    ES   ESP 2007           8.23
## 50       Spain    ES   ESP 2006           8.45
## 51       Spain    ES   ESP 2005           9.15
## 52       Spain    ES   ESP 2004          11.09
## 53       Spain    ES   ESP 2003          11.28
## 54       Spain    ES   ESP 2002          11.15
## 55       Spain    ES   ESP 2001          10.35
## 56       Spain    ES   ESP 2000          13.79
## 57       Spain    ES   ESP 1999          15.48
## 58       Spain    ES   ESP 1998          18.67
## 59       Spain    ES   ESP 1997          20.70
## 60       Spain    ES   ESP 1996          22.14
## 61       Spain    ES   ESP 1995          22.68
## 62       Spain    ES   ESP 1994          24.21
## 63       Spain    ES   ESP 1993          22.16
## 64       Spain    ES   ESP 1992          17.70
## 65       Spain    ES   ESP 1991          15.93
## 66       Spain    ES   ESP 1990             NA
ggplot(data = unemployment_data, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")

1990 ile 2022 arasında, İspanya’da işsizlik yüksek seyretti, özellikle 2008’deki finansal kriz sonrasında. İsviçre ise düşük ve istikrarlı işsizlik seviyelerini sürdürdü. İspanya ekonomisi zorluklarla boğuşurken, İsviçre çeşitlendirilmiş ekonomisi ve sağlam işgücü politikalarıyla olumlu bir istihdam ortamını korudu.

Diğer Paketler

Str Kodu

str kodu, R programlama dilindeki bir fonksiyondur. Bu fonksiyon, bir R nesnesinin yapısını (structure) gösteren bilgileri ekrana yazdırır. Yani, bir veri nesnesinin içeriği hakkında genel bir fikir edinmek için kullanılır.

Örneğin, bir veri çerçevesi veya bir listedeki değişkenlerin tiplerini, uzunluklarını ve değerlerini görmek için str() fonksiyonu kullanılabilir.

str(unemployment_data)
## 'data.frame':    66 obs. of  5 variables:
##  $ country       : chr  "Switzerland" "Switzerland" "Switzerland" "Switzerland" ...
##  $ iso2c         : chr  "CH" "CH" "CH" "CH" ...
##  $ iso3c         : chr  "CHE" "CHE" "CHE" "CHE" ...
##  $ year          : int  2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 ...
##  $ SL.UEM.TOTL.ZS: num  4.3 5.1 4.82 4.39 4.71 4.8 4.92 4.8 4.83 4.75 ...
##   ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
##  - attr(*, "lastupdated")= chr "2024-02-21"
##  - attr(*, "label")= chr [1:66] "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" ...

Explore Paketi

“explore” kodu, R dilinde doğrudan bir fonksiyon değildir. Ancak, veri keşfi, analizi ve görselleştirmesi için kullanılan bir dizi işlemin genel adıdır. Bu işlemler, veri setinin yapısını anlamak, değişkenler arasındaki ilişkileri incelemek, veri dağılımlarını görselleştirmek ve veri setinin genel özelliklerini belirlemek gibi adımları içerebilir.

Explore paketinin bir parçası olan ““describe_all()”” işlevi, bir veri kümesindeki tüm sütunlar (değişkenler) için açıklayıcı istatistikler üretmek için kullanılır. Bir veri kümesine uygulandığında, her sütun için ortalama, medyan, standart sapma, minimum, maksimum ve çeyreklik gibi istatistikleri hesaplar ve görüntüler.

install.packages("explore")
## package 'explore' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\RtmpcDUg4L\downloaded_packages
library(explore)
describe_all(unemployment_data)
## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Pipe Öperatörü %>%

%>%, R programlama dilinde yaygın olarak kullanılan bir işlev olan “pipe” operatörüdür. Tidyverse ve ya dplyr paketi içerisinde bulunur ve daha okunabilir ve işlevsel kod yazmak için kullanılır.

%>% operatörü, bir nesne veya değeri, bir işlevin ilk argümanı olarak alır ve bir sonraki işleve iletir. Bu sayede kodunuzdaki işlem adımlarını daha düzenli hale getirir ve kodunuzun okunabilirliğini artırır.

df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur.

install.packages("tidyverse")
## package 'tidyverse' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\RtmpcDUg4L\downloaded_packages
library(tidyverse)
unemployment_data %>% describe_all()
## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Pipe Öperatörü altında kullanan kodlar

Şimdi bu aşamada “unemployment_data$country” kullanarak ek_bilgi “values” oluşturdum.

Sonra da “cross_join” ve “merge” kodları kullanacağız.Çapraz birleştirme (veya Kartezyen birleştirme), veri setlerinin kartezyen çarpımını oluşturan bir birleştirme işlemidir. Bu işlemde, ilk veri setinin her bir satırı, ikinci veri setinin her bir satırıyla birleştirilir, böylece tüm olası kombinasyonlar elde edilir.

R’de, dplyr paketini kullanıyorsanız, özellikle bir cross_join() fonksiyonu bulunmamaktadır. Bunun yerine, birleştirme işlemi için merge() fonksiyonunu kullanarak çapraz birleşim elde edebilirsiniz.

Onları kullanarak “df” ve “df_merged” veri seti oluşturdum

“filter” kodu kullanarak “filter_df” veri seti oluşturdum ve son olarak “describe_all” ile bitirerek R koduyu çalıştırdım

ek_bilgi <- unemployment_data$country
library(dplyr)
filter_df <- unemployment_data %>% filter(country != "spain")
unemployment_data %>% describe_all()
## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Burası da “filter” kodu kullanarak her iki ülkenin ayrı veri seti elde ettim. O ayri veri setinden de her ülkenin ayrı grafiği oluşturdum

udch <- unemployment_data %>% filter(iso2c %in% "CH")
udes <- unemployment_data %>% filter(iso2c %in% "ES")
ggplot(data = udch, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Switzerland")

ggplot(data = udes, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Spain")

Başka kodları ve fonksıyonları kullanmak amacıyla bütün ülkelerin verilerini yükleyeceğim

library(WDI) 
data_WDI <- WDI(country = "all", indicator = c("SL.UEM.TOTL.ZS", "SP.POP.TOTL"))

Unique Kodu

unique() fonksiyonu, R programlama dilinde bir vektörün ya da diğer veri yapılarının (data frame, array vb.) benzersiz (unique) elemanlarını döndürür. Yani aynı elemandan birden fazla varsa, bu elemanları yalnızca bir kez gösterir.

unique_countries <- unique(data_WDI$country)
print(unique_countries)
##   [1] "Afghanistan"                                         
##   [2] "Africa Eastern and Southern"                         
##   [3] "Africa Western and Central"                          
##   [4] "Albania"                                             
##   [5] "Algeria"                                             
##   [6] "American Samoa"                                      
##   [7] "Andorra"                                             
##   [8] "Angola"                                              
##   [9] "Antigua and Barbuda"                                 
##  [10] "Arab World"                                          
##  [11] "Argentina"                                           
##  [12] "Armenia"                                             
##  [13] "Aruba"                                               
##  [14] "Australia"                                           
##  [15] "Austria"                                             
##  [16] "Azerbaijan"                                          
##  [17] "Bahamas, The"                                        
##  [18] "Bahrain"                                             
##  [19] "Bangladesh"                                          
##  [20] "Barbados"                                            
##  [21] "Belarus"                                             
##  [22] "Belgium"                                             
##  [23] "Belize"                                              
##  [24] "Benin"                                               
##  [25] "Bermuda"                                             
##  [26] "Bhutan"                                              
##  [27] "Bolivia"                                             
##  [28] "Bosnia and Herzegovina"                              
##  [29] "Botswana"                                            
##  [30] "Brazil"                                              
##  [31] "British Virgin Islands"                              
##  [32] "Brunei Darussalam"                                   
##  [33] "Bulgaria"                                            
##  [34] "Burkina Faso"                                        
##  [35] "Burundi"                                             
##  [36] "Cabo Verde"                                          
##  [37] "Cambodia"                                            
##  [38] "Cameroon"                                            
##  [39] "Canada"                                              
##  [40] "Caribbean small states"                              
##  [41] "Cayman Islands"                                      
##  [42] "Central African Republic"                            
##  [43] "Central Europe and the Baltics"                      
##  [44] "Chad"                                                
##  [45] "Channel Islands"                                     
##  [46] "Chile"                                               
##  [47] "China"                                               
##  [48] "Colombia"                                            
##  [49] "Comoros"                                             
##  [50] "Congo, Dem. Rep."                                    
##  [51] "Congo, Rep."                                         
##  [52] "Costa Rica"                                          
##  [53] "Cote d'Ivoire"                                       
##  [54] "Croatia"                                             
##  [55] "Cuba"                                                
##  [56] "Curacao"                                             
##  [57] "Cyprus"                                              
##  [58] "Czechia"                                             
##  [59] "Denmark"                                             
##  [60] "Djibouti"                                            
##  [61] "Dominica"                                            
##  [62] "Dominican Republic"                                  
##  [63] "Early-demographic dividend"                          
##  [64] "East Asia & Pacific (excluding high income)"         
##  [65] "East Asia & Pacific (IDA & IBRD countries)"          
##  [66] "East Asia & Pacific"                                 
##  [67] "Ecuador"                                             
##  [68] "Egypt, Arab Rep."                                    
##  [69] "El Salvador"                                         
##  [70] "Equatorial Guinea"                                   
##  [71] "Eritrea"                                             
##  [72] "Estonia"                                             
##  [73] "Eswatini"                                            
##  [74] "Ethiopia"                                            
##  [75] "Euro area"                                           
##  [76] "Europe & Central Asia (excluding high income)"       
##  [77] "Europe & Central Asia (IDA & IBRD countries)"        
##  [78] "Europe & Central Asia"                               
##  [79] "European Union"                                      
##  [80] "Faroe Islands"                                       
##  [81] "Fiji"                                                
##  [82] "Finland"                                             
##  [83] "Fragile and conflict affected situations"            
##  [84] "France"                                              
##  [85] "French Polynesia"                                    
##  [86] "Gabon"                                               
##  [87] "Gambia, The"                                         
##  [88] "Georgia"                                             
##  [89] "Germany"                                             
##  [90] "Ghana"                                               
##  [91] "Gibraltar"                                           
##  [92] "Greece"                                              
##  [93] "Greenland"                                           
##  [94] "Grenada"                                             
##  [95] "Guam"                                                
##  [96] "Guatemala"                                           
##  [97] "Guinea-Bissau"                                       
##  [98] "Guinea"                                              
##  [99] "Guyana"                                              
## [100] "Haiti"                                               
## [101] "Heavily indebted poor countries (HIPC)"              
## [102] "High income"                                         
## [103] "Honduras"                                            
## [104] "Hong Kong SAR, China"                                
## [105] "Hungary"                                             
## [106] "IBRD only"                                           
## [107] "Iceland"                                             
## [108] "IDA & IBRD total"                                    
## [109] "IDA blend"                                           
## [110] "IDA only"                                            
## [111] "IDA total"                                           
## [112] "India"                                               
## [113] "Indonesia"                                           
## [114] "Iran, Islamic Rep."                                  
## [115] "Iraq"                                                
## [116] "Ireland"                                             
## [117] "Isle of Man"                                         
## [118] "Israel"                                              
## [119] "Italy"                                               
## [120] "Jamaica"                                             
## [121] "Japan"                                               
## [122] "Jordan"                                              
## [123] "Kazakhstan"                                          
## [124] "Kenya"                                               
## [125] "Kiribati"                                            
## [126] "Korea, Dem. People's Rep."                           
## [127] "Korea, Rep."                                         
## [128] "Kosovo"                                              
## [129] "Kuwait"                                              
## [130] "Kyrgyz Republic"                                     
## [131] "Lao PDR"                                             
## [132] "Late-demographic dividend"                           
## [133] "Latin America & Caribbean (excluding high income)"   
## [134] "Latin America & Caribbean"                           
## [135] "Latin America & the Caribbean (IDA & IBRD countries)"
## [136] "Latvia"                                              
## [137] "Least developed countries: UN classification"        
## [138] "Lebanon"                                             
## [139] "Lesotho"                                             
## [140] "Liberia"                                             
## [141] "Libya"                                               
## [142] "Liechtenstein"                                       
## [143] "Lithuania"                                           
## [144] "Low & middle income"                                 
## [145] "Low income"                                          
## [146] "Lower middle income"                                 
## [147] "Luxembourg"                                          
## [148] "Macao SAR, China"                                    
## [149] "Madagascar"                                          
## [150] "Malawi"                                              
## [151] "Malaysia"                                            
## [152] "Maldives"                                            
## [153] "Mali"                                                
## [154] "Malta"                                               
## [155] "Marshall Islands"                                    
## [156] "Mauritania"                                          
## [157] "Mauritius"                                           
## [158] "Mexico"                                              
## [159] "Micronesia, Fed. Sts."                               
## [160] "Middle East & North Africa (excluding high income)"  
## [161] "Middle East & North Africa (IDA & IBRD countries)"   
## [162] "Middle East & North Africa"                          
## [163] "Middle income"                                       
## [164] "Moldova"                                             
## [165] "Monaco"                                              
## [166] "Mongolia"                                            
## [167] "Montenegro"                                          
## [168] "Morocco"                                             
## [169] "Mozambique"                                          
## [170] "Myanmar"                                             
## [171] "Namibia"                                             
## [172] "Nauru"                                               
## [173] "Nepal"                                               
## [174] "Netherlands"                                         
## [175] "New Caledonia"                                       
## [176] "New Zealand"                                         
## [177] "Nicaragua"                                           
## [178] "Niger"                                               
## [179] "Nigeria"                                             
## [180] "North America"                                       
## [181] "North Macedonia"                                     
## [182] "Northern Mariana Islands"                            
## [183] "Norway"                                              
## [184] "Not classified"                                      
## [185] "OECD members"                                        
## [186] "Oman"                                                
## [187] "Other small states"                                  
## [188] "Pacific island small states"                         
## [189] "Pakistan"                                            
## [190] "Palau"                                               
## [191] "Panama"                                              
## [192] "Papua New Guinea"                                    
## [193] "Paraguay"                                            
## [194] "Peru"                                                
## [195] "Philippines"                                         
## [196] "Poland"                                              
## [197] "Portugal"                                            
## [198] "Post-demographic dividend"                           
## [199] "Pre-demographic dividend"                            
## [200] "Puerto Rico"                                         
## [201] "Qatar"                                               
## [202] "Romania"                                             
## [203] "Russian Federation"                                  
## [204] "Rwanda"                                              
## [205] "Samoa"                                               
## [206] "San Marino"                                          
## [207] "Sao Tome and Principe"                               
## [208] "Saudi Arabia"                                        
## [209] "Senegal"                                             
## [210] "Serbia"                                              
## [211] "Seychelles"                                          
## [212] "Sierra Leone"                                        
## [213] "Singapore"                                           
## [214] "Sint Maarten (Dutch part)"                           
## [215] "Slovak Republic"                                     
## [216] "Slovenia"                                            
## [217] "Small states"                                        
## [218] "Solomon Islands"                                     
## [219] "Somalia"                                             
## [220] "South Africa"                                        
## [221] "South Asia (IDA & IBRD)"                             
## [222] "South Asia"                                          
## [223] "South Sudan"                                         
## [224] "Spain"                                               
## [225] "Sri Lanka"                                           
## [226] "St. Kitts and Nevis"                                 
## [227] "St. Lucia"                                           
## [228] "St. Martin (French part)"                            
## [229] "St. Vincent and the Grenadines"                      
## [230] "Sub-Saharan Africa (excluding high income)"          
## [231] "Sub-Saharan Africa (IDA & IBRD countries)"           
## [232] "Sub-Saharan Africa"                                  
## [233] "Sudan"                                               
## [234] "Suriname"                                            
## [235] "Sweden"                                              
## [236] "Switzerland"                                         
## [237] "Syrian Arab Republic"                                
## [238] "Tajikistan"                                          
## [239] "Tanzania"                                            
## [240] "Thailand"                                            
## [241] "Timor-Leste"                                         
## [242] "Togo"                                                
## [243] "Tonga"                                               
## [244] "Trinidad and Tobago"                                 
## [245] "Tunisia"                                             
## [246] "Turkiye"                                             
## [247] "Turkmenistan"                                        
## [248] "Turks and Caicos Islands"                            
## [249] "Tuvalu"                                              
## [250] "Uganda"                                              
## [251] "Ukraine"                                             
## [252] "United Arab Emirates"                                
## [253] "United Kingdom"                                      
## [254] "United States"                                       
## [255] "Upper middle income"                                 
## [256] "Uruguay"                                             
## [257] "Uzbekistan"                                          
## [258] "Vanuatu"                                             
## [259] "Venezuela, RB"                                       
## [260] "Viet Nam"                                            
## [261] "Virgin Islands (U.S.)"                               
## [262] "West Bank and Gaza"                                  
## [263] "World"                                               
## [264] "Yemen, Rep."                                         
## [265] "Zambia"                                              
## [266] "Zimbabwe"

Kayıp Veri Seti Oluşturma

library(tidyverse)
library(dplyr)
kayıp_veri <- data_WDI %>%
  group_by(country) %>%
  summarize(missing_count = sum(is.na(SL.UEM.TOTL.ZS)))
print(kayıp_veri)
## # A tibble: 266 × 2
##    country                     missing_count
##    <chr>                               <int>
##  1 Afghanistan                            31
##  2 Africa Eastern and Southern            31
##  3 Africa Western and Central             31
##  4 Albania                                31
##  5 Algeria                                31
##  6 American Samoa                         63
##  7 Andorra                                63
##  8 Angola                                 31
##  9 Antigua and Barbuda                    63
## 10 Arab World                             31
## # ℹ 256 more rows

2005’den Veri Seti

library(explore)
data_WDI_from2005 <- data_WDI %>%
  filter(year>=2005)
data_WDI_from2005 %>% describe_all()
## # A tibble: 6 × 8
##   variable       type     na na_pct unique    min         mean          max
##   <chr>          <chr> <int>  <dbl>  <int>  <dbl>        <dbl>        <dbl>
## 1 country        chr       0    0      266   NA          NA            NA  
## 2 iso2c          chr       0    0      266   NA          NA            NA  
## 3 iso3c          chr       0    0      262   NA          NA            NA  
## 4 year           int       0    0       18 2005        2014.         2022  
## 5 SL.UEM.TOTL.ZS dbl     559   11.7   3190    0.1         7.71         37.3
## 6 SP.POP.TOTL    dbl      18    0.4   4733 9912   294713198.   7950946801

50’ten daha olan Kayıp Veri Seti

kayıp_veri_count <- kayıp_veri %>%
  filter(missing_count > 50) 
print(kayıp_veri_count)
## # A tibble: 31 × 2
##    country                missing_count
##    <chr>                          <int>
##  1 American Samoa                    63
##  2 Andorra                           63
##  3 Antigua and Barbuda               63
##  4 Aruba                             63
##  5 Bermuda                           63
##  6 British Virgin Islands            63
##  7 Cayman Islands                    63
##  8 Curacao                           63
##  9 Dominica                          63
## 10 Faroe Islands                     63
## # ℹ 21 more rows

Join Left Kodu

Önceden join_left() çalışmadığı içinbu aşamada yapayım ama merge() kullanarak.

library(dplyr)
Joint_Table <- merge(data_WDI, kayıp_veri)
Joint_Table %>% describe_all()
## # A tibble: 7 × 8
##   variable       type     na na_pct unique    min         mean          max
##   <chr>          <chr> <int>  <dbl>  <int>  <dbl>        <dbl>        <dbl>
## 1 country        chr       0    0      266   NA          NA            NA  
## 2 iso2c          chr       0    0      266   NA          NA            NA  
## 3 iso3c          chr       0    0      262   NA          NA            NA  
## 4 year           int       0    0       63 1960        1991          2022  
## 5 SL.UEM.TOTL.ZS dbl    9239   55.1   5218    0.1         7.96         38.8
## 6 SP.POP.TOTL    dbl      93    0.6  16460 2646   215959037.   7950946801  
## 7 missing_count  int       0    0        3   31          34.7          63