Ekonometri Vize Projesi

R ve R Studio

-R’yi yükledim

-R Studio’yi yükledim

-Yeni proje oluşturup yazmaya başladım

R Markdown

-R Markdown’ı yükledim

-Tema değistirdim

Dünya Ekonomisi Projesi

Paketler

Paket Nedir

R paketleri, R işlevlerinin, uyumlu kodların ve örnek verilerin bir koleksiyonudur. R ortamında “Library” adı verilen bir dizin altında saklanırlar. Varsayılan olarak R, kurulum sırasında bir dizi paket yükler. Daha sonra belirli bir amaç için ihtiyaç duyulduğunda daha fazla paket eklenir. R konsolunu başlattığımızda varsayılan olarak yalnızca varsayılan paketler mevcuttur. Zaten kurulu olan diğer paketlerin, onları kullanacak R programı tarafından kullanılabilmesi için açıkça yüklenmesi gerekir. R dilinde mevcut olan tüm paketler R Paketleri’nde listelenir.

Paket Niye Kullanılır

Fonksiyonlar ve Arayüzler:

R paketleri, belirli analizleri gerçekleştirmek için önceden yazılmış fonksiyonlar içerir. Bu fonksiyonlar, belirli istatistiksel hesaplamalar, veri manipülasyonları, görselleştirmeler ve diğer analiz tekniklerini kolaylaştırır.

Veri Setleri:

Birçok R paketi, örnek veri setleri içerir. Bu veri setleri, belirli analizleri denemek veya örnek çalışmalar oluşturmak için kullanılabilir.

Görselleştirme Araçları:

R paketleri, verileri görselleştirmek için çeşitli araçlar sağlar. ggplot2 gibi paketler, etkili ve özelleştirilebilir grafikler oluşturmak için kullanılır.

İleri Analiz Teknikleri:

R paketleri, makine öğrenimi, derin öğrenme, zaman serisi analizi, büyük veri analizi gibi ileri analiz tekniklerini uygulamak için kullanılabilir.

Topluluk Katkısı:

R topluluğu sürekli olarak yeni paketler geliştirir ve mevcut paketleri günceller. Bu, kullanıcıların yeni ve gelişmiş araçlara erişimini sağlar.

Kodu Düzenleme ve Tekrar Kullanımı:

R paketleri, kodun yeniden kullanılabilirliğini artırır ve projeler arasında kod parçalarını kolayca taşımayı sağlar. Bu, veri bilimcilerin ve analistlerin daha verimli çalışmasına yardımcı olur.

Performans ve Optimizasyon:

Bazı R paketleri, belirli analizlerin performansını artırmak ve hesaplama sürelerini azaltmak için optimize edilmiştir.

R Paketlerin Örnekleri

ggplot2

ggplot2, veri görselleştirmesi için popüler bir R paketidir. Grafik Dilbilgisi’ne dayanır ve kullanıcıların verilere katmanlar, estetikler ve eşlemeler ekleyerek karmaşık grafikler oluşturmasını sağlar.

dplyr

dplyr, R’de veri manipülasyonu için bir pakettir. Ortak veri işleme görevlerini daha kolay ve sezgisel hale getirmek için tasarlanmış bir dizi işlev sağlar. dplyr işlevleri, veri filtreleme, seçme, düzenleme, değiştirme ve özetleme gibi görevler için kullanılır.

caret

caret, Sınıflandırma ve Regresyon Eğitimi anlamına gelir. R’de makine öğrenimi modellerini eğitmek ve ayarlamak için birleşik bir arayüz sağlar. caret, veri ön işleme, özellik seçimi, model eğitimi, model ayarlama ve performans değerlendirmesi için işlevler içerir.

tidyr

tidyr, veri düzenlemesi için bir R paketidir. Veri çerçevelerini analiz ve görselleştirme için daha kolay bir formata getirmek için araçlar sağlar. tidyr işlevleri genellikle veriyi geniş ve uzun formatlar arasında dönüştürmek, sütunları ayırmak ve birleştirmek, eksik değerlerle başa çıkmak için kullanılır.

randomForest

randomForest, sınıflandırma ve regresyon görevleri için random forest algoritmasını uygulayan bir R paketidir. Rastgele ormanlar, eğitim sırasında birden fazla karar ağacı oluşturan ve tahminlerini iyileştirmek için bunların tahminlerini birleştiren bir topluluk öğrenme yöntemidir. R’deki randomForest paketi, rastgele orman modelleri oluşturmak, tahminler yapmak ve model performansını değerlendirmek için işlevler sağlar.

Proje

İşsizlik Oranı

2 Ülkeler arasında İşsizlik Oranı Farklılıkları

chooseCRANmirror(ind = 62)

install.packages(c("WDI", "dplyr", "tidyr", "ggplot2"))

## package 'WDI' successfully unpacked and MD5 sums checked
## package 'dplyr' successfully unpacked and MD5 sums checked
## package 'tidyr' successfully unpacked and MD5 sums checked
## package 'ggplot2' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages

library(WDI)      
library(dplyr)    
library(tidyr)    
library(ggplot2)  

countries <- c("ES", "CH") 
indicators <- "SL.UEM.TOTL.ZS"  

unemployment_data <- WDI(country = countries, indicator = indicators, start = 1990, end = 2022)

print(unemployment_data)

##        country iso2c iso3c year SL.UEM.TOTL.ZS
## 1  Switzerland    CH   CHE 2022           4.30
## 2  Switzerland    CH   CHE 2021           5.10
## 3  Switzerland    CH   CHE 2020           4.82
## 4  Switzerland    CH   CHE 2019           4.39
## 5  Switzerland    CH   CHE 2018           4.71
## 6  Switzerland    CH   CHE 2017           4.80
## 7  Switzerland    CH   CHE 2016           4.92
## 8  Switzerland    CH   CHE 2015           4.80
## 9  Switzerland    CH   CHE 2014           4.83
## 10 Switzerland    CH   CHE 2013           4.75
## 11 Switzerland    CH   CHE 2012           4.49
## 12 Switzerland    CH   CHE 2011           4.41
## 13 Switzerland    CH   CHE 2010           4.81
## 14 Switzerland    CH   CHE 2009           4.11
## 15 Switzerland    CH   CHE 2008           3.35
## 16 Switzerland    CH   CHE 2007           3.64
## 17 Switzerland    CH   CHE 2006           3.99
## 18 Switzerland    CH   CHE 2005           4.44
## 19 Switzerland    CH   CHE 2004           4.32
## 20 Switzerland    CH   CHE 2003           4.12
## 21 Switzerland    CH   CHE 2002           2.92
## 22 Switzerland    CH   CHE 2001           2.49
## 23 Switzerland    CH   CHE 2000           2.66
## 24 Switzerland    CH   CHE 1999           3.05
## 25 Switzerland    CH   CHE 1998           3.57
## 26 Switzerland    CH   CHE 1997           4.13
## 27 Switzerland    CH   CHE 1996           3.68
## 28 Switzerland    CH   CHE 1995           3.09
## 29 Switzerland    CH   CHE 1994           3.58
## 30 Switzerland    CH   CHE 1993           3.55
## 31 Switzerland    CH   CHE 1992           2.34
## 32 Switzerland    CH   CHE 1991           1.82
## 33 Switzerland    CH   CHE 1990             NA
## 34       Spain    ES   ESP 2022          12.92
## 35       Spain    ES   ESP 2021          14.78
## 36       Spain    ES   ESP 2020          15.53
## 37       Spain    ES   ESP 2019          14.10
## 38       Spain    ES   ESP 2018          15.25
## 39       Spain    ES   ESP 2017          17.22
## 40       Spain    ES   ESP 2016          19.64
## 41       Spain    ES   ESP 2015          22.06
## 42       Spain    ES   ESP 2014          24.44
## 43       Spain    ES   ESP 2013          26.09
## 44       Spain    ES   ESP 2012          24.79
## 45       Spain    ES   ESP 2011          21.39
## 46       Spain    ES   ESP 2010          19.86
## 47       Spain    ES   ESP 2009          17.86
## 48       Spain    ES   ESP 2008          11.25
## 49       Spain    ES   ESP 2007           8.23
## 50       Spain    ES   ESP 2006           8.45
## 51       Spain    ES   ESP 2005           9.15
## 52       Spain    ES   ESP 2004          11.09
## 53       Spain    ES   ESP 2003          11.28
## 54       Spain    ES   ESP 2002          11.15
## 55       Spain    ES   ESP 2001          10.35
## 56       Spain    ES   ESP 2000          13.79
## 57       Spain    ES   ESP 1999          15.48
## 58       Spain    ES   ESP 1998          18.67
## 59       Spain    ES   ESP 1997          20.70
## 60       Spain    ES   ESP 1996          22.14
## 61       Spain    ES   ESP 1995          22.68
## 62       Spain    ES   ESP 1994          24.21
## 63       Spain    ES   ESP 1993          22.16
## 64       Spain    ES   ESP 1992          17.70
## 65       Spain    ES   ESP 1991          15.93
## 66       Spain    ES   ESP 1990             NA

ggplot(data = unemployment_data, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")

1990 ile 2022 arasında, İspanya’da işsizlik yüksek seyretti, özellikle 2008’deki finansal kriz sonrasında. İsviçre ise düşük ve istikrarlı işsizlik seviyelerini sürdürdü. İspanya ekonomisi zorluklarla boğuşurken, İsviçre çeşitlendirilmiş ekonomisi ve sağlam işgücü politikalarıyla olumlu bir istihdam ortamını korudu.

Diğer Paketler

Str Kodu

str kodu, R programlama dilindeki bir fonksiyondur. Bu fonksiyon, bir R nesnesinin yapısını (structure) gösteren bilgileri ekrana yazdırır. Yani, bir veri nesnesinin içeriği hakkında genel bir fikir edinmek için kullanılır.

Örneğin, bir veri çerçevesi veya bir listedeki değişkenlerin tiplerini, uzunluklarını ve değerlerini görmek için str() fonksiyonu kullanılabilir.

str(unemployment_data)

## 'data.frame':    66 obs. of  5 variables:
##  $ country       : chr  "Switzerland" "Switzerland" "Switzerland" "Switzerland" ...
##  $ iso2c         : chr  "CH" "CH" "CH" "CH" ...
##  $ iso3c         : chr  "CHE" "CHE" "CHE" "CHE" ...
##  $ year          : int  2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 ...
##  $ SL.UEM.TOTL.ZS: num  4.3 5.1 4.82 4.39 4.71 4.8 4.92 4.8 4.83 4.75 ...
##   ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
##  - attr(*, "lastupdated")= chr "2024-03-28"
##  - attr(*, "label")= chr [1:66] "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" ...

Explore Paketi

“explore” kodu, R dilinde doğrudan bir fonksiyon değildir. Ancak, veri keşfi, analizi ve görselleştirmesi için kullanılan bir dizi işlemin genel adıdır. Bu işlemler, veri setinin yapısını anlamak, değişkenler arasındaki ilişkileri incelemek, veri dağılımlarını görselleştirmek ve veri setinin genel özelliklerini belirlemek gibi adımları içerebilir.

Explore paketinin bir parçası olan ““describe_all()”” işlevi, bir veri kümesindeki tüm sütunlar (değişkenler) için açıklayıcı istatistikler üretmek için kullanılır. Bir veri kümesine uygulandığında, her sütun için ortalama, medyan, standart sapma, minimum, maksimum ve çeyreklik gibi istatistikleri hesaplar ve görüntüler.

install.packages("explore")

## package 'explore' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages

library(explore)
describe_all(unemployment_data)

## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Pipe Öperatörü %>%

%>%, R programlama dilinde yaygın olarak kullanılan bir işlev olan “pipe” operatörüdür. Tidyverse ve ya dplyr paketi içerisinde bulunur ve daha okunabilir ve işlevsel kod yazmak için kullanılır.

%>% operatörü, bir nesne veya değeri, bir işlevin ilk argümanı olarak alır ve bir sonraki işleve iletir. Bu sayede kodunuzdaki işlem adımlarını daha düzenli hale getirir ve kodunuzun okunabilirliğini artırır.

df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur.

install.packages("tidyverse")

## package 'tidyverse' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages

library(tidyverse)
unemployment_data %>% describe_all()

## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Pipe Öperatörü altında kullanan kodlar

Şimdi bu aşamada “unemployment_data$country” kullanarak ek_bilgi “values” oluşturdum.

Sonra da “cross_join” ve “merge” kodları kullanacağız.Çapraz birleştirme (veya Kartezyen birleştirme), veri setlerinin kartezyen çarpımını oluşturan bir birleştirme işlemidir. Bu işlemde, ilk veri setinin her bir satırı, ikinci veri setinin her bir satırıyla birleştirilir, böylece tüm olası kombinasyonlar elde edilir.

R’de, dplyr paketini kullanıyorsanız, özellikle bir cross_join() fonksiyonu bulunmamaktadır. Bunun yerine, birleştirme işlemi için merge() fonksiyonunu kullanarak çapraz birleşim elde edebilirsiniz.

Onları kullanarak “df” ve “df_merged” veri seti oluşturdum

“filter” kodu kullanarak “filter_df” veri seti oluşturdum ve son olarak “describe_all” ile bitirerek R koduyu çalıştırdım

ek_bilgi <- unemployment_data$country
library(dplyr)
filter_df <- unemployment_data %>% filter(country != "spain")
unemployment_data %>% describe_all()

## # A tibble: 5 × 8
##   variable       type     na na_pct unique     min   mean    max
##   <chr>          <chr> <int>  <dbl>  <int>   <dbl>  <dbl>  <dbl>
## 1 country        chr       0      0      2   NA      NA     NA  
## 2 iso2c          chr       0      0      2   NA      NA     NA  
## 3 iso3c          chr       0      0      2   NA      NA     NA  
## 4 year           int       0      0     33 1990    2006   2022  
## 5 SL.UEM.TOTL.ZS dbl       2      3     64    1.82   10.4   26.1

Burası da “filter” kodu kullanarak her iki ülkenin ayrı veri seti elde ettim. O ayri veri setinden de her ülkenin ayrı grafiği oluşturdum

udch <- unemployment_data %>% filter(iso2c %in% "CH")
udes <- unemployment_data %>% filter(iso2c %in% "ES")

ggplot(data = udch, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Switzerland")

ggplot(data = udes, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Spain")

Başka kodları ve fonksıyonları kullanmak amacıyla bütün ülkelerin verilerini yükleyeceğim

library(WDI) 
data_WDI <- WDI(country = "all", indicator = c("SL.UEM.TOTL.ZS", "SP.POP.TOTL"))

Unique Kodu

unique() fonksiyonu, R programlama dilinde bir vektörün ya da diğer veri yapılarının (data frame, array vb.) benzersiz (unique) elemanlarını döndürür. Yani aynı elemandan birden fazla varsa, bu elemanları yalnızca bir kez gösterir.

unique_countries <- unique(data_WDI$country)
print(unique_countries)

##   [1] "Afghanistan"                                         
##   [2] "Africa Eastern and Southern"                         
##   [3] "Africa Western and Central"                          
##   [4] "Albania"                                             
##   [5] "Algeria"                                             
##   [6] "American Samoa"                                      
##   [7] "Andorra"                                             
##   [8] "Angola"                                              
##   [9] "Antigua and Barbuda"                                 
##  [10] "Arab World"                                          
##  [11] "Argentina"                                           
##  [12] "Armenia"                                             
##  [13] "Aruba"                                               
##  [14] "Australia"                                           
##  [15] "Austria"                                             
##  [16] "Azerbaijan"                                          
##  [17] "Bahamas, The"                                        
##  [18] "Bahrain"                                             
##  [19] "Bangladesh"                                          
##  [20] "Barbados"                                            
##  [21] "Belarus"                                             
##  [22] "Belgium"                                             
##  [23] "Belize"                                              
##  [24] "Benin"                                               
##  [25] "Bermuda"                                             
##  [26] "Bhutan"                                              
##  [27] "Bolivia"                                             
##  [28] "Bosnia and Herzegovina"                              
##  [29] "Botswana"                                            
##  [30] "Brazil"                                              
##  [31] "British Virgin Islands"                              
##  [32] "Brunei Darussalam"                                   
##  [33] "Bulgaria"                                            
##  [34] "Burkina Faso"                                        
##  [35] "Burundi"                                             
##  [36] "Cabo Verde"                                          
##  [37] "Cambodia"                                            
##  [38] "Cameroon"                                            
##  [39] "Canada"                                              
##  [40] "Caribbean small states"                              
##  [41] "Cayman Islands"                                      
##  [42] "Central African Republic"                            
##  [43] "Central Europe and the Baltics"                      
##  [44] "Chad"                                                
##  [45] "Channel Islands"                                     
##  [46] "Chile"                                               
##  [47] "China"                                               
##  [48] "Colombia"                                            
##  [49] "Comoros"                                             
##  [50] "Congo, Dem. Rep."                                    
##  [51] "Congo, Rep."                                         
##  [52] "Costa Rica"                                          
##  [53] "Cote d'Ivoire"                                       
##  [54] "Croatia"                                             
##  [55] "Cuba"                                                
##  [56] "Curacao"                                             
##  [57] "Cyprus"                                              
##  [58] "Czechia"                                             
##  [59] "Denmark"                                             
##  [60] "Djibouti"                                            
##  [61] "Dominica"                                            
##  [62] "Dominican Republic"                                  
##  [63] "Early-demographic dividend"                          
##  [64] "East Asia & Pacific (excluding high income)"         
##  [65] "East Asia & Pacific (IDA & IBRD countries)"          
##  [66] "East Asia & Pacific"                                 
##  [67] "Ecuador"                                             
##  [68] "Egypt, Arab Rep."                                    
##  [69] "El Salvador"                                         
##  [70] "Equatorial Guinea"                                   
##  [71] "Eritrea"                                             
##  [72] "Estonia"                                             
##  [73] "Eswatini"                                            
##  [74] "Ethiopia"                                            
##  [75] "Euro area"                                           
##  [76] "Europe & Central Asia (excluding high income)"       
##  [77] "Europe & Central Asia (IDA & IBRD countries)"        
##  [78] "Europe & Central Asia"                               
##  [79] "European Union"                                      
##  [80] "Faroe Islands"                                       
##  [81] "Fiji"                                                
##  [82] "Finland"                                             
##  [83] "Fragile and conflict affected situations"            
##  [84] "France"                                              
##  [85] "French Polynesia"                                    
##  [86] "Gabon"                                               
##  [87] "Gambia, The"                                         
##  [88] "Georgia"                                             
##  [89] "Germany"                                             
##  [90] "Ghana"                                               
##  [91] "Gibraltar"                                           
##  [92] "Greece"                                              
##  [93] "Greenland"                                           
##  [94] "Grenada"                                             
##  [95] "Guam"                                                
##  [96] "Guatemala"                                           
##  [97] "Guinea-Bissau"                                       
##  [98] "Guinea"                                              
##  [99] "Guyana"                                              
## [100] "Haiti"                                               
## [101] "Heavily indebted poor countries (HIPC)"              
## [102] "High income"                                         
## [103] "Honduras"                                            
## [104] "Hong Kong SAR, China"                                
## [105] "Hungary"                                             
## [106] "IBRD only"                                           
## [107] "Iceland"                                             
## [108] "IDA & IBRD total"                                    
## [109] "IDA blend"                                           
## [110] "IDA only"                                            
## [111] "IDA total"                                           
## [112] "India"                                               
## [113] "Indonesia"                                           
## [114] "Iran, Islamic Rep."                                  
## [115] "Iraq"                                                
## [116] "Ireland"                                             
## [117] "Isle of Man"                                         
## [118] "Israel"                                              
## [119] "Italy"                                               
## [120] "Jamaica"                                             
## [121] "Japan"                                               
## [122] "Jordan"                                              
## [123] "Kazakhstan"                                          
## [124] "Kenya"                                               
## [125] "Kiribati"                                            
## [126] "Korea, Dem. People's Rep."                           
## [127] "Korea, Rep."                                         
## [128] "Kosovo"                                              
## [129] "Kuwait"                                              
## [130] "Kyrgyz Republic"                                     
## [131] "Lao PDR"                                             
## [132] "Late-demographic dividend"                           
## [133] "Latin America & Caribbean (excluding high income)"   
## [134] "Latin America & Caribbean"                           
## [135] "Latin America & the Caribbean (IDA & IBRD countries)"
## [136] "Latvia"                                              
## [137] "Least developed countries: UN classification"        
## [138] "Lebanon"                                             
## [139] "Lesotho"                                             
## [140] "Liberia"                                             
## [141] "Libya"                                               
## [142] "Liechtenstein"                                       
## [143] "Lithuania"                                           
## [144] "Low & middle income"                                 
## [145] "Low income"                                          
## [146] "Lower middle income"                                 
## [147] "Luxembourg"                                          
## [148] "Macao SAR, China"                                    
## [149] "Madagascar"                                          
## [150] "Malawi"                                              
## [151] "Malaysia"                                            
## [152] "Maldives"                                            
## [153] "Mali"                                                
## [154] "Malta"                                               
## [155] "Marshall Islands"                                    
## [156] "Mauritania"                                          
## [157] "Mauritius"                                           
## [158] "Mexico"                                              
## [159] "Micronesia, Fed. Sts."                               
## [160] "Middle East & North Africa (excluding high income)"  
## [161] "Middle East & North Africa (IDA & IBRD countries)"   
## [162] "Middle East & North Africa"                          
## [163] "Middle income"                                       
## [164] "Moldova"                                             
## [165] "Monaco"                                              
## [166] "Mongolia"                                            
## [167] "Montenegro"                                          
## [168] "Morocco"                                             
## [169] "Mozambique"                                          
## [170] "Myanmar"                                             
## [171] "Namibia"                                             
## [172] "Nauru"                                               
## [173] "Nepal"                                               
## [174] "Netherlands"                                         
## [175] "New Caledonia"                                       
## [176] "New Zealand"                                         
## [177] "Nicaragua"                                           
## [178] "Niger"                                               
## [179] "Nigeria"                                             
## [180] "North America"                                       
## [181] "North Macedonia"                                     
## [182] "Northern Mariana Islands"                            
## [183] "Norway"                                              
## [184] "Not classified"                                      
## [185] "OECD members"                                        
## [186] "Oman"                                                
## [187] "Other small states"                                  
## [188] "Pacific island small states"                         
## [189] "Pakistan"                                            
## [190] "Palau"                                               
## [191] "Panama"                                              
## [192] "Papua New Guinea"                                    
## [193] "Paraguay"                                            
## [194] "Peru"                                                
## [195] "Philippines"                                         
## [196] "Poland"                                              
## [197] "Portugal"                                            
## [198] "Post-demographic dividend"                           
## [199] "Pre-demographic dividend"                            
## [200] "Puerto Rico"                                         
## [201] "Qatar"                                               
## [202] "Romania"                                             
## [203] "Russian Federation"                                  
## [204] "Rwanda"                                              
## [205] "Samoa"                                               
## [206] "San Marino"                                          
## [207] "Sao Tome and Principe"                               
## [208] "Saudi Arabia"                                        
## [209] "Senegal"                                             
## [210] "Serbia"                                              
## [211] "Seychelles"                                          
## [212] "Sierra Leone"                                        
## [213] "Singapore"                                           
## [214] "Sint Maarten (Dutch part)"                           
## [215] "Slovak Republic"                                     
## [216] "Slovenia"                                            
## [217] "Small states"                                        
## [218] "Solomon Islands"                                     
## [219] "Somalia"                                             
## [220] "South Africa"                                        
## [221] "South Asia (IDA & IBRD)"                             
## [222] "South Asia"                                          
## [223] "South Sudan"                                         
## [224] "Spain"                                               
## [225] "Sri Lanka"                                           
## [226] "St. Kitts and Nevis"                                 
## [227] "St. Lucia"                                           
## [228] "St. Martin (French part)"                            
## [229] "St. Vincent and the Grenadines"                      
## [230] "Sub-Saharan Africa (excluding high income)"          
## [231] "Sub-Saharan Africa (IDA & IBRD countries)"           
## [232] "Sub-Saharan Africa"                                  
## [233] "Sudan"                                               
## [234] "Suriname"                                            
## [235] "Sweden"                                              
## [236] "Switzerland"                                         
## [237] "Syrian Arab Republic"                                
## [238] "Tajikistan"                                          
## [239] "Tanzania"                                            
## [240] "Thailand"                                            
## [241] "Timor-Leste"                                         
## [242] "Togo"                                                
## [243] "Tonga"                                               
## [244] "Trinidad and Tobago"                                 
## [245] "Tunisia"                                             
## [246] "Turkiye"                                             
## [247] "Turkmenistan"                                        
## [248] "Turks and Caicos Islands"                            
## [249] "Tuvalu"                                              
## [250] "Uganda"                                              
## [251] "Ukraine"                                             
## [252] "United Arab Emirates"                                
## [253] "United Kingdom"                                      
## [254] "United States"                                       
## [255] "Upper middle income"                                 
## [256] "Uruguay"                                             
## [257] "Uzbekistan"                                          
## [258] "Vanuatu"                                             
## [259] "Venezuela, RB"                                       
## [260] "Viet Nam"                                            
## [261] "Virgin Islands (U.S.)"                               
## [262] "West Bank and Gaza"                                  
## [263] "World"                                               
## [264] "Yemen, Rep."                                         
## [265] "Zambia"                                              
## [266] "Zimbabwe"

Kayıp Veri Seti Oluşturma

library(tidyverse)
library(dplyr)
kayıp_veri <- data_WDI %>%
  group_by(country) %>%
  summarize(missing_count = sum(is.na(SL.UEM.TOTL.ZS)))
print(kayıp_veri)

## # A tibble: 266 × 2
##    country                     missing_count
##    <chr>                               <int>
##  1 Afghanistan                            31
##  2 Africa Eastern and Southern            31
##  3 Africa Western and Central             31
##  4 Albania                                31
##  5 Algeria                                31
##  6 American Samoa                         64
##  7 Andorra                                64
##  8 Angola                                 31
##  9 Antigua and Barbuda                    64
## 10 Arab World                             31
## # ℹ 256 more rows

2005’den Veri Seti

library(explore)
data_WDI_from2005 <- data_WDI %>%
  filter(year>=2005)
data_WDI_from2005 %>% describe_all()

## # A tibble: 6 × 8
##   variable       type     na na_pct unique    min         mean          max
##   <chr>          <chr> <int>  <dbl>  <int>  <dbl>        <dbl>        <dbl>
## 1 country        chr       0    0      266   NA          NA            NA  
## 2 iso2c          chr       0    0      266   NA          NA            NA  
## 3 iso3c          chr       0    0      262   NA          NA            NA  
## 4 year           int       0    0       19 2005        2014          2023  
## 5 SL.UEM.TOTL.ZS dbl     592   11.7   3387    0.1         7.66         37.3
## 6 SP.POP.TOTL    dbl     284    5.6   4733 9912   294726238.   7950946801

50’ten daha olan Kayıp Veri Seti

kayıp_veri_count <- kayıp_veri %>%
  filter(missing_count > 50) 
print(kayıp_veri_count)

## # A tibble: 31 × 2
##    country                missing_count
##    <chr>                          <int>
##  1 American Samoa                    64
##  2 Andorra                           64
##  3 Antigua and Barbuda               64
##  4 Aruba                             64
##  5 Bermuda                           64
##  6 British Virgin Islands            64
##  7 Cayman Islands                    64
##  8 Curacao                           64
##  9 Dominica                          64
## 10 Faroe Islands                     64
## # ℹ 21 more rows

Join Left Kodu

Önceden join_left() çalışmadığı için bu aşamada yapayım ama merge() kullanarak.

library(dplyr)
Joint_Table <- merge(data_WDI, kayıp_veri)
Joint_Table %>% describe_all()

## # A tibble: 7 × 8
##   variable       type     na na_pct unique    min         mean          max
##   <chr>          <chr> <int>  <dbl>  <int>  <dbl>        <dbl>        <dbl>
## 1 country        chr       0    0      266   NA          NA            NA  
## 2 iso2c          chr       0    0      266   NA          NA            NA  
## 3 iso3c          chr       0    0      262   NA          NA            NA  
## 4 year           int       0    0       64 1960        1992.         2023  
## 5 SL.UEM.TOTL.ZS dbl    9272   54.5   5401    0.1         7.92         38.8
## 6 SP.POP.TOTL    dbl     359    2.1  16460 2646   215973749.   7950946801  
## 7 missing_count  int       0    0        4   31          34.9          64

Geompoint Kullanma

ggplot(data = unemployment_data, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_point() +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")

Geomtext Kullanma

library(dplyr)
library(ggplot2)
unemployment_data <- unemployment_data %>%
  mutate(country_label = ifelse(country == "Spain", "Spain", "Switzerland"))
ggplot(data = unemployment_data, aes(x = year, y = SL.UEM.TOTL.ZS, color = country)) +
  geom_point() +
  geom_text(aes(label = country_label), vjust = -0.5, size = 3) +
  labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")

Sene Seçimi

library(dplyr)
data_WDI_2022 <- data_WDI %>% 
  filter(year == 2022)

library(dplyr)
data_WDI_2022_AF <- data_WDI_2022 %>% 
  filter(iso2c != "AF")

library(ggplot2)
ggplot(data_WDI_2022, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS, label= iso2c)) + geom_point() + geom_text()

library(ggplot2)
ggplot(data_WDI_2022_AF, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS, label= iso2c, colour = country)) + geom_point() + geom_text()

Dünya Toplam Verisi Oluşturma

Burada dünya toplam nüfüsü, toplam dunya işsizlik ve oranı oluşturacağız

dünya_datası <- data_WDI %>% group_by(year) %>%
  summarise(dünyaişsızlık = sum(SL.UEM.TOTL.ZS)/16758*100,
            dünyanufusu = sum(SP.POP.TOTL),
            oranı = dünyaişsızlık/dünyanufusu)

library(ggplot2)
ggplot(dünya_datası, aes(x= year, y= oranı, colour= "red" )) +
  labs(title = "Oranı",
       y = "oranı",
       x = "sene") +
  theme_linedraw()

data <- left_join(data_WDI, dünya_datası, by= "year")

Görüldü gibi üstteki kodu graphic üzerinde göstermiyor çünkü tabloda veriler “N/A” gösteriyor. Ama veri seti değistirerek çalıştırmaya çalısayım

dünya_datası_2 <- unemployment_data  %>% group_by(year) %>%
  summarise(dünyaişsızlık = sum(SL.UEM.TOTL.ZS))
print(dünya_datası_2)

## # A tibble: 33 × 2
##     year dünyaişsızlık
##    <int>         <dbl>
##  1  1990          NA  
##  2  1991          17.8
##  3  1992          20.0
##  4  1993          25.7
##  5  1994          27.8
##  6  1995          25.8
##  7  1996          25.8
##  8  1997          24.8
##  9  1998          22.2
## 10  1999          18.5
## # ℹ 23 more rows

dünya_datası_3 <- data_WDI  %>% group_by(country) %>%
  summarise(dünyanufusu = sum(SP.POP.TOTL))
print(dünya_datası_3)

## # A tibble: 266 × 2
##    country                     dünyanufusu
##    <chr>                             <dbl>
##  1 Afghanistan                          NA
##  2 Africa Eastern and Southern          NA
##  3 Africa Western and Central           NA
##  4 Albania                              NA
##  5 Algeria                              NA
##  6 American Samoa                       NA
##  7 Andorra                              NA
##  8 Angola                               NA
##  9 Antigua and Barbuda                  NA
## 10 Arab World                           NA
## # ℹ 256 more rows

merge_veri <- cross_join(dünya_datası_2, dünya_datası_3)

Animasyon Grafik

# Check the structure of the data
str(data_WDI_2022)

## 'data.frame':    266 obs. of  6 variables:
##  $ country       : chr  "Afghanistan" "Africa Eastern and Southern" "Africa Western and Central" "Albania" ...
##  $ iso2c         : chr  "AF" "ZH" "ZI" "AL" ...
##  $ iso3c         : chr  "AFG" "AFE" "AFW" "ALB" ...
##  $ year          : int  2022 2022 2022 2022 2022 2022 2022 2022 2022 2022 ...
##  $ SL.UEM.TOTL.ZS: num  14.1 7.75 3.81 11.63 12.49 ...
##   ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
##  $ SP.POP.TOTL   : num  4.11e+07 7.21e+08 4.90e+08 2.78e+06 4.49e+07 ...
##   ..- attr(*, "label")= chr "Population, total"

# Check if there are any missing or non-numeric values in the Year column
any(!is.finite(data_WDI_2022$Year))

## [1] FALSE

Animated Graph of Unemployement

install.packages(c("ggplot2", "dplyr", "gganimate", "WDI"))

## Warning: packages 'ggplot2', 'dplyr', 'WDI' are in use and will not be
## installed

## package 'gganimate' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages

library(ggplot2)
library(dplyr)
library(gganimate)

## Warning: package 'gganimate' was built under R version 4.3.3

library(WDI)
data <- WDI(country = "all", indicator = "SL.UEM.TOTL.ZS", start = 1991, end = 2020)
countries <- c("United States", "Germany", "France", "China", "India", "Spain", "Switzerland", 
               "Brazil", "Japan", "United Kingdom", "Russia", "Canada")
data <- data[data$country %in% countries, ]
data <- data %>%
  group_by(country, year) %>%
  summarise(unemployment_rate = mean(SL.UEM.TOTL.ZS, na.rm = TRUE))

## `summarise()` has grouped output by 'country'. You can override using the
## `.groups` argument.

if (nrow(data) == 0) {
  stop("No valid data available for selected countries.")
}
plot <- ggplot(data, aes(x = year, y = unemployment_rate, color = country, group = country)) +
  geom_line(size = 1) +
  labs(title = "Unemployment Rate Over Time",
       x = "Year",
       y = "Unemployment Rate (%)") +
  theme_minimal() +
  transition_reveal(year)

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

anim_save("unemployment_animation.gif", animate(plot, nframes = 100))

## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?
## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?

knitr::include_graphics("unemployment_animation.gif")

Dünya Verimlilik Ve İnsani Sermaye

install.packages("WDI")
library(WDI)
library(ggplot2)
world_gdp <- WDI(indicator = "NY.GDP.MKTP.CD", start = 1990, end = 2020, extra = FALSE)
literacy_rate <- WDI(indicator = "SE.ADT.LITR.ZS", start = 1990, end = 2020, extra = FALSE)
combined_data <- merge(world_gdp, literacy_rate, by = c("iso2c", "year"), all = TRUE)
combined_data <- combined_data[complete.cases(combined_data), ]
names(combined_data) <- c("Country", "Year", "GDP", "Literacy_Rate")
ggplot(combined_data, aes(x = GDP, y = Literacy_Rate)) +
  geom_point() +
  labs(title = "World GDP vs. Literacy Rate",
       x = "World Gross Domestic Product (GDP)",
       y = "Literacy Rate (%)") +
  theme_minimal()

2019 Verimlilik Ve İnsani Sermaye Çizim

# Filter the combined data for the year 2019
filtered_data <- combined_data[combined_data$Year == 2019, ]

# Create scatter plot with different colors for GDP and Literacy Rate
ggplot(filtered_data, aes(x = GDP, y = Literacy_Rate, color = Country)) +
  geom_point() +
  labs(title = "World GDP vs. Literacy Rate for 2019",
       x = "World Gross Domestic Product (GDP)",
       y = "Literacy Rate (%)") +
  scale_color_manual(values = rainbow(length(unique(filtered_data$Country))), 
                     breaks = unique(filtered_data$Country)) +
  theme_minimal()

2019 yılında, Dünya GSYİH ile Okuryazarlık Oranı arasında olumlu bir ilişki gözlemlenmektedir. Bu ilişki, daha yüksek ekonomik çıktı seviyelerine sahip ülkelerin genellikle daha yüksek okuryazarlık oranlarına sahip olduğunu göstermektedir. Ancak, ülkeler arasında önemli farklılıklar bulunmaktadır ve bazı bölgeler hala eğitim ve ekonomik eşitsizliklerle mücadele etmektedir. Bu nedenle, politika yapıcılar, eğitim ve okuryazarlık programlarına yatırım yaparak, uzun vadeli ekonomik kalkınma ve insan gelişimini teşvik etmek için stratejiler geliştirmelidirler. Bölgesel dinamikler ve uzun vadeli trendler dikkate alınarak, politikaların etkinliği değerlendirilmeli ve kapsayıcı büyümeyi teşvik etmek için gereken adımlar atılmalıdır.

Ekonometri Vize Projesi

Hamidou Souleymanou

2024-02-21