-R’yi yükledim
-R Studio’yi yükledim
-Yeni proje oluşturup yazmaya başladım
-R Markdown’ı yükledim
-Tema değistirdim
R paketleri, R işlevlerinin, uyumlu kodların ve örnek verilerin bir koleksiyonudur. R ortamında “Library” adı verilen bir dizin altında saklanırlar. Varsayılan olarak R, kurulum sırasında bir dizi paket yükler. Daha sonra belirli bir amaç için ihtiyaç duyulduğunda daha fazla paket eklenir. R konsolunu başlattığımızda varsayılan olarak yalnızca varsayılan paketler mevcuttur. Zaten kurulu olan diğer paketlerin, onları kullanacak R programı tarafından kullanılabilmesi için açıkça yüklenmesi gerekir. R dilinde mevcut olan tüm paketler R Paketleri’nde listelenir.
R paketleri, belirli analizleri gerçekleştirmek için önceden yazılmış fonksiyonlar içerir. Bu fonksiyonlar, belirli istatistiksel hesaplamalar, veri manipülasyonları, görselleştirmeler ve diğer analiz tekniklerini kolaylaştırır.
Birçok R paketi, örnek veri setleri içerir. Bu veri setleri, belirli analizleri denemek veya örnek çalışmalar oluşturmak için kullanılabilir.
R paketleri, verileri görselleştirmek için çeşitli araçlar sağlar. ggplot2 gibi paketler, etkili ve özelleştirilebilir grafikler oluşturmak için kullanılır.
R paketleri, makine öğrenimi, derin öğrenme, zaman serisi analizi, büyük veri analizi gibi ileri analiz tekniklerini uygulamak için kullanılabilir.
R topluluğu sürekli olarak yeni paketler geliştirir ve mevcut paketleri günceller. Bu, kullanıcıların yeni ve gelişmiş araçlara erişimini sağlar.
R paketleri, kodun yeniden kullanılabilirliğini artırır ve projeler arasında kod parçalarını kolayca taşımayı sağlar. Bu, veri bilimcilerin ve analistlerin daha verimli çalışmasına yardımcı olur.
Bazı R paketleri, belirli analizlerin performansını artırmak ve hesaplama sürelerini azaltmak için optimize edilmiştir.
ggplot2, veri görselleştirmesi için popüler bir R paketidir. Grafik Dilbilgisi’ne dayanır ve kullanıcıların verilere katmanlar, estetikler ve eşlemeler ekleyerek karmaşık grafikler oluşturmasını sağlar.
dplyr, R’de veri manipülasyonu için bir pakettir. Ortak veri işleme görevlerini daha kolay ve sezgisel hale getirmek için tasarlanmış bir dizi işlev sağlar. dplyr işlevleri, veri filtreleme, seçme, düzenleme, değiştirme ve özetleme gibi görevler için kullanılır.
caret, Sınıflandırma ve Regresyon Eğitimi anlamına gelir. R’de makine öğrenimi modellerini eğitmek ve ayarlamak için birleşik bir arayüz sağlar. caret, veri ön işleme, özellik seçimi, model eğitimi, model ayarlama ve performans değerlendirmesi için işlevler içerir.
tidyr, veri düzenlemesi için bir R paketidir. Veri çerçevelerini analiz ve görselleştirme için daha kolay bir formata getirmek için araçlar sağlar. tidyr işlevleri genellikle veriyi geniş ve uzun formatlar arasında dönüştürmek, sütunları ayırmak ve birleştirmek, eksik değerlerle başa çıkmak için kullanılır.
randomForest, sınıflandırma ve regresyon görevleri için random forest algoritmasını uygulayan bir R paketidir. Rastgele ormanlar, eğitim sırasında birden fazla karar ağacı oluşturan ve tahminlerini iyileştirmek için bunların tahminlerini birleştiren bir topluluk öğrenme yöntemidir. R’deki randomForest paketi, rastgele orman modelleri oluşturmak, tahminler yapmak ve model performansını değerlendirmek için işlevler sağlar.
chooseCRANmirror(ind = 62)
install.packages(c("WDI", "dplyr", "tidyr", "ggplot2"))
## package 'WDI' successfully unpacked and MD5 sums checked
## package 'dplyr' successfully unpacked and MD5 sums checked
## package 'tidyr' successfully unpacked and MD5 sums checked
## package 'ggplot2' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages
library(WDI)
library(dplyr)
library(tidyr)
library(ggplot2)
countries <- c("ES", "CH")
indicators <- "SL.UEM.TOTL.ZS"
unemployment_data <- WDI(country = countries, indicator = indicators, start = 1990, end = 2022)
print(unemployment_data)
## country iso2c iso3c year SL.UEM.TOTL.ZS
## 1 Switzerland CH CHE 2022 4.30
## 2 Switzerland CH CHE 2021 5.10
## 3 Switzerland CH CHE 2020 4.82
## 4 Switzerland CH CHE 2019 4.39
## 5 Switzerland CH CHE 2018 4.71
## 6 Switzerland CH CHE 2017 4.80
## 7 Switzerland CH CHE 2016 4.92
## 8 Switzerland CH CHE 2015 4.80
## 9 Switzerland CH CHE 2014 4.83
## 10 Switzerland CH CHE 2013 4.75
## 11 Switzerland CH CHE 2012 4.49
## 12 Switzerland CH CHE 2011 4.41
## 13 Switzerland CH CHE 2010 4.81
## 14 Switzerland CH CHE 2009 4.11
## 15 Switzerland CH CHE 2008 3.35
## 16 Switzerland CH CHE 2007 3.64
## 17 Switzerland CH CHE 2006 3.99
## 18 Switzerland CH CHE 2005 4.44
## 19 Switzerland CH CHE 2004 4.32
## 20 Switzerland CH CHE 2003 4.12
## 21 Switzerland CH CHE 2002 2.92
## 22 Switzerland CH CHE 2001 2.49
## 23 Switzerland CH CHE 2000 2.66
## 24 Switzerland CH CHE 1999 3.05
## 25 Switzerland CH CHE 1998 3.57
## 26 Switzerland CH CHE 1997 4.13
## 27 Switzerland CH CHE 1996 3.68
## 28 Switzerland CH CHE 1995 3.09
## 29 Switzerland CH CHE 1994 3.58
## 30 Switzerland CH CHE 1993 3.55
## 31 Switzerland CH CHE 1992 2.34
## 32 Switzerland CH CHE 1991 1.82
## 33 Switzerland CH CHE 1990 NA
## 34 Spain ES ESP 2022 12.92
## 35 Spain ES ESP 2021 14.78
## 36 Spain ES ESP 2020 15.53
## 37 Spain ES ESP 2019 14.10
## 38 Spain ES ESP 2018 15.25
## 39 Spain ES ESP 2017 17.22
## 40 Spain ES ESP 2016 19.64
## 41 Spain ES ESP 2015 22.06
## 42 Spain ES ESP 2014 24.44
## 43 Spain ES ESP 2013 26.09
## 44 Spain ES ESP 2012 24.79
## 45 Spain ES ESP 2011 21.39
## 46 Spain ES ESP 2010 19.86
## 47 Spain ES ESP 2009 17.86
## 48 Spain ES ESP 2008 11.25
## 49 Spain ES ESP 2007 8.23
## 50 Spain ES ESP 2006 8.45
## 51 Spain ES ESP 2005 9.15
## 52 Spain ES ESP 2004 11.09
## 53 Spain ES ESP 2003 11.28
## 54 Spain ES ESP 2002 11.15
## 55 Spain ES ESP 2001 10.35
## 56 Spain ES ESP 2000 13.79
## 57 Spain ES ESP 1999 15.48
## 58 Spain ES ESP 1998 18.67
## 59 Spain ES ESP 1997 20.70
## 60 Spain ES ESP 1996 22.14
## 61 Spain ES ESP 1995 22.68
## 62 Spain ES ESP 1994 24.21
## 63 Spain ES ESP 1993 22.16
## 64 Spain ES ESP 1992 17.70
## 65 Spain ES ESP 1991 15.93
## 66 Spain ES ESP 1990 NA
ggplot(data = unemployment_data, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")
1990 ile 2022 arasında, İspanya’da işsizlik yüksek seyretti, özellikle 2008’deki finansal kriz sonrasında. İsviçre ise düşük ve istikrarlı işsizlik seviyelerini sürdürdü. İspanya ekonomisi zorluklarla boğuşurken, İsviçre çeşitlendirilmiş ekonomisi ve sağlam işgücü politikalarıyla olumlu bir istihdam ortamını korudu.
str kodu, R programlama dilindeki bir fonksiyondur. Bu fonksiyon, bir R nesnesinin yapısını (structure) gösteren bilgileri ekrana yazdırır. Yani, bir veri nesnesinin içeriği hakkında genel bir fikir edinmek için kullanılır.
Örneğin, bir veri çerçevesi veya bir listedeki değişkenlerin tiplerini, uzunluklarını ve değerlerini görmek için str() fonksiyonu kullanılabilir.
str(unemployment_data)
## 'data.frame': 66 obs. of 5 variables:
## $ country : chr "Switzerland" "Switzerland" "Switzerland" "Switzerland" ...
## $ iso2c : chr "CH" "CH" "CH" "CH" ...
## $ iso3c : chr "CHE" "CHE" "CHE" "CHE" ...
## $ year : int 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 ...
## $ SL.UEM.TOTL.ZS: num 4.3 5.1 4.82 4.39 4.71 4.8 4.92 4.8 4.83 4.75 ...
## ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
## - attr(*, "lastupdated")= chr "2024-03-28"
## - attr(*, "label")= chr [1:66] "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" "Unemployment, total (% of total labor force) (modeled ILO estimate)" ...
“explore” kodu, R dilinde doğrudan bir fonksiyon değildir. Ancak, veri keşfi, analizi ve görselleştirmesi için kullanılan bir dizi işlemin genel adıdır. Bu işlemler, veri setinin yapısını anlamak, değişkenler arasındaki ilişkileri incelemek, veri dağılımlarını görselleştirmek ve veri setinin genel özelliklerini belirlemek gibi adımları içerebilir.
Explore paketinin bir parçası olan ““describe_all()”” işlevi, bir veri kümesindeki tüm sütunlar (değişkenler) için açıklayıcı istatistikler üretmek için kullanılır. Bir veri kümesine uygulandığında, her sütun için ortalama, medyan, standart sapma, minimum, maksimum ve çeyreklik gibi istatistikleri hesaplar ve görüntüler.
install.packages("explore")
## package 'explore' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages
library(explore)
describe_all(unemployment_data)
## # A tibble: 5 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 2 NA NA NA
## 2 iso2c chr 0 0 2 NA NA NA
## 3 iso3c chr 0 0 2 NA NA NA
## 4 year int 0 0 33 1990 2006 2022
## 5 SL.UEM.TOTL.ZS dbl 2 3 64 1.82 10.4 26.1
%>%, R programlama dilinde yaygın olarak kullanılan bir işlev olan “pipe” operatörüdür. Tidyverse ve ya dplyr paketi içerisinde bulunur ve daha okunabilir ve işlevsel kod yazmak için kullanılır.
%>% operatörü, bir nesne veya değeri, bir işlevin ilk argümanı olarak alır ve bir sonraki işleve iletir. Bu sayede kodunuzdaki işlem adımlarını daha düzenli hale getirir ve kodunuzun okunabilirliğini artırır.
df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur.
install.packages("tidyverse")
## package 'tidyverse' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages
library(tidyverse)
unemployment_data %>% describe_all()
## # A tibble: 5 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 2 NA NA NA
## 2 iso2c chr 0 0 2 NA NA NA
## 3 iso3c chr 0 0 2 NA NA NA
## 4 year int 0 0 33 1990 2006 2022
## 5 SL.UEM.TOTL.ZS dbl 2 3 64 1.82 10.4 26.1
Şimdi bu aşamada “unemployment_data$country” kullanarak ek_bilgi “values” oluşturdum.
Sonra da “cross_join” ve “merge” kodları kullanacağız.Çapraz birleştirme (veya Kartezyen birleştirme), veri setlerinin kartezyen çarpımını oluşturan bir birleştirme işlemidir. Bu işlemde, ilk veri setinin her bir satırı, ikinci veri setinin her bir satırıyla birleştirilir, böylece tüm olası kombinasyonlar elde edilir.
R’de, dplyr paketini kullanıyorsanız, özellikle bir cross_join() fonksiyonu bulunmamaktadır. Bunun yerine, birleştirme işlemi için merge() fonksiyonunu kullanarak çapraz birleşim elde edebilirsiniz.
Onları kullanarak “df” ve “df_merged” veri seti oluşturdum
“filter” kodu kullanarak “filter_df” veri seti oluşturdum ve son olarak “describe_all” ile bitirerek R koduyu çalıştırdım
ek_bilgi <- unemployment_data$country
library(dplyr)
filter_df <- unemployment_data %>% filter(country != "spain")
unemployment_data %>% describe_all()
## # A tibble: 5 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 2 NA NA NA
## 2 iso2c chr 0 0 2 NA NA NA
## 3 iso3c chr 0 0 2 NA NA NA
## 4 year int 0 0 33 1990 2006 2022
## 5 SL.UEM.TOTL.ZS dbl 2 3 64 1.82 10.4 26.1
Burası da “filter” kodu kullanarak her iki ülkenin ayrı veri seti elde ettim. O ayri veri setinden de her ülkenin ayrı grafiği oluşturdum
udch <- unemployment_data %>% filter(iso2c %in% "CH")
udes <- unemployment_data %>% filter(iso2c %in% "ES")
ggplot(data = udch, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Switzerland")
ggplot(data = udes, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_line() +
labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate of Spain")
Başka kodları ve fonksıyonları kullanmak amacıyla bütün ülkelerin verilerini yükleyeceğim
library(WDI)
data_WDI <- WDI(country = "all", indicator = c("SL.UEM.TOTL.ZS", "SP.POP.TOTL"))
unique() fonksiyonu, R programlama dilinde bir vektörün ya da diğer veri yapılarının (data frame, array vb.) benzersiz (unique) elemanlarını döndürür. Yani aynı elemandan birden fazla varsa, bu elemanları yalnızca bir kez gösterir.
unique_countries <- unique(data_WDI$country)
print(unique_countries)
## [1] "Afghanistan"
## [2] "Africa Eastern and Southern"
## [3] "Africa Western and Central"
## [4] "Albania"
## [5] "Algeria"
## [6] "American Samoa"
## [7] "Andorra"
## [8] "Angola"
## [9] "Antigua and Barbuda"
## [10] "Arab World"
## [11] "Argentina"
## [12] "Armenia"
## [13] "Aruba"
## [14] "Australia"
## [15] "Austria"
## [16] "Azerbaijan"
## [17] "Bahamas, The"
## [18] "Bahrain"
## [19] "Bangladesh"
## [20] "Barbados"
## [21] "Belarus"
## [22] "Belgium"
## [23] "Belize"
## [24] "Benin"
## [25] "Bermuda"
## [26] "Bhutan"
## [27] "Bolivia"
## [28] "Bosnia and Herzegovina"
## [29] "Botswana"
## [30] "Brazil"
## [31] "British Virgin Islands"
## [32] "Brunei Darussalam"
## [33] "Bulgaria"
## [34] "Burkina Faso"
## [35] "Burundi"
## [36] "Cabo Verde"
## [37] "Cambodia"
## [38] "Cameroon"
## [39] "Canada"
## [40] "Caribbean small states"
## [41] "Cayman Islands"
## [42] "Central African Republic"
## [43] "Central Europe and the Baltics"
## [44] "Chad"
## [45] "Channel Islands"
## [46] "Chile"
## [47] "China"
## [48] "Colombia"
## [49] "Comoros"
## [50] "Congo, Dem. Rep."
## [51] "Congo, Rep."
## [52] "Costa Rica"
## [53] "Cote d'Ivoire"
## [54] "Croatia"
## [55] "Cuba"
## [56] "Curacao"
## [57] "Cyprus"
## [58] "Czechia"
## [59] "Denmark"
## [60] "Djibouti"
## [61] "Dominica"
## [62] "Dominican Republic"
## [63] "Early-demographic dividend"
## [64] "East Asia & Pacific (excluding high income)"
## [65] "East Asia & Pacific (IDA & IBRD countries)"
## [66] "East Asia & Pacific"
## [67] "Ecuador"
## [68] "Egypt, Arab Rep."
## [69] "El Salvador"
## [70] "Equatorial Guinea"
## [71] "Eritrea"
## [72] "Estonia"
## [73] "Eswatini"
## [74] "Ethiopia"
## [75] "Euro area"
## [76] "Europe & Central Asia (excluding high income)"
## [77] "Europe & Central Asia (IDA & IBRD countries)"
## [78] "Europe & Central Asia"
## [79] "European Union"
## [80] "Faroe Islands"
## [81] "Fiji"
## [82] "Finland"
## [83] "Fragile and conflict affected situations"
## [84] "France"
## [85] "French Polynesia"
## [86] "Gabon"
## [87] "Gambia, The"
## [88] "Georgia"
## [89] "Germany"
## [90] "Ghana"
## [91] "Gibraltar"
## [92] "Greece"
## [93] "Greenland"
## [94] "Grenada"
## [95] "Guam"
## [96] "Guatemala"
## [97] "Guinea-Bissau"
## [98] "Guinea"
## [99] "Guyana"
## [100] "Haiti"
## [101] "Heavily indebted poor countries (HIPC)"
## [102] "High income"
## [103] "Honduras"
## [104] "Hong Kong SAR, China"
## [105] "Hungary"
## [106] "IBRD only"
## [107] "Iceland"
## [108] "IDA & IBRD total"
## [109] "IDA blend"
## [110] "IDA only"
## [111] "IDA total"
## [112] "India"
## [113] "Indonesia"
## [114] "Iran, Islamic Rep."
## [115] "Iraq"
## [116] "Ireland"
## [117] "Isle of Man"
## [118] "Israel"
## [119] "Italy"
## [120] "Jamaica"
## [121] "Japan"
## [122] "Jordan"
## [123] "Kazakhstan"
## [124] "Kenya"
## [125] "Kiribati"
## [126] "Korea, Dem. People's Rep."
## [127] "Korea, Rep."
## [128] "Kosovo"
## [129] "Kuwait"
## [130] "Kyrgyz Republic"
## [131] "Lao PDR"
## [132] "Late-demographic dividend"
## [133] "Latin America & Caribbean (excluding high income)"
## [134] "Latin America & Caribbean"
## [135] "Latin America & the Caribbean (IDA & IBRD countries)"
## [136] "Latvia"
## [137] "Least developed countries: UN classification"
## [138] "Lebanon"
## [139] "Lesotho"
## [140] "Liberia"
## [141] "Libya"
## [142] "Liechtenstein"
## [143] "Lithuania"
## [144] "Low & middle income"
## [145] "Low income"
## [146] "Lower middle income"
## [147] "Luxembourg"
## [148] "Macao SAR, China"
## [149] "Madagascar"
## [150] "Malawi"
## [151] "Malaysia"
## [152] "Maldives"
## [153] "Mali"
## [154] "Malta"
## [155] "Marshall Islands"
## [156] "Mauritania"
## [157] "Mauritius"
## [158] "Mexico"
## [159] "Micronesia, Fed. Sts."
## [160] "Middle East & North Africa (excluding high income)"
## [161] "Middle East & North Africa (IDA & IBRD countries)"
## [162] "Middle East & North Africa"
## [163] "Middle income"
## [164] "Moldova"
## [165] "Monaco"
## [166] "Mongolia"
## [167] "Montenegro"
## [168] "Morocco"
## [169] "Mozambique"
## [170] "Myanmar"
## [171] "Namibia"
## [172] "Nauru"
## [173] "Nepal"
## [174] "Netherlands"
## [175] "New Caledonia"
## [176] "New Zealand"
## [177] "Nicaragua"
## [178] "Niger"
## [179] "Nigeria"
## [180] "North America"
## [181] "North Macedonia"
## [182] "Northern Mariana Islands"
## [183] "Norway"
## [184] "Not classified"
## [185] "OECD members"
## [186] "Oman"
## [187] "Other small states"
## [188] "Pacific island small states"
## [189] "Pakistan"
## [190] "Palau"
## [191] "Panama"
## [192] "Papua New Guinea"
## [193] "Paraguay"
## [194] "Peru"
## [195] "Philippines"
## [196] "Poland"
## [197] "Portugal"
## [198] "Post-demographic dividend"
## [199] "Pre-demographic dividend"
## [200] "Puerto Rico"
## [201] "Qatar"
## [202] "Romania"
## [203] "Russian Federation"
## [204] "Rwanda"
## [205] "Samoa"
## [206] "San Marino"
## [207] "Sao Tome and Principe"
## [208] "Saudi Arabia"
## [209] "Senegal"
## [210] "Serbia"
## [211] "Seychelles"
## [212] "Sierra Leone"
## [213] "Singapore"
## [214] "Sint Maarten (Dutch part)"
## [215] "Slovak Republic"
## [216] "Slovenia"
## [217] "Small states"
## [218] "Solomon Islands"
## [219] "Somalia"
## [220] "South Africa"
## [221] "South Asia (IDA & IBRD)"
## [222] "South Asia"
## [223] "South Sudan"
## [224] "Spain"
## [225] "Sri Lanka"
## [226] "St. Kitts and Nevis"
## [227] "St. Lucia"
## [228] "St. Martin (French part)"
## [229] "St. Vincent and the Grenadines"
## [230] "Sub-Saharan Africa (excluding high income)"
## [231] "Sub-Saharan Africa (IDA & IBRD countries)"
## [232] "Sub-Saharan Africa"
## [233] "Sudan"
## [234] "Suriname"
## [235] "Sweden"
## [236] "Switzerland"
## [237] "Syrian Arab Republic"
## [238] "Tajikistan"
## [239] "Tanzania"
## [240] "Thailand"
## [241] "Timor-Leste"
## [242] "Togo"
## [243] "Tonga"
## [244] "Trinidad and Tobago"
## [245] "Tunisia"
## [246] "Turkiye"
## [247] "Turkmenistan"
## [248] "Turks and Caicos Islands"
## [249] "Tuvalu"
## [250] "Uganda"
## [251] "Ukraine"
## [252] "United Arab Emirates"
## [253] "United Kingdom"
## [254] "United States"
## [255] "Upper middle income"
## [256] "Uruguay"
## [257] "Uzbekistan"
## [258] "Vanuatu"
## [259] "Venezuela, RB"
## [260] "Viet Nam"
## [261] "Virgin Islands (U.S.)"
## [262] "West Bank and Gaza"
## [263] "World"
## [264] "Yemen, Rep."
## [265] "Zambia"
## [266] "Zimbabwe"
library(tidyverse)
library(dplyr)
kayıp_veri <- data_WDI %>%
group_by(country) %>%
summarize(missing_count = sum(is.na(SL.UEM.TOTL.ZS)))
print(kayıp_veri)
## # A tibble: 266 × 2
## country missing_count
## <chr> <int>
## 1 Afghanistan 31
## 2 Africa Eastern and Southern 31
## 3 Africa Western and Central 31
## 4 Albania 31
## 5 Algeria 31
## 6 American Samoa 64
## 7 Andorra 64
## 8 Angola 31
## 9 Antigua and Barbuda 64
## 10 Arab World 31
## # ℹ 256 more rows
library(explore)
data_WDI_from2005 <- data_WDI %>%
filter(year>=2005)
data_WDI_from2005 %>% describe_all()
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 19 2005 2014 2023
## 5 SL.UEM.TOTL.ZS dbl 592 11.7 3387 0.1 7.66 37.3
## 6 SP.POP.TOTL dbl 284 5.6 4733 9912 294726238. 7950946801
kayıp_veri_count <- kayıp_veri %>%
filter(missing_count > 50)
print(kayıp_veri_count)
## # A tibble: 31 × 2
## country missing_count
## <chr> <int>
## 1 American Samoa 64
## 2 Andorra 64
## 3 Antigua and Barbuda 64
## 4 Aruba 64
## 5 Bermuda 64
## 6 British Virgin Islands 64
## 7 Cayman Islands 64
## 8 Curacao 64
## 9 Dominica 64
## 10 Faroe Islands 64
## # ℹ 21 more rows
Önceden join_left() çalışmadığı için bu aşamada yapayım ama merge() kullanarak.
library(dplyr)
Joint_Table <- merge(data_WDI, kayıp_veri)
Joint_Table %>% describe_all()
## # A tibble: 7 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 64 1960 1992. 2023
## 5 SL.UEM.TOTL.ZS dbl 9272 54.5 5401 0.1 7.92 38.8
## 6 SP.POP.TOTL dbl 359 2.1 16460 2646 215973749. 7950946801
## 7 missing_count int 0 0 4 31 34.9 64
ggplot(data = unemployment_data, aes(x = year, SL.UEM.TOTL.ZS, color = country )) + geom_point() +
labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")
library(dplyr)
library(ggplot2)
unemployment_data <- unemployment_data %>%
mutate(country_label = ifelse(country == "Spain", "Spain", "Switzerland"))
ggplot(data = unemployment_data, aes(x = year, y = SL.UEM.TOTL.ZS, color = country)) +
geom_point() +
geom_text(aes(label = country_label), vjust = -0.5, size = 3) +
labs(x = "Year", y = "Unemployment Rate (%)", title = "Unemployment Rate Comparison: Spain vs Switzerland")
library(dplyr)
data_WDI_2022 <- data_WDI %>%
filter(year == 2022)
library(dplyr)
data_WDI_2022_AF <- data_WDI_2022 %>%
filter(iso2c != "AF")
library(ggplot2)
ggplot(data_WDI_2022, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS, label= iso2c)) + geom_point() + geom_text()
library(ggplot2)
ggplot(data_WDI_2022_AF, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS, label= iso2c, colour = country)) + geom_point() + geom_text()
Burada dünya toplam nüfüsü, toplam dunya işsizlik ve oranı oluşturacağız
dünya_datası <- data_WDI %>% group_by(year) %>%
summarise(dünyaişsızlık = sum(SL.UEM.TOTL.ZS)/16758*100,
dünyanufusu = sum(SP.POP.TOTL),
oranı = dünyaişsızlık/dünyanufusu)
library(ggplot2)
ggplot(dünya_datası, aes(x= year, y= oranı, colour= "red" )) +
labs(title = "Oranı",
y = "oranı",
x = "sene") +
theme_linedraw()
data <- left_join(data_WDI, dünya_datası, by= "year")
Görüldü gibi üstteki kodu graphic üzerinde göstermiyor çünkü tabloda veriler “N/A” gösteriyor. Ama veri seti değistirerek çalıştırmaya çalısayım
dünya_datası_2 <- unemployment_data %>% group_by(year) %>%
summarise(dünyaişsızlık = sum(SL.UEM.TOTL.ZS))
print(dünya_datası_2)
## # A tibble: 33 × 2
## year dünyaişsızlık
## <int> <dbl>
## 1 1990 NA
## 2 1991 17.8
## 3 1992 20.0
## 4 1993 25.7
## 5 1994 27.8
## 6 1995 25.8
## 7 1996 25.8
## 8 1997 24.8
## 9 1998 22.2
## 10 1999 18.5
## # ℹ 23 more rows
dünya_datası_3 <- data_WDI %>% group_by(country) %>%
summarise(dünyanufusu = sum(SP.POP.TOTL))
print(dünya_datası_3)
## # A tibble: 266 × 2
## country dünyanufusu
## <chr> <dbl>
## 1 Afghanistan NA
## 2 Africa Eastern and Southern NA
## 3 Africa Western and Central NA
## 4 Albania NA
## 5 Algeria NA
## 6 American Samoa NA
## 7 Andorra NA
## 8 Angola NA
## 9 Antigua and Barbuda NA
## 10 Arab World NA
## # ℹ 256 more rows
merge_veri <- cross_join(dünya_datası_2, dünya_datası_3)
# Check the structure of the data
str(data_WDI_2022)
## 'data.frame': 266 obs. of 6 variables:
## $ country : chr "Afghanistan" "Africa Eastern and Southern" "Africa Western and Central" "Albania" ...
## $ iso2c : chr "AF" "ZH" "ZI" "AL" ...
## $ iso3c : chr "AFG" "AFE" "AFW" "ALB" ...
## $ year : int 2022 2022 2022 2022 2022 2022 2022 2022 2022 2022 ...
## $ SL.UEM.TOTL.ZS: num 14.1 7.75 3.81 11.63 12.49 ...
## ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
## $ SP.POP.TOTL : num 4.11e+07 7.21e+08 4.90e+08 2.78e+06 4.49e+07 ...
## ..- attr(*, "label")= chr "Population, total"
# Check if there are any missing or non-numeric values in the Year column
any(!is.finite(data_WDI_2022$Year))
## [1] FALSE
install.packages(c("ggplot2", "dplyr", "gganimate", "WDI"))
## Warning: packages 'ggplot2', 'dplyr', 'WDI' are in use and will not be
## installed
## package 'gganimate' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Hamıdou Souleymanou\AppData\Local\Temp\Rtmp4qy1JG\downloaded_packages
library(ggplot2)
library(dplyr)
library(gganimate)
## Warning: package 'gganimate' was built under R version 4.3.3
library(WDI)
data <- WDI(country = "all", indicator = "SL.UEM.TOTL.ZS", start = 1991, end = 2020)
countries <- c("United States", "Germany", "France", "China", "India", "Spain", "Switzerland",
"Brazil", "Japan", "United Kingdom", "Russia", "Canada")
data <- data[data$country %in% countries, ]
data <- data %>%
group_by(country, year) %>%
summarise(unemployment_rate = mean(SL.UEM.TOTL.ZS, na.rm = TRUE))
## `summarise()` has grouped output by 'country'. You can override using the
## `.groups` argument.
if (nrow(data) == 0) {
stop("No valid data available for selected countries.")
}
plot <- ggplot(data, aes(x = year, y = unemployment_rate, color = country, group = country)) +
geom_line(size = 1) +
labs(title = "Unemployment Rate Over Time",
x = "Year",
y = "Unemployment Rate (%)") +
theme_minimal() +
transition_reveal(year)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
anim_save("unemployment_animation.gif", animate(plot, nframes = 100))
## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?
## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?
knitr::include_graphics("unemployment_animation.gif")
install.packages("WDI")
library(WDI)
library(ggplot2)
world_gdp <- WDI(indicator = "NY.GDP.MKTP.CD", start = 1990, end = 2020, extra = FALSE)
literacy_rate <- WDI(indicator = "SE.ADT.LITR.ZS", start = 1990, end = 2020, extra = FALSE)
combined_data <- merge(world_gdp, literacy_rate, by = c("iso2c", "year"), all = TRUE)
combined_data <- combined_data[complete.cases(combined_data), ]
names(combined_data) <- c("Country", "Year", "GDP", "Literacy_Rate")
ggplot(combined_data, aes(x = GDP, y = Literacy_Rate)) +
geom_point() +
labs(title = "World GDP vs. Literacy Rate",
x = "World Gross Domestic Product (GDP)",
y = "Literacy Rate (%)") +
theme_minimal()
# Filter the combined data for the year 2019
filtered_data <- combined_data[combined_data$Year == 2019, ]
# Create scatter plot with different colors for GDP and Literacy Rate
ggplot(filtered_data, aes(x = GDP, y = Literacy_Rate, color = Country)) +
geom_point() +
labs(title = "World GDP vs. Literacy Rate for 2019",
x = "World Gross Domestic Product (GDP)",
y = "Literacy Rate (%)") +
scale_color_manual(values = rainbow(length(unique(filtered_data$Country))),
breaks = unique(filtered_data$Country)) +
theme_minimal()
2019 yılında, Dünya GSYİH ile Okuryazarlık Oranı arasında olumlu bir ilişki gözlemlenmektedir. Bu ilişki, daha yüksek ekonomik çıktı seviyelerine sahip ülkelerin genellikle daha yüksek okuryazarlık oranlarına sahip olduğunu göstermektedir. Ancak, ülkeler arasında önemli farklılıklar bulunmaktadır ve bazı bölgeler hala eğitim ve ekonomik eşitsizliklerle mücadele etmektedir. Bu nedenle, politika yapıcılar, eğitim ve okuryazarlık programlarına yatırım yaparak, uzun vadeli ekonomik kalkınma ve insan gelişimini teşvik etmek için stratejiler geliştirmelidirler. Bölgesel dinamikler ve uzun vadeli trendler dikkate alınarak, politikaların etkinliği değerlendirilmeli ve kapsayıcı büyümeyi teşvik etmek için gereken adımlar atılmalıdır.