Ekonometri 2 Vize
VİZE PROJESİ
R ve Rstudio
- R ve Rstudio programlarını Google’dan yükledim.
- Bu programların nasıl çalıştığını öğrendim.
- Rmdfortmas paketini yükledim
- Projemi oluşturmaya başladım.
- Chatgbt den yardım aldım.
Rmarkdown projesi hazırlama:
- Rmarkdown nasıl çalıştığını öğrendim.
- Rmarkdown’da projemi nasıl hazırlayacağımı öğrendim.
- Projemi Rmakdown’da hazırladım ve internet sitesine yükledim.
PAKETLER
- R programında “paketler” R dilinde önceden yazılmış işlevler, veri setleri ve belgelerin bir araya getirildiği birimlerdir.
- Paketler, R’nin işlevselliğini genişletmek için kullanılır ve R kullanıcılarının işlerini daha verimli hale getirmelerine yardımcı olurlar.
Paketler Nedir?
- RStudio’da “paketler” R programlama dilindeki kütüphanelere karşılık gelir. R paketleri, birçok amaç için önceden yazılmış kodları içerir.Paketler, R kullanıcılarının tekrar kullanacakları yaygın işlevleri yeniden yazmalarını önler.
Paketler neden kullanılır?
- R paketleri, genellikle RStudio veya diğer R geliştirme ortamları üzerinden kurulur, yönetilir ve kullanılır.
- Paketler, R programında çeşitli amaçlar için kullanılır ve kullanım alanları şunları içerir:
1.İşlevsellik Genişletme: R’nin temel işlevleri, temel veri manipülasyonu ve analizi için yeterli olabilir, ancak belirli bir analiz veya görev için özel işlevlere ihtiyaç duyulabilir. Paketler, bu tür özel işlevleri sağlar ve R’nin işlevselliğini genişletir.
2.Veri İşleme ve Analiz: Birçok paket, veri manipülasyonu, temizleme, dönüştürme ve analiz gibi yaygın veri bilimi görevlerini kolaylaştırır.
3.Görselleştirme: R’de birçok görselleştirme paketi bulunmaktadır.Verileri grafiklere dönüştürmek ve görselleştirmek için kullanılır. Bu paketler, verilerin daha anlaşılır hale gelmesine yardımcı olur.
4.İstatistiksel Analiz: R, istatistiksel analizler için güçlü bir araçtır. İstatistiksel analiz paketleri, regresyon analizi, zaman serisi analizi, hipotez testleri gibi istatistiksel teknikleri uygulamak için kullanılır.
5.Makine Öğrenimi ve Derin Öğrenme: R, makine öğrenimi ve derin öğrenme modelleri oluşturmak ve uygulamak için bir dizi paket sağlar.
6.Raporlama ve Dokümantasyon: RMarkdown ve knitr gibi paketler, R kodunu dökümanlar, raporlar ve sunumlar oluşturmak için kullanılır. Bu paketler, R kodunu metin, grafikler ve tablolarla birleştirebilir, böylece veri analizinin sonuçlarını daha etkili bir şekilde sunar.
Paketler Neden önemlidir?
- İstatiksel araştırma ve veri keşfi alanına adım attığınızda, paketleri anlamak ve kullanmak önemlidir. Paketler size bir dizi işlev sağlayarak, veri ediniminden temizliğine ve istatistiksel analizden görselleştirmeye kadar çeşitli görevleri yerine getirmenizi sağlar. Paketler kullanarak karmaşık işlemler için önceden yazılmış kod sağlayrak zaman ve çaba tasarrufu sağlar.
Paketlere Nasıl Erişilir ? Paketler Nasıl Kullanılır ?
Paket Yöneticisini Yükleyin: R dilinde paketleri yönetmek için çeşitli paket yöneticileri vardır. En yaygın kullanılanı install.packages() fonksiyonu aracılığıyla R’de önceden yüklenmiş olarak gelir. Eğer henüz yüklenmemişse, RStudio gibi bir entegre geliştirme ortamı kullanıyorsanız, arayüz üzerinden paketler sekmesinden de yükleyebilirsiniz.
Paketi Yükleyin: İhtiyacınız olan paketi yüklemek için install.packages(“paket_ismi”) komutunu kullanabilirsiniz. Örneğin, ggplot2 paketini yüklemek için şu komutu kullanabilirsiniz:
Paketi Etkinleştirin: Paketi kullanmadan önce, yüklenmiş paketi etkinleştirmeniz gerekir. Bunu yapmak için library(paket_ismi) komutunu kullanabilirsiniz.
5 Tane Paket Örneği ve Kullanım Alanları:
1-ggplot2:
- ggplot2, R’de veri görselleştirmesi için yaygın olarak kullanılan bir pakettir. Veriye dayalı grafik oluşturmak için güçlü bir araçtır ve katmanlar halinde grafikler oluşturmayı sağlar.
- Temel Özellikleri:
1-Açık bir dil yapısı: Grafik oluşturma işlemi, verinin görselleştirilmesi, estetik özelliklerin belirlenmesi, katmanların eklenmesi ve grafik özelliklerinin ayarlanması gibi adımlardan oluşur. Her adım, açık bir dil yapısı içinde ifade edilir.
2-Modüler yapı: Grafik, farklı katmanlardan oluşur ve her katman farklı veri ve görselleştirme özelliklerini temsil eder. Bu modüler yapı, grafik oluşturma sürecini esnek hale getirir.
3-Güçlü ve esnek tema sistemi: ggplot2, grafiklerin görünümünü temalar aracılığıyla kolayca değiştirme imkanı sunar. Bu, grafiklerinizi yayınlama veya sunma gereksinimlerinize uyacak şekilde özelleştirmenize olanak tanır.
4-Veri odaklı: ggplot2, veriye odaklanarak grafik oluşturma sürecini destekler. Veriye dayalı grafik oluşturma, veri setinizin özelliklerini daha iyi anlamanıza yardımcı olabilir.
- Kullanım Alanları:
- Veri analizi, veri görselleştirme
- Önemi:
“ggplot2”, veriye odaklanarak görselleştirme yapmayı sağlar. Bu, verilerinizi daha iyi anlamanıza ve keşfetmenize yardımcı olur. Görselleştirmeler, veriler arasındaki ilişkileri ve desenleri daha net bir şekilde görmeyi sağlar.
“ggplot2” ile grafikler oluşturmak oldukça esnektir ve birçok özelleştirme seçeneği sunar. Grafiklerinizin görünümünü tam olarak istediğiniz gibi ayarlayabilirsiniz. Bu, raporlama, sunumlar veya yayınlar için profesyonel görünümlü grafikler oluşturmanıza olanak tanır.
“ggplot2”, R kullanıcıları arasında yaygın olarak kullanılan bir pakettir ve R topluluğunda büyük bir destek bulunmaktadır. Dolayısıyla, “ggplot2”’yi kullanarak oluşturduğunuz grafikleri başkalarıyla paylaşırken veya çevrimiçi kaynakları kullanırken geniş bir destek ağına erişebilirsiniz.
Veri bilimi ve istatistik alanında çalışan birçok araştırmacı ve profesyonel, “ggplot2”’yi tercih eder. Bu paket, istatistiksel grafiklerin oluşturulması için güçlü bir araçtır ve yaygın olarak kullanılan grafik türlerini destekler.
“ggplot2”, veri görselleştirme konusunda eğitim ve öğretim amaçları için yaygın olarak kullanılan bir araçtır. Özellikle, veri görselleştirme dersleri ve atölyelerinde sıklıkla tercih edilir.
- Paketin Kullanımı
2-tidyr:
- tidyr, veri setlerinin düzenlenmesi ve dönüştürülmesi için bir pakettir. Veri setlerini analiz etmek veya görselleştirmek için uygun bir formata getirmeye yardımcı olur.
- Temel özellikleri:
1-Veri Düzenleme (Data Reshaping):
tidyr, veri çerçevelerindeki veriyi genişten uzuna veya
uzundan genişe dönüştürmek için kullanılır. Bu işlem,
gather() ve spread() gibi fonksiyonlar
aracılığıyla yapılır.
2-Eksik Veri İşleme (Handling Missing Data):
tidyr, eksik değerleri (NA veya
NULL) içeren veri çerçevelerini düzenlemek için
kullanılabilir. Özellikle complete() fonksiyonu, eksik
gözlemleri tamamlamak için kullanılır.
3-Değişken Adları ve Değerleri Ayırma (Separating Variable
Names and Values): tidyr, bir sütun içinde birden
fazla değişkenin (variable) birleştiği durumları ayırmak için
separate() fonksiyonunu sağlar.
4-Değişkenleri Birleştirme (Gathering Variables):
tidyr, birden fazla sütundaki değişkenleri birleştirmek
için unite() fonksiyonunu sağlar.
5-Doldurma (Filling): tidyr, eksik
gözlemleri veya olmayan değerleri belirli bir ölçüde doldurmak için
kullanılabilir. fill() fonksiyonu, önceki gözlemleri
doldurmak için sık kullanılır.
- Kullanım Alanları:
- Veri düzenleme, veri dönüştürme, veri temizleme
- Önemi:
- tidyr` paketi, veri analizi sürecinde veri temizleme, dönüştürme ve düzenleme işlemlerini gerçekleştirmek için önemli bir araçtır ve R kullanıcıları tarafından yaygın olarak tercih edilir.
- Paketin Kullanımı:
3-caret:
- caret, sınıflandırma ve regresyon modelleri oluşturmak için kullanılan kapsamlı bir pakettir. Çeşitli makine öğrenimi algoritmalarını tek bir arayüzde birleştirir ve model seçimi, hiperparametre ayarlama ve model değerlendirme gibi işlemleri kolaylaştırır.
- Temel Özellikleri:
1-Model Seçimi ve Eğitimi: caret,
çeşitli makine öğrenimi algoritmalarını kullanarak sınıflandırma ve
regresyon modelleri oluşturmanıza olanak tanır. Örneğin, destek vektör
makineleri, rastgele ormanlar, gradient arttırma makineleri gibi çeşitli
algoritmaları destekler.
2-Model Ayarlama: caret, model
hiperparametrelerini ayarlamak ve doğrulamak için kullanılan bir dizi
işlev sağlar. Bu, modelin performansını iyileştirmek için en iyi
parametre ayarlarını belirlemenize yardımcı olur.
3-Veri Önişleme: caret, veri önişleme
adımlarını kolaylaştırır. Örneğin, veri normalleştirme,
standartlaştırma, eksik değerleri doldurma gibi ön işleme adımlarını
destekler.
4-Çapraz Doğrulama (Cross-Validation):
caret, k-keşme çapraz doğrulama gibi çeşitli çapraz
doğrulama yöntemlerini uygulayarak model performansını değerlendirmek
için kullanılabilir.
5-Model Değerlendirme: caret, farklı
model performans ölçütlerini (örneğin, doğruluk, hassasiyet, duyarlılık,
F1 puanı, RMSE gibi) hesaplamak için işlevler sağlar. Bu sayede modeller
arasında karşılaştırma yapabilirsiniz.
6-Paralel İşleme Desteği: caret, model
eğitim sürecini paralel işleme kullanarak hızlandırmanıza olanak tanır.
Bu, büyük veri kümeleri üzerinde çalışırken performansı artırır.
7-Model Seçimi ve Kararlılık: caret,
farklı modelleri karşılaştırmanıza ve en uygun modeli seçmenize olanak
tanır. Ayrıca modelin istikrarlılığını değerlendirmek için tekrarlanan
çapraz doğrulama işlemlerini sağlar.
- Kullanım Alanları:
- Makine öğrenimi, sınıflandırma, regresyon, model seçimi ve değerlendirme.
- Önemi:
- Makine öğrenimi projelerini daha hızlı, etkili ve güvenilir bir
şekilde gerçekleştirmek için
caretpaketi büyük bir öneme sahiptir.
- Paketin Kullanımı:
4-shiny:
- shiny, interaktif web uygulamaları oluşturmak için kullanılan bir pakettir. R kullanarak veri analizlerini veya görselleştirmelerini etkileşimli bir şekilde sunmak için kullanılır.
- Temel Özellikleri:
1-Reaktif Programlama: shiny, reaktif
programlama paradigmalarını kullanarak etkileşimli web uygulamaları
geliştirmeyi sağlar. Bu sayede kullanıcı etkileşimlerine yanıt olarak
dinamik olarak içerik üretebilir ve güncelleyebilirsiniz.
2-Modüler Tasarım: shiny, uygulamanızı
modüllere ayırmanıza olanak tanır, bu da kodunuzu daha okunabilir ve
sürdürülebilir hale getirir.
3-Görsel Özelleştirme: shiny, HTML, CSS
ve JavaScript kullanarak uygulama arayüzünü özelleştirmenize olanak
tanır. Bu sayede istediğiniz görünümü ve deneyimi elde
edebilirsiniz.
4-Grafik ve Veri Görselleştirme: shiny,
R grafik ve veri görselleştirme paketleri (ggplot2, plotly, leaflet vb.)
ile entegre olarak çalışır. Bu sayede interaktif grafikler, haritalar ve
diğer görsel öğeleri uygulamanıza kolayca ekleyebilirsiniz.
5-Veri Girişi ve Çıkışı: shiny,
kullanıcıların veri girişi yapabileceği farklı arayüz öğeleri (örneğin,
metin kutuları, kaydırıcılar, seçim kutuları vb.) sağlar. Ayrıca,
kullanıcıların sonuçları dışa aktarabileceği özellikler de sunar.
6-Sesli Girdi ve Çıktı: shiny
uygulamaları, sesli girdi ve çıktı işleme yeteneklerini kolayca entegre
edebilir. Bu özellik, sesli komutları algılamak veya kullanıcılara sesli
geri bildirimde bulunmak için kullanılabilir.
7-Dağıtım Kolaylığı: shiny,
uygulamanızı bir web sunucusunda yayınlamanızı ve paylaşmanızı
kolaylaştırır. Bu sayede, uygulamanıza herkesin erişebileceği bir web
adresi oluşturabilirsiniz.
Kullanım Alanları:
- Web uygulamaları, interaktif veri görselleştirmesi, raporlama
- Önemi:
shinypaketi, kullanıcıların veri analizi sonuçlarını etkileşimli olarak keşfetmelerini sağlar. Kullanıcılar, grafikleri, tabloları ve diğer veri görselleştirmelerini dinamik olarak değiştirebilir ve filtreleyebilirler.shiny, R kodunu kullanarak web tabanlı arayüzler geliştirmeyi kolaylaştırır. Bu sayede veri analizi sonuçlarını paylaşmak veya raporlamak için etkileyici ve kullanıcı dostu bir arayüz oluşturulabilir.shinyile, veri analizi sonuçlarını hızlı bir şekilde görselleştirebilir ve prototip uygulamalar geliştirebilirsiniz. Bu, veri analizi sürecinin hızlanmasına ve karar verme sürecinin iyileştirilmesine yardımcı olur.shinyuygulamaları, web sunucularında kolayca dağıtılabilir. Bu sayede, veri analizi sonuçlarını paylaşmak veya raporlamak için kullanıcılara erişim sağlamak kolaylaşır.shiny, R grafik ve veri görselleştirme paketleri ile entegre çalışır. Bu sayede, veri analizi sonuçlarını etkileşimli grafikler, haritalar ve diğer görsel öğelerle görselleştirebilirsiniz. Ayrıca, veri analizi raporlarını interaktif olarak sunabilirsiniz.shinyile oluşturulan arayüzler, yeniden kullanılabilir bileşenler içerebilir. Bu, benzer analizler için tekrar tekrar kullanılabilen şablonlar oluşturmanıza olanak tanır.
- Paketin Kullanımı:
5- lubridate:
- lubridate, tarih ve zaman verileriyle çalışmayı kolaylaştıran bir pakettir. Tarih ve zamanları dönüştürme, ayıklama, işleme ve formatlama gibi işlemleri gerçekleştirmek için kullanılır.
- Temel Özellikleri:
1-Tarih ve Zaman Nesneleri Oluşturma:
lubridate, farklı biçimlerdeki tarih ve zaman bilgilerini
içeren karakter dizilerini tarih ve zaman nesnelerine dönüştürmek için
işlevler sağlar. Örneğin, ymd() (yıl-ay-gün),
mdy() (ay-gün-yıl) ve dmy() (gün-ay-yıl) gibi
işlevler kullanarak karakter dizilerini tarih nesnelerine
dönüştürebilirsiniz.
2-Tarih ve Zaman Nesneleri İle Çalışma:
lubridate, tarih ve zaman nesneleri üzerinde çeşitli
aritmetik ve işlem işlevleri sağlar. Örneğin, year(),
month(), day(), hour(),
minute(), second() gibi işlevlerle tarih ve
zaman nesnelerinin bileşenlerine erişebilir ve bunları
değiştirebilirsiniz.
3-Tarih ve Zaman İşlemleri: lubridate,
tarih ve zaman nesneleri arasında farklar (difference), aralıklar
(interval) ve diğer ilişkisel işlemleri gerçekleştirmek için işlevler
sağlar. Örneğin, difftime() ile fark hesaplama veya
interval() ile aralık oluşturma işlemleri
yapabilirsiniz.
4-Tarih ve Zaman Biçimlendirme:
lubridate, tarih ve zaman nesnelerini istenen biçimlere
biçimlendirmek için işlevler sağlar. Örneğin, format() ile
tarih ve zaman biçimlerini belirleyebilir ve strftime() ile
belirli bir biçime dönüştürebilirsiniz.
5-Zaman Dilimi Desteği: lubridate,
farklı zaman dilimlerindeki tarih ve zaman nesneleriyle çalışmayı
destekler. Örneğin, with_tz() işlevi ile zaman dilimlerini
değiştirebilir veya force_tz() işlevi ile zaman dilimlerini
zorlayabilirsiniz.
6-Hafta ve Yıl İşlemleri: lubridate,
hafta numaralarını bulma, yılın hangi haftasında olduğunu bulma ve hafta
içi/hafta sonu günlerini belirleme gibi işlemleri gerçekleştirmek için
işlevler sağlar.
7-Zaman Serisi Analizi: lubridate,
zaman serisi verilerini analiz etmek ve zaman serisi modelleri
oluşturmak için kullanılabilir. Diğer R paketleriyle birlikte
kullanılarak zaman serisi analizi işlemleri gerçekleştirilebilir.
- Kullanım Alanları:
- Zaman serisi analizi, tarih ve zaman işlemleri, veri zamanlaması
- Önemi:
Tarih ve zaman verileri genellikle veri analizi sürecinin önemli bir parçasıdır ve doğru bir şekilde işlenmeleri gereklidir.
lubridatepaketi, tarih ve zaman verileriyle çalışmayı büyük ölçüde kolaylaştırarak veri analizi sürecini daha etkili ve verimli hale getirir.lubridate, farklı tarih ve zaman biçimlerini destekler ve kullanıcıların farklı formatlardaki tarih ve zaman verileriyle çalışmasını sağlar. Bu, farklı veri kaynaklarından gelen tarih ve zaman verilerini kolayca birleştirebilme ve analiz edebilme esnekliği sağlar.Tarih ve zaman verileri, genellikle veri görselleştirme ve raporlama süreçlerinde önemli bir rol oynar.
lubridate, tarih ve zaman verilerinin doğru bir şekilde işlenmesini sağlayarak, kullanıcıların veri görselleştirme ve raporlama işlemlerini daha etkili hale getirmesine olanak tanır.lubridate, tarih ve zaman verileriyle ilişkili farklı analiz işlemlerini gerçekleştirmeyi kolaylaştırır. Örneğin, zaman serisi analizi, zaman dilimleri arasındaki farkları hesaplama, belirli bir tarihe kadar olan gün sayısını bulma gibi işlemlerlubridateile kolayca yapılabilir.lubridate, tarih ve zaman işlemlerini daha anlaşılır ve okunabilir hale getirir. Kullanıcılar, kodlarını daha temiz ve düzenli bir şekilde yazabilir ve anlayabilirler.
- Paketin Kullanımı:
İşsizlik Türkiye & Brezilya
SL.UEM.TOTL.ZS : Bu gösterge, “Toplam İşsizlik Oranı, Tüm Cinsiyetler (%)”ni ifade eder. İşsizlik oranı, bir ülkedeki iş gücüne göre iş arayan kişilerin yüzdesi olarak tanımlanır.
SP.POP.TOTL : Dünya Bankası tarafından kullanılan ve dünya genelindeki toplam nüfusu temsil eden bir veri kodudur.
Projemde, Dünya Bankasından aldığım verilerle işsizlik oranlarını incelemek istiyorum. Bunu incelerken de Toplam nüfustan yararlanacağım. Toplam nüfustaki işsizliği inceleyeceğim.
- Önce Dünya Bankasından verileri çektim.Sonra veri setimde sadece ülkelerin bulunmasını istediğim için gerekli kodu kullandım.Tarih aralığını da belirterek kendime belli tarih aralığında sadece ülkelerden oluşan yeni bir veri seti oluşturdum.
## 'data.frame': 6384 obs. of 6 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 ...
## $ SL.UEM.TOTL.ZS: num 7.94 7.94 7.93 7.93 7.93 ...
## ..- attr(*, "label")= chr "Unemployment, total (% of total labor force) (modeled ILO estimate)"
## $ SP.POP.TOTL : num 19542982 19688632 21000256 22645130 23553551 ...
## ..- attr(*, "label")= chr "Population, total"
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 24 2000 2012. 2023
## 5 SL.UEM.TOTL.ZS dbl 747 11.7 4113 0.1 7.83 37.3
## 6 SP.POP.TOTL dbl 289 4.5 6047 9609 285615032. 7950946801
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 24 2000 2012. 2023
## 5 SL.UEM.TOTL.ZS dbl 747 11.7 4113 0.1 7.83 37.3
## 6 SP.POP.TOTL dbl 289 4.5 6047 9609 285615032. 7950946801
## Joining with `by = join_by(country, iso2c, iso3c)`
- Bu veri setinde, sadece ülkelerin bulunmasını istediğim için;
## # A tibble: 12 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 215 NA NA NA
## 2 iso2c chr 0 0 215 NA NA NA
## 3 iso3c chr 0 0 215 NA NA NA
## 4 year int 0 0 24 2000 2012. 2023
## 5 SL.UEM.TOTL.ZS dbl 723 14 3013 0.1 8.14 37.3
## 6 SP.POP.TOTL dbl 215 4.2 4943 9609 32268693. 1417173173
## 7 region chr 0 0 7 NA NA NA
## 8 capital chr 0 0 210 NA NA NA
## 9 longitude chr 0 0 210 NA NA NA
## 10 latitude chr 0 0 210 NA NA NA
## 11 income chr 0 0 5 NA NA NA
## 12 lending chr 0 0 4 NA NA NA
## [1] "country" "iso2c" "iso3c" "year"
## [5] "SL.UEM.TOTL.ZS" "SP.POP.TOTL" "region" "capital"
## [9] "longitude" "latitude" "income" "lending"
- Verideki NA değerlerden kurtulmak için ;
## Joining with `by = join_by(country)`
## # A tibble: 13 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 183 NA NA NA
## 2 iso2c chr 0 0 183 NA NA NA
## 3 iso3c chr 0 0 183 NA NA NA
## 4 year int 0 0 24 2000 2012. 2023
## 5 SL.UEM.TOTL.ZS dbl 0 0 2989 0.1 8.06 37.3
## 6 SP.POP.TOTL dbl 183 4.2 4209 102603 37621008. 1417173173
## 7 region chr 0 0 7 NA NA NA
## 8 capital chr 0 0 180 NA NA NA
## 9 longitude chr 0 0 183 NA NA NA
## 10 latitude chr 0 0 183 NA NA NA
## 11 income chr 0 0 5 NA NA NA
## 12 lending chr 0 0 4 NA NA NA
## 13 kayip int 0 0 1 0 0 0
Bireysel Ülke Seçimi ve Grafiği
- Bireysel ülke seçimi ve grafiği için önce iki ülke seçip daha sonra da bu ülkelerin erkek işsizlik oranlarını ayrı ayrı grafiklerde inceleyelim.
1-Türkiye
2-Brezilya
- Şimdi ayrı ayrı grafiklerde gösterdiğim verileri tek bir grafikte gösterdim.(Türkiye’deki ve Brezilya’daki İşsizlik Oranlarını karşılaştırdım.)
ggplot(df_TR_BR, aes(year, SL.UEM.TOTL.ZS, color= country)) +
geom_line() +
labs(x="yıl", y="Erkek İşsizlik",
title = "Türkiye ve Brezilya'daki İşsizlik") +
theme_gray()
#### Sene Seçerek Grafik
ggplot(df_kesitveri, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS )) +
geom_point(colour = "purple") +
geom_text(label=df_kesitveri$iso2c)- Grafikte ülkeleri daha ayrıntılı görmek için bu verilerden yararlandım;
ggplot(data_2022_CNveINveUSAveZAsiz, aes(x= SP.POP.TOTL, y= SL.UEM.TOTL.ZS, label = iso2c, colour = region )) +
geom_point() +
geom_text()Dünya Toplam Veri Oluşturmak
###Toplam Dünya Nüfusu, Toplam Dünyadaki İşsizlik,Her sene için Dünyadaki İşsizlik
dunya_datasi <- data %>%
group_by(year) %>%
summarise(dunyadakiissiz = sum(SL.UEM.TOTL.ZS),
dunyanufusu = sum(SP.POP.TOTL),
herseneininissiz = dunyadakiissiz/dunyanufusu)ggplot(dunya_datasi, aes(x = year, y = dunyadakiissiz)) +
geom_line(colour = "blue") +
labs(title = "Dunyadaki İşsizlik",
x = "Yıl",
y = "İşsizlik") +
theme_light()ggplot(dunya_datasi, aes(x = year, y = dunyanufusu)) +
geom_line(colour = "red") +
labs(title = "Dunya Nufusu",
x = "Yıl",
y = "Yillara Gore Dunya Nufusu") +
theme_light()## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_line()`).
Ülkelerin payı, Verimlilik
data <- data %>%
mutate(ulkeninissizlikorani = SL.UEM.TOTL.ZS / dunyadakiissiz,
ulkeninnufusorani = SP.POP.TOTL / dunyanufusu,
verimlilik = ulkeninissizlikorani / ulkeninnufusorani)