Ekometri 2 Vize Projesi

google’a “rmarkdown themes” yazın. Ve ilk link’den theme seçin ordaki herhangi bir “theme”’ti kullanın

Vize Projesi

R ve Rstudio

  • R ve Rsrudio yükledim.
  • dskaldnlsak
  • fmrkjfrfkj

dnjıenfonfeownfwe

Rmarkdown projesi hazırladım.

Projemi rmarkdownda hazırladım, ve internet siteme yükledim.

Paketler

R paketleri, R programlama dilinin temel işlevlerini genişletmek için tasarlanmış bir araç ve kaynaklar kümesidir. Bu paketler, işlevler, veri kümeleri ve diğer ek materyalleri bir araya getirir ve belirli bir amaca hizmet etmek üzere paketlenir. Her paket, belirli analitik veya hesaplama ihtiyaçlarını karşılamak için özel olarak tasarlanmış bir araç kutusu olarak hizmet eder. Bu paketler, çeşitli görevleri verimli ve etkili bir şekilde yerine getirmenizi sağlayarak R’nin makine tarafından kullanılan dişlileridir.

Paketler neden önemlidir?

İstatistiksel araştırma ve veri keşfi alanına adım attığınızda, paketleri anlamak ve kullanmak önemlidir. Paketler size bir dizi işlev sağlayarak, veri ediniminden temizliğine ve istatistiksel analizden görselleştirmeye kadar çeşitli görevleri yerine getirmenizi sağlar. Paketler kullanarak karmaşık işlemler için önceden yazılmış kod sağlayarak zaman ve çaba tasarrufu sağlar.

Paketlere nasıl erişilir?

  • R’de paketlere erişmek ve kullanmak basit bir işlemdir. Ana adımlar kurulum, yükleme ve kullanımdan oluşur. İşlem, bir kez yapılacak olan kurulum ile başlar.

  • Kurulduktan sonra, paket, işlevlerine ve veri kümelerine erişmek için R oturumunuza yüklenmelidir.

  • Yüklendikten sonra, paket tarafından sağlanan işlevleri kullanarak çeşitli görevleri yerine getirebilir ve analitik araç kutunuzu güçlendirebilirsiniz.

Örnek 1 (WDI Paketi)

WDI paketi, Dünya Bankası’nın kapsamlı Dünya Kalkınma Göstergeleri (WDI) veri deposuna erişimi kolaylaştıran güçlü bir araçtır.

  • Temel Özellikler:

GSYİH, nüfus ölçümleri ve eğitim istatistikleri gibi çeşitli göstergelerin alınmasını sağlar. Zaman serisi verilerine erişir, zaman içinde trend analizi yapmayı sağlar.

Belirli ülkeler veya bölgeler için belirli göstergeleri bulup almak için sezgisel bir arayüz sağlar.

  • Önem:

Küresel ekonomik eğilimleri anlamak ve verimlilik içgörülerini anlamak için temel öneme sahiptir. Karmaşık veri alımını basitleştirir, uluslar arası önemli ekonomik göstergelerin analizini yapmayı sağlar.

Paketin Kullanımı

Paketten hangi verileri alabileceğinizi araştırmak

  • Dünya Bankası Veri Kataloğu’na gidin: Dünya Bankası Veri Kataloğu’na https://data.worldbank.org/ veya Dünya Bankası Veri sayfasına https://databank.worldbank.org/home gidin.

  • Göstergeleri Araştırın veya Keşfedin: İlgili veriyi bulmak için arama çubuğunu kullanın veya göstergeler bölümünü keşfedin. Örneğin, GSYİH, nüfus, enflasyon vb. gibi göstergeleri arayabilirsiniz.

  • Göstergeleri Seçin: İlgili göstergeye tıklayın. Bu, verinin ve ayrıntılarının sağlandığı bir sayfaya yönlendirecektir.

  • Göstergelerin Kodunu Not Edin: Her gösterge için sayfa genellikle onu temsil eden bir kod sağlar. Örneğin, “NY.GDP.MKTP.CD” GSYİH’yi temsil eder.

  • Göstergelerin Açıklamalarını Anlayın: Analiz için doğru değişkenleri kullandığından emin olmak için gösterge açıklamalarını okumalısınız.

  • WDI paketini kullanarak, kritik Dünya Kalkınma Göstergelerine erişiyoruz ve analizimiz için gerekli ekonomik ve sosyal metrikleri topluyoruz.

Dünya bankası verileri nelerdir?

Dünya Bankası’nın veritabanı, 217 ekonomi ve 40’tan fazla ülke grubu için 50 yılı aşkın veriyi kapsayan 1,400’den fazla zaman serisi göstergeden oluşmaktadır. https://data.worldbank.org/ adresini ziyaret ettiğinizde, verilere ‘ülke’ ve ‘gösterge’ye dayalı olarak göz atabilirsiniz. ’Ülkeye veya Göstergelere Göre Göz At’ seçeneği altında, ‘gösterge’ bölümüne inerek farklı başlıklar altında birçok zaman serisine erişim sağlanabilir. İlk başlıklar, ‘Tarım ve Kırsal Kalkınma,’ ‘Yardım Etkinliği’ ve ‘İklim Değişikliği’ gibi çeşitli alanları kapsar ve toplamda 20 başlık ve 1,400 zaman serisini içerir.

İstediğiniz veri kümesi için anahtar kelimeyi bulmak için ‘gösterge’ bölümüne giderek ve https://data.worldbank.org/indicator sayfasını ziyaret ederek belirli veri kümesi sayfasına ulaşabilirsiniz. Örneğin, çeşitli ülkeler için Gayri Safi Yurtiçi Hasıla (GSYİH) ve Toplam Nüfus verileri hakkında meraklıysanız, ilgili URL’leri kullanmanız gerekir: ‘Ekonomi ve Büyüme’ kategorisi altında GSYİH (mevcut ABD doları) ve ‘İklim Değişikliği’ kategorisi altında Nüfus, toplamı gibi başlıkları göreceksiniz, belirli bir sayfaya benzer bir sayfaya ulaşabilirsiniz.

## install.packages("WDI") (zaten R'a bu paketi yüklemiş olduğumdan tekrar yüklememe gerek yok. Eğer yüklenmediyse bu kodu çalıştırabilirsiniz)

library(WDI) ## bu adım yüklenmiş olan paketi aktif hale getirmek için kullanılır.
data_WDI <- WDI(country = "all", indicator = c("NY.GDP.MKTP.CD", "SP.POP.TOTL"))

str kodunu anlamak

R’de, str() işlevi bir veri kümesinin yapısını ortaya çıkarmak için kullanılır. df gibi bir veri kümesine uygulandığında, str(df) komutu, veri kümesinin bileşimine dair özlü bir genel bakış sağlar ve veri kümesinde bulunan sütunlar (değişkenler) hakkında ayrıntıları gösterir. Her sütunun adını ve veri tiplerini ortaya koyar. Veri kümesinin ilk birkaç satırına kısa bir bakış sunar. Bu önizleme, veri kümesinde neyin saklandığını anlamaya yardımcı olan gerçek verileri sergiler. Her sütundaki veri türlerini, sayısal, karakter (metin) veya faktörler (kategorik veri) gibi, belirlemeye yardımcı olur. Veri kümesindeki eksik değerleri (‘NA’) belirlemede yardımcı olur, bu da veri temizliği ve analizi için hayati önem taşır.

str(data_WDI)
## 'data.frame':    16758 obs. of  6 variables:
##  $ country       : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
##  $ iso2c         : chr  "AF" "AF" "AF" "AF" ...
##  $ iso3c         : chr  "AFG" "AFG" "AFG" "AFG" ...
##  $ year          : int  1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
##  $ NY.GDP.MKTP.CD: num  5.38e+08 5.49e+08 5.47e+08 7.51e+08 8.00e+08 ...
##   ..- attr(*, "label")= chr "GDP (current US$)"
##  $ SP.POP.TOTL   : num  8622466 8790140 8969047 9157465 9355514 ...
##   ..- attr(*, "label")= chr "Population, total"

Explore paketi

explore paketini de kullanacağız. R’deki explore paketi, veri keşfi ve analizini kolaylaştırmak için tasarlanmış bir araç setidir ve veri kümenizi daha kapsamlı bir şekilde incelemek ve anlamak için çeşitli işlevler sunar. Başlangıç veri incelemesine ve açıklayıcı istatistiklere yardımcı olmak için yardımcı programlar sunar.

Not: Daha önce gerekli paketleri kurmadıysanız, lütfen install.packages() işlevini kullanın. install.packages() işlevini tekrar kullanmayacağım.

explore paketinin bir parçası olan ““describe_all()”” işlevi, bir veri kümesindeki tüm sütunlar (değişkenler) için açıklayıcı istatistikler üretmek için kullanılır. Bir veri kümesine uygulandığında, her sütun için ortalama, medyan, standart sapma, minimum, maksimum ve çeyreklik gibi istatistikleri hesaplar ve görüntüler.

## install.packages("explore") paketi yüklemediyseniz bu işlemi yapın.
library(explore)
describe_all(data_WDI)
## # A tibble: 6 × 8
##   variable       type     na na_pct unique      min     mean      max
##   <chr>          <chr> <int>  <dbl>  <int>    <dbl>    <dbl>    <dbl>
## 1 country        chr       0    0      266      NA  NA       NA      
## 2 iso2c          chr       0    0      266      NA  NA       NA      
## 3 iso3c          chr       0    0      262      NA  NA       NA      
## 4 year           int       0    0       63    1960   1.99e 3  2.02e 3
## 5 NY.GDP.MKTP.CD dbl    3560   21.2  13084 8824744.  1.22e12  1.01e14
## 6 SP.POP.TOTL    dbl      93    0.6  16460    2646   2.16e 8  7.95e 9

Pipe operatörü %>%

tidyverse ya da dplyr.

R’deki pipe operatörü (%>%), genellikle magrittr paketi ile ilişkilendirilir ve ardışık olarak birden fazla işlemi birbirine bağlamayı sağlar. Bir işlevin çıktısını sıradaki işleve girdi olarak ileterek kodun okunabilirliğini ve verimliliğini artırır.

df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur.

## install.packages("tidyverse")
library(tidyverse)
data_WDI %>% describe_all()
## # A tibble: 6 × 8
##   variable       type     na na_pct unique      min     mean      max
##   <chr>          <chr> <int>  <dbl>  <int>    <dbl>    <dbl>    <dbl>
## 1 country        chr       0    0      266      NA  NA       NA      
## 2 iso2c          chr       0    0      266      NA  NA       NA      
## 3 iso3c          chr       0    0      262      NA  NA       NA      
## 4 year           int       0    0       63    1960   1.99e 3  2.02e 3
## 5 NY.GDP.MKTP.CD dbl    3560   21.2  13084 8824744.  1.22e12  1.01e14
## 6 SP.POP.TOTL    dbl      93    0.6  16460    2646   2.16e 8  7.95e 9

Kullandığımız veri setinde, bazı girdiler gerçek ülkeleri temsil etmemekte, bunun yerine Sınıflandırılmamış, OECD üyeleri veya Diğer küçük devletler gibi açıklamalar içermektedir. Analizimizde doğruluk sağlamak için bu ülkeler dışı girdileri hariç tutmamız gerekmektedir. WDI paketi, WDI_data$country adında bir veri seti de dahil olmak üzere ek bilgiler sağlar. Bu ek veriyi kullanarak, mevcut veri setimizi daha detaylı ülke bilgileriyle zenginleştirebiliriz. Veri setimiz ve WDI_data$country veri setinin kombinasyonunu kullanarak, bu ülkeler dışı girdileri tanımlayabilir ve sonrasında bunları çıkararak analizimizi rafine edebiliriz. Böylelikle, daha kesin bir değerlendirme için meşru ülke özgü veri noktalarına odaklanabiliriz.

ek_bilgi <- WDI_data$country
df <- left_join(data_WDI, ek_bilgi)
## Joining with `by = join_by(country, iso2c, iso3c)`
df <- df %>% filter(region != "Aggregates")
df %>% describe_all()
## # A tibble: 12 × 8
##    variable       type     na na_pct unique      min          mean      max
##    <chr>          <chr> <int>  <dbl>  <int>    <dbl>         <dbl>    <dbl>
##  1 country        chr       0    0      215      NA            NA  NA      
##  2 iso2c          chr       0    0      215      NA            NA  NA      
##  3 iso3c          chr       0    0      215      NA            NA  NA      
##  4 year           int       0    0       63    1960          1991   2.02e 3
##  5 NY.GDP.MKTP.CD dbl    3147   23.2  10392 8824744. 192049519539.  2.54e13
##  6 SP.POP.TOTL    dbl      30    0.2  13467    2646      24759535.  1.42e 9
##  7 region         chr       0    0        7      NA            NA  NA      
##  8 capital        chr       0    0      210      NA            NA  NA      
##  9 longitude      chr       0    0      210      NA            NA  NA      
## 10 latitude       chr       0    0      210      NA            NA  NA      
## 11 income         chr       0    0        5      NA            NA  NA      
## 12 lending        chr       0    0        4      NA            NA  NA
df_TR_SN <- df %>% filter(iso2c %in%  c("TR","SN"))

(Açıklayın! Paketler nedir? Neden kullanılır? 5 Paket Örneği.)

ggplot(df_TR_SN, aes(year, NY.GDP.MKTP.CD, color = country)) +
geom_line() +
labs(x = "Year", y = "GDP (Current US$)", title = "GDP Comparison between TR and SN")