Ekometri 2 Vize Projesi
google’a “rmarkdown themes” yazın. Ve ilk link’den theme seçin ordaki herhangi bir “theme”’ti kullanın
Vize Projesi
R ve Rstudio
- R ve Rsrudio yükledim.
- dskaldnlsak
- fmrkjfrfkj
dnjıenfonfeownfwe
Rmarkdown projesi hazırladım.
Projemi rmarkdownda hazırladım, ve internet siteme yükledim.
Paketler
R paketleri, R programlama dilinin temel işlevlerini genişletmek için tasarlanmış bir araç ve kaynaklar kümesidir. Bu paketler, işlevler, veri kümeleri ve diğer ek materyalleri bir araya getirir ve belirli bir amaca hizmet etmek üzere paketlenir. Her paket, belirli analitik veya hesaplama ihtiyaçlarını karşılamak için özel olarak tasarlanmış bir araç kutusu olarak hizmet eder. Bu paketler, çeşitli görevleri verimli ve etkili bir şekilde yerine getirmenizi sağlayarak R’nin makine tarafından kullanılan dişlileridir.
Paketler neden önemlidir?
İstatistiksel araştırma ve veri keşfi alanına adım attığınızda, paketleri anlamak ve kullanmak önemlidir. Paketler size bir dizi işlev sağlayarak, veri ediniminden temizliğine ve istatistiksel analizden görselleştirmeye kadar çeşitli görevleri yerine getirmenizi sağlar. Paketler kullanarak karmaşık işlemler için önceden yazılmış kod sağlayarak zaman ve çaba tasarrufu sağlar.
Paketlere nasıl erişilir?
R’de paketlere erişmek ve kullanmak basit bir işlemdir. Ana adımlar kurulum, yükleme ve kullanımdan oluşur. İşlem, bir kez yapılacak olan kurulum ile başlar.
Kurulduktan sonra, paket, işlevlerine ve veri kümelerine erişmek için R oturumunuza yüklenmelidir.
Yüklendikten sonra, paket tarafından sağlanan işlevleri kullanarak çeşitli görevleri yerine getirebilir ve analitik araç kutunuzu güçlendirebilirsiniz.
Örnek 1 (WDI Paketi)
WDI paketi, Dünya Bankası’nın kapsamlı Dünya Kalkınma Göstergeleri (WDI) veri deposuna erişimi kolaylaştıran güçlü bir araçtır.
- Temel Özellikler:
GSYİH, nüfus ölçümleri ve eğitim istatistikleri gibi çeşitli göstergelerin alınmasını sağlar. Zaman serisi verilerine erişir, zaman içinde trend analizi yapmayı sağlar.
Belirli ülkeler veya bölgeler için belirli göstergeleri bulup almak için sezgisel bir arayüz sağlar.
- Önem:
Küresel ekonomik eğilimleri anlamak ve verimlilik içgörülerini anlamak için temel öneme sahiptir. Karmaşık veri alımını basitleştirir, uluslar arası önemli ekonomik göstergelerin analizini yapmayı sağlar.
Paketin Kullanımı
Paketten hangi verileri alabileceğinizi araştırmak
Dünya Bankası Veri Kataloğu’na gidin: Dünya Bankası Veri Kataloğu’na https://data.worldbank.org/ veya Dünya Bankası Veri sayfasına https://databank.worldbank.org/home gidin.
Göstergeleri Araştırın veya Keşfedin: İlgili veriyi bulmak için arama çubuğunu kullanın veya göstergeler bölümünü keşfedin. Örneğin, GSYİH, nüfus, enflasyon vb. gibi göstergeleri arayabilirsiniz.
Göstergeleri Seçin: İlgili göstergeye tıklayın. Bu, verinin ve ayrıntılarının sağlandığı bir sayfaya yönlendirecektir.
Göstergelerin Kodunu Not Edin: Her gösterge için sayfa genellikle onu temsil eden bir kod sağlar. Örneğin, “NY.GDP.MKTP.CD” GSYİH’yi temsil eder.
Göstergelerin Açıklamalarını Anlayın: Analiz için doğru değişkenleri kullandığından emin olmak için gösterge açıklamalarını okumalısınız.
WDI paketini kullanarak, kritik Dünya Kalkınma Göstergelerine erişiyoruz ve analizimiz için gerekli ekonomik ve sosyal metrikleri topluyoruz.
Dünya bankası verileri nelerdir?
Dünya Bankası’nın veritabanı, 217 ekonomi ve 40’tan fazla ülke grubu için 50 yılı aşkın veriyi kapsayan 1,400’den fazla zaman serisi göstergeden oluşmaktadır. https://data.worldbank.org/ adresini ziyaret ettiğinizde, verilere ‘ülke’ ve ‘gösterge’ye dayalı olarak göz atabilirsiniz. ’Ülkeye veya Göstergelere Göre Göz At’ seçeneği altında, ‘gösterge’ bölümüne inerek farklı başlıklar altında birçok zaman serisine erişim sağlanabilir. İlk başlıklar, ‘Tarım ve Kırsal Kalkınma,’ ‘Yardım Etkinliği’ ve ‘İklim Değişikliği’ gibi çeşitli alanları kapsar ve toplamda 20 başlık ve 1,400 zaman serisini içerir.
İstediğiniz veri kümesi için anahtar kelimeyi bulmak için ‘gösterge’ bölümüne giderek ve https://data.worldbank.org/indicator sayfasını ziyaret ederek belirli veri kümesi sayfasına ulaşabilirsiniz. Örneğin, çeşitli ülkeler için Gayri Safi Yurtiçi Hasıla (GSYİH) ve Toplam Nüfus verileri hakkında meraklıysanız, ilgili URL’leri kullanmanız gerekir: ‘Ekonomi ve Büyüme’ kategorisi altında GSYİH (mevcut ABD doları) ve ‘İklim Değişikliği’ kategorisi altında Nüfus, toplamı gibi başlıkları göreceksiniz, belirli bir sayfaya benzer bir sayfaya ulaşabilirsiniz.
https://data.worldbank.org/indicator/NY.GDP.MKTP.CD?view=chart
NY.GDP.MKTP.CD
Paket daha önce yüklenmediyse, paketi yükleyin.
PAketi R’da aktif hale getirin.
str kodunu anlamak
R’de, str() işlevi bir veri kümesinin yapısını ortaya çıkarmak için kullanılır. df gibi bir veri kümesine uygulandığında, str(df) komutu, veri kümesinin bileşimine dair özlü bir genel bakış sağlar ve veri kümesinde bulunan sütunlar (değişkenler) hakkında ayrıntıları gösterir. Her sütunun adını ve veri tiplerini ortaya koyar. Veri kümesinin ilk birkaç satırına kısa bir bakış sunar. Bu önizleme, veri kümesinde neyin saklandığını anlamaya yardımcı olan gerçek verileri sergiler. Her sütundaki veri türlerini, sayısal, karakter (metin) veya faktörler (kategorik veri) gibi, belirlemeye yardımcı olur. Veri kümesindeki eksik değerleri (‘NA’) belirlemede yardımcı olur, bu da veri temizliği ve analizi için hayati önem taşır.
## 'data.frame': 16758 obs. of 6 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
## $ NY.GDP.MKTP.CD: num 5.38e+08 5.49e+08 5.47e+08 7.51e+08 8.00e+08 ...
## ..- attr(*, "label")= chr "GDP (current US$)"
## $ SP.POP.TOTL : num 8622466 8790140 8969047 9157465 9355514 ...
## ..- attr(*, "label")= chr "Population, total"
Explore paketi
explore paketini de kullanacağız. R’deki explore paketi, veri keşfi ve analizini kolaylaştırmak için tasarlanmış bir araç setidir ve veri kümenizi daha kapsamlı bir şekilde incelemek ve anlamak için çeşitli işlevler sunar. Başlangıç veri incelemesine ve açıklayıcı istatistiklere yardımcı olmak için yardımcı programlar sunar.
Not: Daha önce gerekli paketleri kurmadıysanız, lütfen install.packages() işlevini kullanın. install.packages() işlevini tekrar kullanmayacağım.
explore paketinin bir parçası olan ““describe_all()”” işlevi, bir veri kümesindeki tüm sütunlar (değişkenler) için açıklayıcı istatistikler üretmek için kullanılır. Bir veri kümesine uygulandığında, her sütun için ortalama, medyan, standart sapma, minimum, maksimum ve çeyreklik gibi istatistikleri hesaplar ve görüntüler.
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 63 1960 1.99e 3 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 3560 21.2 13084 8824744. 1.22e12 1.01e14
## 6 SP.POP.TOTL dbl 93 0.6 16460 2646 2.16e 8 7.95e 9
Pipe operatörü %>%
tidyverse ya da dplyr.
R’deki pipe operatörü (%>%), genellikle magrittr paketi ile ilişkilendirilir ve ardışık olarak birden fazla işlemi birbirine bağlamayı sağlar. Bir işlevin çıktısını sıradaki işleve girdi olarak ileterek kodun okunabilirliğini ve verimliliğini artırır.
df %>% describe_all() kullanıldığında, %>% operatörü df veri kümesini describe_all() işlevine zincirler ve veri kümesindeki tüm sütunlar için kapsamlı istatistikler oluşturur.
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 63 1960 1.99e 3 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 3560 21.2 13084 8824744. 1.22e12 1.01e14
## 6 SP.POP.TOTL dbl 93 0.6 16460 2646 2.16e 8 7.95e 9
Kullandığımız veri setinde, bazı girdiler gerçek ülkeleri temsil etmemekte, bunun yerine Sınıflandırılmamış, OECD üyeleri veya Diğer küçük devletler gibi açıklamalar içermektedir. Analizimizde doğruluk sağlamak için bu ülkeler dışı girdileri hariç tutmamız gerekmektedir. WDI paketi, WDI_data$country adında bir veri seti de dahil olmak üzere ek bilgiler sağlar. Bu ek veriyi kullanarak, mevcut veri setimizi daha detaylı ülke bilgileriyle zenginleştirebiliriz. Veri setimiz ve WDI_data$country veri setinin kombinasyonunu kullanarak, bu ülkeler dışı girdileri tanımlayabilir ve sonrasında bunları çıkararak analizimizi rafine edebiliriz. Böylelikle, daha kesin bir değerlendirme için meşru ülke özgü veri noktalarına odaklanabiliriz.
## Joining with `by = join_by(country, iso2c, iso3c)`
## # A tibble: 12 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 215 NA NA NA
## 2 iso2c chr 0 0 215 NA NA NA
## 3 iso3c chr 0 0 215 NA NA NA
## 4 year int 0 0 63 1960 1991 2.02e 3
## 5 NY.GDP.MKTP.CD dbl 3147 23.2 10392 8824744. 192049519539. 2.54e13
## 6 SP.POP.TOTL dbl 30 0.2 13467 2646 24759535. 1.42e 9
## 7 region chr 0 0 7 NA NA NA
## 8 capital chr 0 0 210 NA NA NA
## 9 longitude chr 0 0 210 NA NA NA
## 10 latitude chr 0 0 210 NA NA NA
## 11 income chr 0 0 5 NA NA NA
## 12 lending chr 0 0 4 NA NA NA
(Açıklayın! Paketler nedir? Neden kullanılır? 5 Paket Örneği.)
ggplot(df_TR_SN, aes(year, NY.GDP.MKTP.CD, color = country)) +
geom_line() +
labs(x = "Year", y = "GDP (Current US$)", title = "GDP Comparison between TR and SN")