Dünya bankası (World bank indicators)

Giriş:

Ülkeler arası karşılaştırılabilir verilerin mevcudiyeti, ekonomik, sosyal ve çevresel kalkınma dinamiklerinin analiz edilmesi açısından büyük önem taşımaktadır. Dünya Bankası tarafından sunulan World Development Indicators (WDI) veri tabanı; enerji, çevre, tarım ve beşerî kalkınma gibi birçok temel alanı kapsayan geniş bir gösterge seti içermektedir.

Bu projenin amacı, Dünya Bankası WDI veri tabanından seçilen bazı göstergeleri kullanarak altyapı olanakları, çevre politikaları ve tarımsal kalkınma arasındaki ilişkileri ampirik olarak incelemektir. Bu kapsamda analiz, elektrik erişimi, iklim değişikliğiyle ilgili politikalar ve sulanan tarım arazilerinin payı göstergelerine odaklanmaktadır.

Bu çalışma, Dünya Bankası verilerinin akademik bir çerçevede nasıl kullanılabileceğini göstermek amacıyla betimleyici ve basit ekonometrik analizleri bir araya getirmektedir.

Veri Setinin Tanıtımı

Bu projede kullanılan veriler, Dünya Bankası’nın World Development Indicators veri tabanından elde edilmiştir. WDI, çok sayıda ülke için yıllık zaman serileri sunarak ülkeler arası güvenilir karşılaştırmalar yapılmasına imkân tanımaktadır.

Çalışmada kullanılan göstergeler aşağıdaki gibidir:

Dünya Bankası veri tabanındaki URL’lerde yer alan “EG.ELC.ACCS.ZS”, “EN.CLC.MDAT.ZS” ve “AG.LND.IRIG.AG.ZS” kodları, ilgili göstergeler için kullanılan benzersiz tanımlayıcılar olup, analizin şeffaflığını ve tekrar edilebilirliğini sağlamaktadır.

Metodoloji

Analiz süreci birkaç aşamadan oluşmaktadır. İlk aşamada veriler içe aktarılmış, temizlenmiş ve analiz için uygun hâle getirilmiştir. Bu süreçte eksik gözlemler ele alınmış ve ülkeler ile yıllar arasında tutarlılık sağlanmıştır.

İkinci aşamada betimleyici istatistikler ve grafikler aracılığıyla değişkenlerin dağılımları ve zaman içerisindeki eğilimleri incelenmiştir. Bu görsel analizler, ülkeler arasındaki farklılıkların daha net bir şekilde anlaşılmasına yardımcı olmaktadır.

Son aşamada ise, göstergeler arasındaki ilişkileri incelemek amacıyla basit doğrusal regresyon modelleri kullanılmıştır. Bu modeller aracılığıyla nedensel bir ilişki kurmaktan ziyade, değişkenler arasındaki istatistiksel ilişkiler değerlendirilmiştir.

Ampirik Analiz

Ampirik analiz, öncelikle verilerin grafiksel olarak incelenmesiyle başlamaktadır. Elektriğe erişim oranlarının, genellikle orta ve yüksek gelirli ülkelerde daha yüksek olduğu, düşük gelirli ülkelerde ise daha heterojen bir yapı sergilediği gözlemlenmektedir.

İklim politikalarına ilişkin göstergeler, kurumsal kapasitesi daha güçlü olan ülkelerde daha yaygın bir şekilde uygulanmaktadır. Benzer şekilde, sulanan tarım arazilerinin oranı bölgeler arasında büyük farklılıklar göstermekte olup, bu durum coğrafi ve iklimsel koşulların yanı sıra ekonomik faktörlerle de ilişkilidir.

Korelasyon analizleri ve basit regresyon sonuçları, elektriğe erişim ile kalkınma göstergeleri arasında pozitif ilişkiler olduğunu, tarımsal sulamanın ise tarımsal istikrar ve üretimle ilişkili olabileceğini göstermektedir. Ancak bu sonuçlar, verilerin toplulaştırılmış yapısı nedeniyle dikkatli yorumlanmalıdır.

Bulgular ve Tartışma

Elde edilen bulgular, Dünya Bankası göstergelerinin kalkınma süreçlerinin analizinde güçlü bir araç sunduğunu ortaya koymaktadır. Elektriğe erişim, ekonomik ve sosyal göstergelerle sıklıkla birlikte hareket eden temel bir değişken olarak öne çıkmaktadır.

İklim politikaları ve tarımsal sulama ise ülkelerin kurumsal yapısına ve doğal koşullarına bağlı olarak farklı etkiler yaratmaktadır. Bu durum, kalkınma politikalarının ülkelere özgü koşullar dikkate alınarak tasarlanması gerektiğini göstermektedir.

Çalışmanın temel sınırlılıkları arasında, bazı ülkeler için veri eksiklikleri ve basit analiz yöntemleriyle güçlü nedensel çıkarımlar yapılamaması yer almaktadır.

library(WDI)
# Ham veri (SADECE BİR KEZ)
df <- WDI(
  country = "all",
  indicator = c(
    "EG.ELC.ACCS.ZS",
    "EN.CLC.MDAT.ZS",
    "AG.LND.IRIG.AG.ZS"
  )
)

WDI(…)

  • WDI() fonksiyonu, Dünya Bankası’nın World Development Indicators (WDI) veri tabanından ekonomik, sosyal, çevresel vb. göstergeleri çeker.

  • Fonksiyon bir data frame döndürür ve istediğimiz verileri tablolar halinde sunar.

country = “all”

Bu argüman, tüm ülkeler için veri çekmek istediğimizi belirtir.

Tek bir ülke için kod da kullanılabilir (ör. “TR” → Türkiye, “US” → ABD).

indicator = c(…)

Bu kısım, çekmek istediğimiz göstergeleri belirtir. Kullanılan WDI kodları şunlardır:

“EG.ELC.ACCS.ZS” → Elektriğe erişim (% nüfus) Nüfusun elektriğe erişim oranını gösterir.

EN.CLC.MDAT.ZS” → Gelişmiş sanitasyon hizmeti kullanan nüfus (% nüfus) Gelişmiş sanitasyon (tuvalet) hizmetine erişen nüfus oranını gösterir.

AG.LND.IRIG.AG.ZS” → Sulanan tarım arazisi oranı (% tarım arazisi) Tarım arazilerinin kaçının sulandığını gösterir.

<- df

WDI() fonksiyonundan dönen sonuç, df adında bir data frame içine kaydedilir.

df genellikle şu sütunları içerir:

country → ülke adı

iso2c → 2 harfli ISO kodu

year → veri yılı

İstenen göstergelerin sütunları (EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS)

Bu kod, tüm ülkeler için üç göstergenin (elektrik erişimi, gelişmiş sanitasyon, sulanan tarım arazisi) verilerini çekip df adlı bir tabloya kaydeder.

# Vérification rapide de la structure
str(df)
## 'data.frame':    17290 obs. of  7 variables:
##  $ country          : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
##  $ iso2c            : chr  "AF" "AF" "AF" "AF" ...
##  $ iso3c            : chr  "AFG" "AFG" "AFG" "AFG" ...
##  $ year             : int  1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
##  $ EG.ELC.ACCS.ZS   : num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Access to electricity (% of population)"
##  $ EN.CLC.MDAT.ZS   : num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Droughts, floods, extreme temperatures (% of population, average 1990-2009)"
##  $ AG.LND.IRIG.AG.ZS: num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Agricultural irrigated land (% of total agricultural land)"
# Nombre de pays restants
length(unique(df$country))
## [1] 266
  • str() fonksiyonu, bir R objesinin yapısını hızlıca gösterir.

  • df bir data frame olduğundan, bu komut:

  • Sütun adlarını ve türlerini (numeric, character, factor vb.) gösterir

  • Kaç satır ve sütun olduğunu gösterir

  • Her sütundaki ilk birkaç değeri özetler

Bu, veri çekerken hangi türde verilerle çalıştığını hızlıca anlamak için kullanılır.

  • df$countrydf tablosundaki ülke isimleri sütunu.

  • unique(df$country) → bu sütundaki benzersiz (tekrarsız) ülke isimlerini alır.

  • length(...) → benzersiz ülke sayısını verir.

  • i bu satır, df tablosunda kaç farklı ülke olduğunu hesaplar.

    Özet:

    1. str(df) → veri çerçevesinin yapısını hızlıca kontrol eder

    2. length(unique(df$country)) → tabloda kaç farklı ülke olduğunu verir.

library(ggplot2)
  • library() fonksiyonu, R’de bir paketi yüklemek için kullanılır.

  • "ggplot2" paketi, veri görselleştirme için en yaygın kullanılan paketlerden biridir.

  • Bu paket, grafikler ve görselleştirmeler oluşturmayı kolaylaştırır (çizgi grafikleri, çubuk grafikleri, dağılım grafikleri vb.)

  • ggplot2’yi yüklemeden, ggplot() ve ilgili fonksiyonları kullanamazsınız.

  • library(ggplot2) → ggplot2 paketini aktif hale getirir ve bu paketle veri görselleştirmeleri oluşturmanızı sağlar.

head(df)
##       country iso2c iso3c year EG.ELC.ACCS.ZS EN.CLC.MDAT.ZS AG.LND.IRIG.AG.ZS
## 1 Afghanistan    AF   AFG 1960             NA             NA                NA
## 2 Afghanistan    AF   AFG 1961             NA             NA                NA
## 3 Afghanistan    AF   AFG 1962             NA             NA                NA
## 4 Afghanistan    AF   AFG 1963             NA             NA                NA
## 5 Afghanistan    AF   AFG 1964             NA             NA                NA
## 6 Afghanistan    AF   AFG 1965             NA             NA                NA
  • head() fonksiyonu, bir data frame veya vektörün ilk birkaç satırını gösterir.

  • Varsayılan olarak ilk 6 satırı getirir.

  • Burada df tablosunun ilk 6 satırını hızlıca görmek için kullanılıyor.

Bu, veri setini kontrol etmek, sütun adlarını ve değerleri hızlıca gözden geçirmek için sık kullanılan bir yöntemdir.

head(df)df tablosunun ilk 6 satırını ekranda gösterir.

tidyr::smiths
## # A tibble: 2 × 5
##   subject     time   age weight height
##   <chr>      <dbl> <dbl>  <dbl>  <dbl>
## 1 John Smith     1    33     90   1.87
## 2 Mary Smith     1    NA     NA   1.54
reshape2::smiths
##      subject time age weight height
## 1 John Smith    1  33     90   1.87
## 2 Mary Smith    1  NA     NA   1.54
ekstra = WDI_data$country
# WDI ülke bilgilerini al
WDI_extra <- as.data.frame(WDI_data$country)
# Veri çerçevesindeki tüm sütun isimlerini göster
names(df)
## [1] "country"           "iso2c"             "iso3c"            
## [4] "year"              "EG.ELC.ACCS.ZS"    "EN.CLC.MDAT.ZS"   
## [7] "AG.LND.IRIG.AG.ZS"
summary(df$AG.LND.IRIG.AG.ZS)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   1.222   5.826  11.070  14.801  89.041   16062
summary(df$EN.CLC.MDAT.ZS)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##  0.0000  0.0202  0.2537  1.1699  1.2655  9.2266   17122
library(reshape2)
library(tidyr)  # 'smiths' de tidyr sera utilisé par défaut
## 
## Attachement du package : 'tidyr'
## L'objet suivant est masqué depuis 'package:reshape2':
## 
##     smiths

library(reshape2)

  • reshape2 paketi, veri çerçevelerini yeniden şekillendirmek (reshape) için kullanılır.

  • Özellikle:

-    `melt()` → geniş formattaki veriyi uzun formata çevirir

-    `dcast()` → uzun formattaki veriyi tekrar geniş formata çevirir
  • Örnek kullanım: bir veri setindeki yıllar sütunlarını tek bir sütun haline getirmek veya göstergeleri tek bir sütunda toplamak.
### `library(tidyr)`

-    `tidyr` paketi, veri setlerini **temiz ve düzenli (tidy) hale getirmek** için kullanılır.

-    Fonksiyonları arasında:

    -    `pivot_longer()` → geniş formatı uzun formata çevirir

    -    `pivot_wider()` → uzun formatı geniş formata çevirir

    -    `separate()` ve `unite()` → sütunları bölme veya birleştirme

-    Yorum satırında belirtildiği gibi, `'smiths'` veri setinde **tidyr varsayılan olarak kullanılacak**.

    ✅*Özet:**
    
    1.   `reshape2` → veriyi **uzun/geniş form arasında dönüştürmek** için.

    2.   `tidyr` → veriyi **temiz ve düzenli (tidy) hale getirmek** için.
WDIsearch("electricity") 
##                             indicator
## 25         1.1_ACCESS.ELECTRICITY.TOT
## 40       1.2_ACCESS.ELECTRICITY.RURAL
## 41       1.3_ACCESS.ELECTRICITY.URBAN
## 77                             110400
## 113                       2.0.cov.Ele
## 138                       2.0.hoi.Ele
## 222    4.1.1_TOTAL.ELECTRICITY.OUTPUT
## 223      4.1.2_REN.ELECTRICITY.OUTPUT
## 236       4.1_SHARE.RE.IN.ELECTRICITY
## 972                           9060000
## 2716                   CC.CO2.EMSE.EH
## 2825                      CC.ELEC.CON
## 2826                      CC.ELEC.GEN
## 2875                      CC.ESG.EUFE
## 2876                      CC.ESG.EUMA
## 2924                   CC.GHG.EMSE.EH
## 2946                   CC.GHG.SDEG.EH
## 6856                EG.ELC.ACCS.RU.ZS
## 6857                EG.ELC.ACCS.UR.ZS
## 6858                   EG.ELC.ACCS.ZS
## 6859                   EG.ELC.COAL.KH
## 6860                   EG.ELC.COAL.ZS
## 6861                   EG.ELC.FOSL.ZS
## 6862                   EG.ELC.HYRO.KH
## 6863                   EG.ELC.HYRO.ZS
## 6866                   EG.ELC.NGAS.KH
## 6867                   EG.ELC.NGAS.ZS
## 6868                   EG.ELC.NUCL.KH
## 6869                   EG.ELC.NUCL.ZS
## 6870                   EG.ELC.PETR.KH
## 6871                   EG.ELC.PETR.ZS
## 6872                   EG.ELC.PROD.KH
## 6873                   EG.ELC.RNEW.KH
## 6874                   EG.ELC.RNEW.ZS
## 6875                   EG.ELC.RNWX.KH
## 6876                   EG.ELC.RNWX.ZS
## 6896            elc_al_alot_dfcl_1529
## 6897            elc_al_alot_dfcl_3044
## 6898            elc_al_alot_dfcl_4564
## 6899            elc_al_alot_dfcl_65up
## 6900             elc_al_alot_dfcl_all
## 6901             elc_al_alot_dfcl_fem
## 6902            elc_al_alot_dfcl_male
## 6903             elc_al_alot_dfcl_rur
## 6904             elc_al_alot_dfcl_urb
## 6905                elc_any_dfcl_1529
## 6906                elc_any_dfcl_3044
## 6907                elc_any_dfcl_4564
## 6908                elc_any_dfcl_65up
## 6909                 elc_any_dfcl_all
## 6910            elc_any_dfcl_cogn_all
## 6911            elc_any_dfcl_comm_all
## 6912                 elc_any_dfcl_fem
## 6913         elc_any_dfcl_hearing_all
## 6914                elc_any_dfcl_male
## 6915          elc_any_dfcl_mobile_all
## 6916                 elc_any_dfcl_rur
## 6917          elc_any_dfcl_seeing_all
## 6918        elc_any_dfcl_selfcare_all
## 6919                 elc_any_dfcl_urb
## 6920               elc_none_dfcl_1529
## 6921               elc_none_dfcl_3044
## 6922               elc_none_dfcl_4564
## 6923               elc_none_dfcl_65up
## 6924                elc_none_dfcl_all
## 6925                elc_none_dfcl_fem
## 6926               elc_none_dfcl_male
## 6927                elc_none_dfcl_rur
## 6928                elc_none_dfcl_urb
## 6929             elc_nosome_dfcl_1529
## 6930             elc_nosome_dfcl_3044
## 6931             elc_nosome_dfcl_4564
## 6932             elc_nosome_dfcl_65up
## 6933              elc_nosome_dfcl_all
## 6934              elc_nosome_dfcl_fem
## 6935             elc_nosome_dfcl_male
## 6936              elc_nosome_dfcl_rur
## 6937              elc_nosome_dfcl_urb
## 6938               elc_some_dfcl_1529
## 6939               elc_some_dfcl_3044
## 6940               elc_some_dfcl_4564
## 6941               elc_some_dfcl_65up
## 6942                elc_some_dfcl_all
## 6943                elc_some_dfcl_fem
## 6944               elc_some_dfcl_male
## 6945                elc_some_dfcl_rur
## 6946                elc_some_dfcl_urb
## 7066                   EN.CO2.ETOT.MT
## 7067                   EN.CO2.ETOT.ZS
## 7140                      EN.PRD.ELEC
## 7141               EN.PRD.ELEC.POP.ZS
## 10150                 HOU.ELC.ACSN.ZS
## 10288                  IC.CNS.ELEC.ZS
## 10349         IC.ELC.ACES.DFRN.DB1015
## 10350         IC.ELC.ACES.DFRN.DB1619
## 10351             IC.ELC.ACES.RK.DB19
## 10352                 IC.ELC.ACS.COST
## 10353            IC.ELC.ACS.COST.DFRN
## 10354   IC.ELC.COMM.TRFF.CG.01.DB1619
## 10356                   IC.ELC.GEN.ZS
## 10358      IC.ELC.LMTG.OUTG.01.DB1619
## 10359      IC.ELC.MONT.OUTG.01.DB1619
## 10362 IC.ELC.OUTG.FREQ.DURS.03.DB1619
## 10364           IC.ELC.OUTG.MN.DB1619
## 10366            IC.ELC.PRI.KH.DB1619
## 10367                  IC.ELC.PROC.NO
## 10368             IC.ELC.PROC.NO.DFRN
## 10369      IC.ELC.REGU.MONT.01.DB1619
## 10370          IC.ELC.RSTOR.01.DB1619
## 10371        IC.ELC.RSTT.XD.08.DB1619
## 10372   IC.ELC.RSTT.XD.08.DFRN.DB1619
## 10373           IC.ELC.SAID.XD.DB1619
## 10374           IC.ELC.SAIF.XD.DB1619
## 10375                     IC.ELC.TIME
## 10376                IC.ELC.TIME.DFRN
## 10377              IC.ELEC.COST.PC.ZS
## 10378                    IC.ELEC.PROC
## 10379                    IC.ELEC.TIME
## 10380                      IC.ELEC.XQ
## 10425                  IC.FRM.ELEC.ZS
## 10470             IC.FRM.INFRA.IN10_C
## 10472               IC.FRM.INFRA.IN12
## 10511                IC.FRM.OBS.OBST8
## 10777               IN.ENRGY.ELEC.GEN
## 13175        NA.GDP.ELEC.GAS.SNA08.CR
## 13176        NA.GDP.ELEC.GAS.SNA08.KR
## 13491                  NV.IND.GELW.CD
## 13492                  NV.IND.GELW.CN
## 13493                  NV.IND.GELW.KN
## 20616                  SG.COK.ELEC.ZS
## 21794                      SL.EMP.ELC
##                                                                                                                        name
## 25                                                                            Access to electricity (% of total population)
## 40                                                                            Access to electricity (% of rural population)
## 41                                                                            Access to electricity (% of urban population)
## 77                                                                 110400:HOUSING, WATER, ELECTRICITY, GAS, AND OTHER FUELS
## 113                                                                                                   Coverage: Electricity
## 138                                                                                                        HOI: Electricity
## 222                                                                                          Total electricity output (GWh)
## 223                                                                               Renewable energy electricity output (GWh)
## 236                                                                   Renewable electricity (% in total electricity output)
## 972                                                         9060000:ACTUAL HOUSING, WATER, ELECTRICITY, GAS AND OTHER FUELS
## 2716                                                                 CO2 emissions by sector (Mt CO2 eq) - Electricity/Heat
## 2825                                                                                            Electricity net consumption
## 2826                                                                                             Electricity net generation
## 2875                                      Employment by sector and gender (% of total) - Electricity and utilities - Female
## 2876                                        Employment by sector and gender (% of total) - Electricity and utilities - Male
## 2924                                                           Total GHG emissions by sector (Mt CO2 eq) - Electricity/Heat
## 2946  Sectoral drivers of GHG emissions growth in the period 2012-2018 - Electricity/Heat (contribution to total growth, %)
## 6856                                                                   Access to electricity, rural (% of rural population)
## 6857                                                                   Access to electricity, urban (% of urban population)
## 6858                                                                                Access to electricity (% of population)
## 6859                                                                         Electricity production from coal sources (kWh)
## 6860                                                                  Electricity production from coal sources (% of total)
## 6861                                                     Electricity production from oil, gas and coal sources (% of total)
## 6862                                                                Electricity production from hydroelectric sources (kWh)
## 6863                                                         Electricity production from hydroelectric sources (% of total)
## 6866                                                                  Electricity production from natural gas sources (kWh)
## 6867                                                           Electricity production from natural gas sources (% of total)
## 6868                                                                      Electricity production from nuclear sources (kWh)
## 6869                                                               Electricity production from nuclear sources (% of total)
## 6870                                                                          Electricity production from oil sources (kWh)
## 6871                                                                   Electricity production from oil sources (% of total)
## 6872                                                                                           Electricity production (kWh)
## 6873                                                                    Electricity production from renewable sources (kWh)
## 6874                                                           Renewable electricity output (% of total electricity output)
## 6875                                           Electricity production from renewable sources, excluding hydroelectric (kWh)
## 6876                                    Electricity production from renewable sources, excluding hydroelectric (% of total)
## 6896                   Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with severe disability)
## 6897                   Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with severe disability)
## 6898                   Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with severe disability)
## 6899                         Adults aged 65 or older with electricity (% of adults aged 65 or older with severe disability)
## 6900                                                           Adults with electricity (% of adults with severe disability)
## 6901                                             Female adults with electricity (% of female adults with severe disability)
## 6902                                                 Male adults with electricity (% of male adults with severe disability)
## 6903               Adults living in rural areas with electricity (% of adults living in rural areas with severe disability)
## 6904               Adults living in urban areas with electricity (% of adults living in urban areas with severe disability)
## 6905                      Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with any disability)
## 6906                      Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with any disability)
## 6907                      Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with any disability)
## 6908                            Adults aged 65 or older with electricity (% of adults aged 65 or older with any disability)
## 6909                                                              Adults with electricity (% of adults with any disability)
## 6910                                                        Adults with electricity (% of adults with cognition disability)
## 6911                                                    Adults with electricity (% of adults with communicating disability)
## 6912                                                Female adults with electricity (% of female adults with any disability)
## 6913                                                          Adults with electricity (% of adults with hearing disability)
## 6914                                                    Male adults with electricity (% of male adults with any disability)
## 6915                                                           Adults with electricity (% of adults with mobile disability)
## 6916                  Adults living in rural areas with electricity (% of adults living in rural areas with any disability)
## 6917                                                           Adults with electricity (% of adults with seeing disability)
## 6918                                                         Adults with electricity (% of adults with selfcare disability)
## 6919                  Adults living in urban areas with electricity (% of adults living in urban areas with any disability)
## 6920                       Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with no disability)
## 6921                       Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with no disability)
## 6922                       Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with no disability)
## 6923                             Adults aged 65 or older with electricity (% of adults aged 65 or older with no disability)
## 6924                                                               Adults with electricity (% of adults with no disability)
## 6925                                                 Female adults with electricity (% of female adults with no disability)
## 6926                                                     Male adults with electricity (% of male adults with no disability)
## 6927                   Adults living in rural areas with electricity (% of adults living in rural areas with no disability)
## 6928                   Adults living in urban areas with electricity (% of adults living in urban areas with no disability)
## 6929         Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with none or moderate disability)
## 6930         Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with none or moderate disability)
## 6931         Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with none or moderate disability)
## 6932               Adults aged 65 or older with electricity (% of adults aged 65 or older with none or moderate disability)
## 6933                                                 Adults with electricity (% of adults with none or moderate disability)
## 6934                                   Female adults with electricity (% of female adults with none or moderate disability)
## 6935                                       Male adults with electricity (% of male adults with none or moderate disability)
## 6936     Adults living in rural areas with electricity (% of adults living in rural areas with none or moderate disability)
## 6937     Adults living in urban areas with electricity (% of adults living in urban areas with none or moderate disability)
## 6938                 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with moderate disability)
## 6939                 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with moderate disability)
## 6940                 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with moderate disability)
## 6941                       Adults aged 65 or older with electricity (% of adults aged 65 or older with moderate disability)
## 6942                                                         Adults with electricity (% of adults with moderate disability)
## 6943                                           Female adults with electricity (% of female adults with moderate disability)
## 6944                                               Male adults with electricity (% of male adults with moderate disability)
## 6945             Adults living in rural areas with electricity (% of adults living in rural areas with moderate disability)
## 6946             Adults living in urban areas with electricity (% of adults living in urban areas with moderate disability)
## 7066                                        CO2 emissions from electricity and heat production, total (million metric tons)
## 7067                                 CO2 emissions from electricity and heat production, total (% of total fuel combustion)
## 7140                                                                                   Electricity production (million kwh)
## 7141                                                                                Electricity production (kwh per capita)
## 10150                                                      Household Access to Electricity: Total (in % of total household)
## 10288                                               Electricity (% of managers surveyed ranking this as a major constraint)
## 10349                                                                     Getting electricity (DB10-15 methodology) - Score
## 10350                                                                     Getting electricity (DB16-20 methodology) - Score
## 10351                                                      Rank: Getting electricity (1=most business-friendly regulations)
## 10352                                                 Getting electricity: Cost to get electricity (% of income per capita)
## 10353                                         Getting electricity: Cost to get electricity (% of income per capita) - Score
## 10354                          Getting electricity: Communication of tariffs and tariff changes (0-1) (DB16-20 methodology)
## 10356                                                                                        Electricity from Generator (%)
## 10358                       Getting electricity: Financial deterrents aimed at limiting outages (0-1) (DB16-20 methodology)
## 10359                                    Getting electricity: Mechanisms for monitoring outages (0-1) (DB16-20 methodology)
## 10362          Getting electricity: Total duration and frequency of outages per customer a year (0-3) (DB16-20 methodology)
## 10364                                          Getting electricity: Minimum outage time (in minutes)  (DB16-20 methodology)
## 10366                                    Getting electricity: Price of electricity (US cents per kWh) (DB16-20 methodology)
## 10367                                                                              Getting electricity: Procedures (number)
## 10368                                                                      Getting electricity: Procedures (number) - Score
## 10369                                                Getting electricity: Regulatory monitoring (0-1) (DB16-20 methodology)
## 10370                                     Getting electricity: Mechanisms for restoring service (0-1) (DB16-20 methodology)
## 10371               Getting electricity: Reliability of supply and transparency of tariff index (0-8) (DB16-20 methodology)
## 10372       Getting electricity: Reliability of supply and transparency of tariff index (0-8) (DB16-20 methodology) - Score
## 10373                         Getting electricity: System average interruption duration index (SAIDI) (DB16-20 methodology)
## 10374                        Getting electricity: System average interruption frequency index (SAIFI) (DB16-20 methodology)
## 10375                                                                               Time required to get electricity (days)
## 10376                                                                              Getting electricity: Time (days) - Score
## 10377                                                           Cost to get electricity connection (% of income per capita)
## 10378                                                                       Procedures required to get electricity (number)
## 10379                                                                               Time required to get electricity (days)
## 10380                                                                                            Getting electricity (rank)
## 10425                                                       Electricity (% of firms identifying this as a major constraint)
## 10470                                        If a generator is used, average proportion of electricity from a generator (%)
## 10472                                                        Percent of firms identifying electricity as a major constraint
## 10511                                                       Percent of firms choosing electricity as their biggest obstacle
## 10777                                                                               Total-Electricity Generated Gross (GWh)
## 13175                                      GDP on Electricity & Gas Supply Sector (in IDR Million), SNA 2008, Current Price
## 13176                                     GDP on Electricity & Gas Supply Sector (in IDR Million), SNA 2008, Constant Price
## 13491                                                          Electricity, gas and water supply, value added (current US$)
## 13492                                                          Electricity, gas and water supply, value added (current LCU)
## 13493                                                         Electricity, gas and water supply, value added (constant LCU)
## 20616                                                                     Main cooking fuel: electricity  (% of households)
## 21794                                                         Number of people employed in electricity and utilities sector
  • WDIsearch("electricity") fonksiyonu senin verin bağlamında:

    • Dünya Bankası WDI veri tabanında "electricity" kelimesi geçen tüm göstergeleri listeler.

    • Senin verinde elektrik göstergesi olarak sadece EG.ELC.ACCS.ZS var (elektriğe erişim % nüfus).

    • Fonksiyon, ayrıca başka elektrik göstergeleri de gösterebilir, ama senin analizinde sadece EG.ELC.ACCS.ZS kullanılır.

    Özet:
    WDIsearch("electricity") → Elektrik ile ilgili mevcut göstergeleri gösterir; senin verin için gerekli olan tek gösterge EG.ELC.ACCS.ZS’dir.

-    `EG.ELC.ACCS.ZS` → Elektriğe erişim (% nüfus)

-    `EG.ELC.RNEW.ZS` → Yenilenebilir enerji ile elektrik üretim oranı

Özet:
WDIsearch("electricity")"electricity" kelimesi ile ilgili tüm WDI göstergelerini arar ve listeler.

str(df$year)      # year sütununun türünü gösterir
##  int [1:17290] 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
unique(df$year)   # year sütunundaki değerleri kontrol et
##  [1] 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974
## [16] 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
## [31] 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
## [46] 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
## [61] 2020 2021 2022 2023 2024
unique(df$country)
##   [1] "Afghanistan"                                                              
##   [2] "Africa Eastern and Southern"                                              
##   [3] "Africa Western and Central"                                               
##   [4] "Albania"                                                                  
##   [5] "Algeria"                                                                  
##   [6] "American Samoa"                                                           
##   [7] "Andorra"                                                                  
##   [8] "Angola"                                                                   
##   [9] "Antigua and Barbuda"                                                      
##  [10] "Arab World"                                                               
##  [11] "Argentina"                                                                
##  [12] "Armenia"                                                                  
##  [13] "Aruba"                                                                    
##  [14] "Australia"                                                                
##  [15] "Austria"                                                                  
##  [16] "Azerbaijan"                                                               
##  [17] "Bahamas, The"                                                             
##  [18] "Bahrain"                                                                  
##  [19] "Bangladesh"                                                               
##  [20] "Barbados"                                                                 
##  [21] "Belarus"                                                                  
##  [22] "Belgium"                                                                  
##  [23] "Belize"                                                                   
##  [24] "Benin"                                                                    
##  [25] "Bermuda"                                                                  
##  [26] "Bhutan"                                                                   
##  [27] "Bolivia"                                                                  
##  [28] "Bosnia and Herzegovina"                                                   
##  [29] "Botswana"                                                                 
##  [30] "Brazil"                                                                   
##  [31] "British Virgin Islands"                                                   
##  [32] "Brunei Darussalam"                                                        
##  [33] "Bulgaria"                                                                 
##  [34] "Burkina Faso"                                                             
##  [35] "Burundi"                                                                  
##  [36] "Cabo Verde"                                                               
##  [37] "Cambodia"                                                                 
##  [38] "Cameroon"                                                                 
##  [39] "Canada"                                                                   
##  [40] "Caribbean small states"                                                   
##  [41] "Cayman Islands"                                                           
##  [42] "Central African Republic"                                                 
##  [43] "Central Europe and the Baltics"                                           
##  [44] "Chad"                                                                     
##  [45] "Channel Islands"                                                          
##  [46] "Chile"                                                                    
##  [47] "China"                                                                    
##  [48] "Colombia"                                                                 
##  [49] "Comoros"                                                                  
##  [50] "Congo, Dem. Rep."                                                         
##  [51] "Congo, Rep."                                                              
##  [52] "Costa Rica"                                                               
##  [53] "Cote d'Ivoire"                                                            
##  [54] "Croatia"                                                                  
##  [55] "Cuba"                                                                     
##  [56] "Curacao"                                                                  
##  [57] "Cyprus"                                                                   
##  [58] "Czechia"                                                                  
##  [59] "Denmark"                                                                  
##  [60] "Djibouti"                                                                 
##  [61] "Dominica"                                                                 
##  [62] "Dominican Republic"                                                       
##  [63] "Early-demographic dividend"                                               
##  [64] "East Asia & Pacific (excluding high income)"                              
##  [65] "East Asia & Pacific (IDA & IBRD countries)"                               
##  [66] "East Asia & Pacific"                                                      
##  [67] "Ecuador"                                                                  
##  [68] "Egypt, Arab Rep."                                                         
##  [69] "El Salvador"                                                              
##  [70] "Equatorial Guinea"                                                        
##  [71] "Eritrea"                                                                  
##  [72] "Estonia"                                                                  
##  [73] "Eswatini"                                                                 
##  [74] "Ethiopia"                                                                 
##  [75] "Euro area"                                                                
##  [76] "Europe & Central Asia (excluding high income)"                            
##  [77] "Europe & Central Asia (IDA & IBRD countries)"                             
##  [78] "Europe & Central Asia"                                                    
##  [79] "European Union"                                                           
##  [80] "Faroe Islands"                                                            
##  [81] "Fiji"                                                                     
##  [82] "Finland"                                                                  
##  [83] "Fragile and conflict affected situations"                                 
##  [84] "France"                                                                   
##  [85] "French Polynesia"                                                         
##  [86] "Gabon"                                                                    
##  [87] "Gambia, The"                                                              
##  [88] "Georgia"                                                                  
##  [89] "Germany"                                                                  
##  [90] "Ghana"                                                                    
##  [91] "Gibraltar"                                                                
##  [92] "Greece"                                                                   
##  [93] "Greenland"                                                                
##  [94] "Grenada"                                                                  
##  [95] "Guam"                                                                     
##  [96] "Guatemala"                                                                
##  [97] "Guinea-Bissau"                                                            
##  [98] "Guinea"                                                                   
##  [99] "Guyana"                                                                   
## [100] "Haiti"                                                                    
## [101] "Heavily indebted poor countries (HIPC)"                                   
## [102] "High income"                                                              
## [103] "Honduras"                                                                 
## [104] "Hong Kong SAR, China"                                                     
## [105] "Hungary"                                                                  
## [106] "IBRD only"                                                                
## [107] "Iceland"                                                                  
## [108] "IDA & IBRD total"                                                         
## [109] "IDA blend"                                                                
## [110] "IDA only"                                                                 
## [111] "IDA total"                                                                
## [112] "India"                                                                    
## [113] "Indonesia"                                                                
## [114] "Iran, Islamic Rep."                                                       
## [115] "Iraq"                                                                     
## [116] "Ireland"                                                                  
## [117] "Isle of Man"                                                              
## [118] "Israel"                                                                   
## [119] "Italy"                                                                    
## [120] "Jamaica"                                                                  
## [121] "Japan"                                                                    
## [122] "Jordan"                                                                   
## [123] "Kazakhstan"                                                               
## [124] "Kenya"                                                                    
## [125] "Kiribati"                                                                 
## [126] "Korea, Dem. People's Rep."                                                
## [127] "Korea, Rep."                                                              
## [128] "Kosovo"                                                                   
## [129] "Kuwait"                                                                   
## [130] "Kyrgyz Republic"                                                          
## [131] "Lao PDR"                                                                  
## [132] "Late-demographic dividend"                                                
## [133] "Latin America & Caribbean (excluding high income)"                        
## [134] "Latin America & Caribbean"                                                
## [135] "Latin America & the Caribbean (IDA & IBRD countries)"                     
## [136] "Latvia"                                                                   
## [137] "Least developed countries: UN classification"                             
## [138] "Lebanon"                                                                  
## [139] "Lesotho"                                                                  
## [140] "Liberia"                                                                  
## [141] "Libya"                                                                    
## [142] "Liechtenstein"                                                            
## [143] "Lithuania"                                                                
## [144] "Low & middle income"                                                      
## [145] "Low income"                                                               
## [146] "Lower middle income"                                                      
## [147] "Luxembourg"                                                               
## [148] "Macao SAR, China"                                                         
## [149] "Madagascar"                                                               
## [150] "Malawi"                                                                   
## [151] "Malaysia"                                                                 
## [152] "Maldives"                                                                 
## [153] "Mali"                                                                     
## [154] "Malta"                                                                    
## [155] "Marshall Islands"                                                         
## [156] "Mauritania"                                                               
## [157] "Mauritius"                                                                
## [158] "Mexico"                                                                   
## [159] "Micronesia, Fed. Sts."                                                    
## [160] "Middle East, North Africa, Afghanistan & Pakistan (excluding high income)"
## [161] "Middle East, North Africa, Afghanistan & Pakistan (IDA & IBRD)"           
## [162] "Middle East, North Africa, Afghanistan & Pakistan"                        
## [163] "Middle income"                                                            
## [164] "Moldova"                                                                  
## [165] "Monaco"                                                                   
## [166] "Mongolia"                                                                 
## [167] "Montenegro"                                                               
## [168] "Morocco"                                                                  
## [169] "Mozambique"                                                               
## [170] "Myanmar"                                                                  
## [171] "Namibia"                                                                  
## [172] "Nauru"                                                                    
## [173] "Nepal"                                                                    
## [174] "Netherlands"                                                              
## [175] "New Caledonia"                                                            
## [176] "New Zealand"                                                              
## [177] "Nicaragua"                                                                
## [178] "Niger"                                                                    
## [179] "Nigeria"                                                                  
## [180] "North America"                                                            
## [181] "North Macedonia"                                                          
## [182] "Northern Mariana Islands"                                                 
## [183] "Norway"                                                                   
## [184] "Not classified"                                                           
## [185] "OECD members"                                                             
## [186] "Oman"                                                                     
## [187] "Other small states"                                                       
## [188] "Pacific island small states"                                              
## [189] "Pakistan"                                                                 
## [190] "Palau"                                                                    
## [191] "Panama"                                                                   
## [192] "Papua New Guinea"                                                         
## [193] "Paraguay"                                                                 
## [194] "Peru"                                                                     
## [195] "Philippines"                                                              
## [196] "Poland"                                                                   
## [197] "Portugal"                                                                 
## [198] "Post-demographic dividend"                                                
## [199] "Pre-demographic dividend"                                                 
## [200] "Puerto Rico (US)"                                                         
## [201] "Qatar"                                                                    
## [202] "Romania"                                                                  
## [203] "Russian Federation"                                                       
## [204] "Rwanda"                                                                   
## [205] "Samoa"                                                                    
## [206] "San Marino"                                                               
## [207] "Sao Tome and Principe"                                                    
## [208] "Saudi Arabia"                                                             
## [209] "Senegal"                                                                  
## [210] "Serbia"                                                                   
## [211] "Seychelles"                                                               
## [212] "Sierra Leone"                                                             
## [213] "Singapore"                                                                
## [214] "Sint Maarten (Dutch part)"                                                
## [215] "Slovak Republic"                                                          
## [216] "Slovenia"                                                                 
## [217] "Small states"                                                             
## [218] "Solomon Islands"                                                          
## [219] "Somalia, Fed. Rep."                                                       
## [220] "South Africa"                                                             
## [221] "South Asia (IDA & IBRD)"                                                  
## [222] "South Asia"                                                               
## [223] "South Sudan"                                                              
## [224] "Spain"                                                                    
## [225] "Sri Lanka"                                                                
## [226] "St. Kitts and Nevis"                                                      
## [227] "St. Lucia"                                                                
## [228] "St. Martin (French part)"                                                 
## [229] "St. Vincent and the Grenadines"                                           
## [230] "Sub-Saharan Africa (excluding high income)"                               
## [231] "Sub-Saharan Africa (IDA & IBRD countries)"                                
## [232] "Sub-Saharan Africa"                                                       
## [233] "Sudan"                                                                    
## [234] "Suriname"                                                                 
## [235] "Sweden"                                                                   
## [236] "Switzerland"                                                              
## [237] "Syrian Arab Republic"                                                     
## [238] "Tajikistan"                                                               
## [239] "Tanzania"                                                                 
## [240] "Thailand"                                                                 
## [241] "Timor-Leste"                                                              
## [242] "Togo"                                                                     
## [243] "Tonga"                                                                    
## [244] "Trinidad and Tobago"                                                      
## [245] "Tunisia"                                                                  
## [246] "Turkiye"                                                                  
## [247] "Turkmenistan"                                                             
## [248] "Turks and Caicos Islands"                                                 
## [249] "Tuvalu"                                                                   
## [250] "Uganda"                                                                   
## [251] "Ukraine"                                                                  
## [252] "United Arab Emirates"                                                     
## [253] "United Kingdom"                                                           
## [254] "United States"                                                            
## [255] "Upper middle income"                                                      
## [256] "Uruguay"                                                                  
## [257] "Uzbekistan"                                                               
## [258] "Vanuatu"                                                                  
## [259] "Venezuela, RB"                                                            
## [260] "Viet Nam"                                                                 
## [261] "Virgin Islands (U.S.)"                                                    
## [262] "West Bank and Gaza"                                                       
## [263] "World"                                                                    
## [264] "Yemen, Rep."                                                              
## [265] "Zambia"                                                                   
## [266] "Zimbabwe"
str(df)
## 'data.frame':    17290 obs. of  7 variables:
##  $ country          : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
##  $ iso2c            : chr  "AF" "AF" "AF" "AF" ...
##  $ iso3c            : chr  "AFG" "AFG" "AFG" "AFG" ...
##  $ year             : int  1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
##  $ EG.ELC.ACCS.ZS   : num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Access to electricity (% of population)"
##  $ EN.CLC.MDAT.ZS   : num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Droughts, floods, extreme temperatures (% of population, average 1990-2009)"
##  $ AG.LND.IRIG.AG.ZS: num  NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "label")= chr "Agricultural irrigated land (% of total agricultural land)"

dplyr ve tidyr gibi paketler kullanılarak R ortamında veri manipülasyonu yapılmakta ve verinin analiz için uygun, düzenli bir yapıya kavuşturulması sağlanmaktadır.

# Install required packages (uncomment and run if needed)
# install.packages("dplyr")
# install.packages("tidyr") # If not installed previously
library(dplyr)
## 
## Attachement du package : 'dplyr'
## Les objets suivants sont masqués depuis 'package:stats':
## 
##     filter, lag
## Les objets suivants sont masqués depuis 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)

Bu çalışmada ayrıca explore paketi de kullanılacaktır. R programlama dilindeki explore paketi, veri keşfi ve analizini kolaylaştırmak amacıyla geliştirilmiş bir araç setidir. Bu paket, veri setinin daha kapsamlı bir şekilde incelenmesini sağlayan çeşitli fonksiyonlar sunmakta ve özellikle analiz sürecinin başlangıç aşamasında betimleyici istatistiklerin elde edilmesine yardımcı olmaktadır.

Öğrenciler için not: Gerekli paketler daha önce yüklenmemişse install.packages() fonksiyonu kullanılarak kurulmalıdır. Bu derste, paketlerin daha önce yüklü olduğu varsayıldığından install.packages() fonksiyonu tekrar kullanılmayacaktır.

explore paketinin bir parçası olan describe_all() fonksiyonu, bir veri setindeki tüm değişkenler için aynı anda betimleyici istatistikler üretmek amacıyla kullanılır. Bu fonksiyon; ortalama, medyan, standart sapma, minimum ve maksimum değerler ile çeyrek değerleri (quartiles) hesaplayarak her bir değişken için özet bilgiler sunar.

R’de sıklıkla magrittr paketiyle ilişkilendirilen boru (pipe) operatörü %>%, birden fazla işlemin ardışık olarak zincirlenmesine olanak tanır. Bu operatör, bir fonksiyonun çıktısını bir sonraki fonksiyonun girdisi olarak kullanarak kodun okunabilirliğini ve verimliliğini artırır.

df %>% describe_all() ifadesinde %>% operatörü, df veri setini doğrudan describe_all() fonksiyonuna aktarır ve böylece veri setindeki tüm değişkenler için kapsamlı betimleyici istatistikler elde edilmesini sağlar.

library(dplyr)

mtcars %>%
  filter(mpg > 20)
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4      21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710     22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive 21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Merc 240D      24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230       22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Fiat 128       32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic    30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla 33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona  21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Fiat X1-9      27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2  26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa   30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Volvo 142E     21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
library(dplyr)
# Load the "explore" package
library(explore)

# Describe all columns in the dataset using describe_all() function
df %>% describe_all()
## # A tibble: 7 × 8
##   variable          type     na na_pct unique     min    mean     max
##   <chr>             <chr> <int>  <dbl>  <int>   <dbl>   <dbl>   <dbl>
## 1 country           chr       0    0      266   NA      NA      NA   
## 2 iso2c             chr       0    0      266   NA      NA      NA   
## 3 iso3c             chr       0    0      262   NA      NA      NA   
## 4 year              int       0    0       65 1960    1992    2024   
## 5 EG.ELC.ACCS.ZS    dbl    9431   54.5   2553    0.53   81.2   100   
## 6 EN.CLC.MDAT.ZS    dbl   17122   99      160    0       1.17    9.23
## 7 AG.LND.IRIG.AG.ZS dbl   16062   92.9   1173    0      11.1    89.0
## # A tibble: 6 × 8
##   variable       type     na na_pct unique      min     mean      max
##   <chr>          <chr> <int>  <dbl>  <int>    <dbl>    <dbl>    <dbl>
## 1 country        chr       0    0      266      NA  NA       NA      
## 2 iso2c          chr       0    0      266      NA  NA       NA      
## 3 iso3c          chr       0    0      262      NA  NA       NA      
## 4 year           int       0    0       63    1960   1.99e 3  2.02e 3
## 5 EG.ELC.ACCS.ZS dbl    3393   20.2  13243 8824746.  1.21e12  1.01e14
## 6 AG.LND.IRIG.AG.ZS    dbl      93    0.6  16460    2646   2.16e 8  7.95e 9

df %>% describe_all() komutunun çalıştırılması, explore paketine ait describe_all() fonksiyonunun df veri seti üzerinde uygulanmasını sağlar. Bu işlem, veri setindeki her bir değişken için kapsamlı betimleyici istatistikler üreterek veri yapısı, değişken türleri, eksik gözlemler ve temel istatistiksel özellikler hakkında genel bir bakış sunar. Bu çıktı, daha ileri analizlere geçmeden önce veri setinin özelliklerini anlamak açısından önemlidir.

Veri seti, 1960–2022 dönemini kapsayacak şekilde 266 farklı ülkeye ait gözlemler içermektedir.

Mevcut değişkenler şu şekilde özetlenebilir:

  • country değişkeni karakter (metin) türündedir ve ülke adlarını temsil etmektedir.

  • iso2c ve iso3c değişkenleri de karakter türünde olup, ülkeler için kullanılan standart kodları ifade etmektedir.

  • year değişkeni tamsayı (integer) formatındadır ve 1960’tan 2022’ye kadar olan yılları kapsamaktadır.

  • EG.ELC.ACCS.ZS değişkeni sayısal (double) formatta olup, nüfusun elektriğe erişim oranını göstermektedir. Bu değişken için gözlemlerin yaklaşık %20,2’si eksiktir.

  • AG.LND.IRIG.AG.ZS değişkeni de sayısal (double) formatta olup, tarım arazilerinin sulama altyapısına sahip olan kısmını ifade etmektedir. Bu değişkende eksik gözlem oranı oldukça düşüktür ve yaklaşık %0,6 seviyesindedir.

Genel olarak veri seti, uzun bir zaman dilimi boyunca çok sayıda ülkeye ait önemli kalkınma göstergelerini içermektedir. Bazı değişkenlerde eksik gözlemler bulunmasına rağmen, veri seti küresel kalkınma eğilimlerini incelemek ve ekonometrik analizler yapmak için yeterince zengin bir yapı sunmaktadır.

# Extract unique countries in the dataset
countries <- unique(df$country)

R’de unique() fonksiyonu, bir vektör, veri çerçevesi (data frame) veya dizi (array) içindeki tekrarlanmayan (benzersiz) değerleri elde etmek için kullanılır.

knitr::kable(countries)
x
Afghanistan
Africa Eastern and Southern
Africa Western and Central
Albania
Algeria
American Samoa
Andorra
Angola
Antigua and Barbuda
Arab World
Argentina
Armenia
Aruba
Australia
Austria
Azerbaijan
Bahamas, The
Bahrain
Bangladesh
Barbados
Belarus
Belgium
Belize
Benin
Bermuda
Bhutan
Bolivia
Bosnia and Herzegovina
Botswana
Brazil
British Virgin Islands
Brunei Darussalam
Bulgaria
Burkina Faso
Burundi
Cabo Verde
Cambodia
Cameroon
Canada
Caribbean small states
Cayman Islands
Central African Republic
Central Europe and the Baltics
Chad
Channel Islands
Chile
China
Colombia
Comoros
Congo, Dem. Rep.
Congo, Rep.
Costa Rica
Cote d’Ivoire
Croatia
Cuba
Curacao
Cyprus
Czechia
Denmark
Djibouti
Dominica
Dominican Republic
Early-demographic dividend
East Asia & Pacific (excluding high income)
East Asia & Pacific (IDA & IBRD countries)
East Asia & Pacific
Ecuador
Egypt, Arab Rep.
El Salvador
Equatorial Guinea
Eritrea
Estonia
Eswatini
Ethiopia
Euro area
Europe & Central Asia (excluding high income)
Europe & Central Asia (IDA & IBRD countries)
Europe & Central Asia
European Union
Faroe Islands
Fiji
Finland
Fragile and conflict affected situations
France
French Polynesia
Gabon
Gambia, The
Georgia
Germany
Ghana
Gibraltar
Greece
Greenland
Grenada
Guam
Guatemala
Guinea-Bissau
Guinea
Guyana
Haiti
Heavily indebted poor countries (HIPC)
High income
Honduras
Hong Kong SAR, China
Hungary
IBRD only
Iceland
IDA & IBRD total
IDA blend
IDA only
IDA total
India
Indonesia
Iran, Islamic Rep.
Iraq
Ireland
Isle of Man
Israel
Italy
Jamaica
Japan
Jordan
Kazakhstan
Kenya
Kiribati
Korea, Dem. People’s Rep.
Korea, Rep.
Kosovo
Kuwait
Kyrgyz Republic
Lao PDR
Late-demographic dividend
Latin America & Caribbean (excluding high income)
Latin America & Caribbean
Latin America & the Caribbean (IDA & IBRD countries)
Latvia
Least developed countries: UN classification
Lebanon
Lesotho
Liberia
Libya
Liechtenstein
Lithuania
Low & middle income
Low income
Lower middle income
Luxembourg
Macao SAR, China
Madagascar
Malawi
Malaysia
Maldives
Mali
Malta
Marshall Islands
Mauritania
Mauritius
Mexico
Micronesia, Fed. Sts.
Middle East, North Africa, Afghanistan & Pakistan (excluding high income)
Middle East, North Africa, Afghanistan & Pakistan (IDA & IBRD)
Middle East, North Africa, Afghanistan & Pakistan
Middle income
Moldova
Monaco
Mongolia
Montenegro
Morocco
Mozambique
Myanmar
Namibia
Nauru
Nepal
Netherlands
New Caledonia
New Zealand
Nicaragua
Niger
Nigeria
North America
North Macedonia
Northern Mariana Islands
Norway
Not classified
OECD members
Oman
Other small states
Pacific island small states
Pakistan
Palau
Panama
Papua New Guinea
Paraguay
Peru
Philippines
Poland
Portugal
Post-demographic dividend
Pre-demographic dividend
Puerto Rico (US)
Qatar
Romania
Russian Federation
Rwanda
Samoa
San Marino
Sao Tome and Principe
Saudi Arabia
Senegal
Serbia
Seychelles
Sierra Leone
Singapore
Sint Maarten (Dutch part)
Slovak Republic
Slovenia
Small states
Solomon Islands
Somalia, Fed. Rep.
South Africa
South Asia (IDA & IBRD)
South Asia
South Sudan
Spain
Sri Lanka
St. Kitts and Nevis
St. Lucia
St. Martin (French part)
St. Vincent and the Grenadines
Sub-Saharan Africa (excluding high income)
Sub-Saharan Africa (IDA & IBRD countries)
Sub-Saharan Africa
Sudan
Suriname
Sweden
Switzerland
Syrian Arab Republic
Tajikistan
Tanzania
Thailand
Timor-Leste
Togo
Tonga
Trinidad and Tobago
Tunisia
Turkiye
Turkmenistan
Turks and Caicos Islands
Tuvalu
Uganda
Ukraine
United Arab Emirates
United Kingdom
United States
Upper middle income
Uruguay
Uzbekistan
Vanuatu
Venezuela, RB
Viet Nam
Virgin Islands (U.S.)
West Bank and Gaza
World
Yemen, Rep.
Zambia
Zimbabwe

Kullandığımız veri setinde, gerçek ülkeleri temsil etmeyen bazı gözlemler bulunmaktadır. Bunlar arasında Not classified, OECD members veya Other small states gibi tanımlayıcı ifadeler yer almaktadır. Analizin doğruluğunu sağlamak için, bu ülke dışı gözlemlerin veri setinden çıkarılması gerekmektedir.

WDI paketi, ek bilgiler sunmakta olup WDI_data$country adlı bir veri seti içermektedir. Bu veri seti, ülkeler hakkında daha ayrıntılı ve açıklayıcı bilgiler sağlamaktadır. Bu tamamlayıcı veri kullanılarak, mevcut veri setimiz ülke bilgileri açısından zenginleştirilebilir.

Kendi veri setimiz ile WDI_data$country veri setini birlikte kullanarak, ülke niteliği taşımayan gözlemleri tespit etmek ve bunları veri setinden çıkarmak mümkündür. Bu işlem sonucunda analiz, yalnızca gerçek ülkelere ait gözlemler üzerinden gerçekleştirilecek ve böylece daha doğru, güvenilir ve anlamlı sonuçlar elde edilecektir.

WDI_extra <- as.data.frame(WDI_data$country)
  1. WDI_data$countryWDI_data veri setindeki country sütununu alır.

    • Burada her satır bir ülke veya bölgeyi temsil eder.
  2. as.data.frame() → bu sütunu data frame formatına çevirir.

-    Böylece üzerinde R’da **data frame işlemleri** (filter, select, mutate vb.) kolayca yapılabilir.

Sonuç olarak `WDI_extra` adında bir **yeni data frame** oluşur ve içinde sadece **ülke/bölge isimleri** bulunur.
df <- left_join(df, WDI_extra)
## Joining with `by = join_by(country, iso2c, iso3c)`
  • Bu komut ile WDI_extra içinde hangi ülkelerin veya bölgelerin olduğunu görebilirsin.
df %>% describe_all()
## # A tibble: 13 × 8
##    variable          type     na na_pct unique     min    mean     max
##    <chr>             <chr> <int>  <dbl>  <int>   <dbl>   <dbl>   <dbl>
##  1 country           chr       0    0      266   NA      NA      NA   
##  2 iso2c             chr       0    0      266   NA      NA      NA   
##  3 iso3c             chr       0    0      262   NA      NA      NA   
##  4 year              int       0    0       65 1960    1992    2024   
##  5 EG.ELC.ACCS.ZS    dbl    9431   54.5   2553    0.53   81.2   100   
##  6 EN.CLC.MDAT.ZS    dbl   17122   99      160    0       1.17    9.23
##  7 AG.LND.IRIG.AG.ZS dbl   16062   92.9   1173    0      11.1    89.0 
##  8 region            chr     780    4.5      9   NA      NA      NA   
##  9 capital           chr     780    4.5    211   NA      NA      NA   
## 10 longitude         chr     780    4.5    211   NA      NA      NA   
## 11 latitude          chr     780    4.5    211   NA      NA      NA   
## 12 income            chr     780    4.5      7   NA      NA      NA   
## 13 lending           chr     780    4.5      6   NA      NA      NA

Bu veri seti genel olarak ülke ve yıl bilgilerini, bölgesel ve başkent bilgilerini ve bazı ekonomik ve altyapı göstergelerini içermektedir. Veri setimizde, özellikle elektriğe erişim oranı (EG.ELC.ACCS.ZS) ve tarım arazilerinin sulama oranı (AG.LND.IRIG.AG.ZS) gibi bazı önemli değişkenlerde eksik gözlemler bulunduğu görülmektedir. Kapsamlı ve güvenilir istatistiksel analizler yapabilmek için bu eksik verilerin uygun yöntemlerle ele alınması büyük önem taşımaktadır.

country, iso2c, iso3c, region, capital, longitude gibi değişkenlerde eksik veri yoktur.

year değişkeni 1960–2024 yıllarını kapsamakta ve eksiksizdir.

EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS gibi ekonomik ve altyapı göstergelerinde eksik gözlemler oldukça fazladır (bazı değişkenlerde %50’nin üzerinde).

Bu nedenle analizlerde bu eksik verilerin göz önünde bulundurulması ve gerekirse uygun imputation yöntemleri veya analiz tekniklerinin kullanılması önerilir.

# Group by 'country' and count missing values within each group
missing_data_count <- df %>%
  group_by(country) %>%
  summarize(missing_count = sum(is.na(AG.LND.IRIG.AG.ZS)), .groups = 'drop')

# Identify countries with all missing data or more than 20 missing points
countries_with_all_missing <- missing_data_count %>%
  filter(missing_count == 65)  # Change 66 to the total number of observations per country
countries_with_more_than_20_missing <- missing_data_count %>%
  filter(missing_count > 20)  # Change 20 to your desired threshold

# View countries with all missing data or more than 20 missing points
print(countries_with_all_missing)
## # A tibble: 145 × 2
##    country                     missing_count
##    <chr>                               <int>
##  1 Africa Eastern and Southern            65
##  2 Africa Western and Central             65
##  3 American Samoa                         65
##  4 Andorra                                65
##  5 Angola                                 65
##  6 Antigua and Barbuda                    65
##  7 Arab World                             65
##  8 Aruba                                  65
##  9 Bahamas, The                           65
## 10 Barbados                               65
## # ℹ 135 more rows
  • group_by(country) → veriyi ülke bazında gruplar.

  • summarize() → her grup için AG.LND.IRIG.AG.ZS sütunundaki NA (eksik) değerlerin toplamını hesaplar.

  • .groups = 'drop' → sonuçta gruplamayı kaldırır, düz bir tablo elde edilir.

-   Eğer bir ülkenin **tüm gözlemleri NA** ise burada listelenir.

-   `65` → o ülkedeki toplam yıl/gözlem sayısı, senin veri setine göre değişebilir.
  • Eğer bir ülkenin eksik veri sayısı 20’den fazla ise, bu tabloya dahil edilir.
  • 20 → senin belirlediğin eşik değeri.

  • Sadece tüm verisi eksik olan ülkeler yazdırılır.

  • Benzer şekilde countries_with_more_than_20_missing da yazdırılabilir:

###  Özet:

-    Bu kod, **ülkelerdeki eksik değerleri kontrol etmek** ve gerekirse eksik verisi çok olan ülkeleri **analiz dışında bırakmak** için kullanılır.

-    Özellikle zaman serisi analizlerinde, eksik verisi çok olan ülkeler trendi bozabileceği için bu kontrol önemlidir.
# Retirer les pays avec toutes les valeurs manquantes
df_clean <- df %>% filter(!country %in% countries_with_all_missing$country)

# Retirer les pays avec plus de 20 valeurs manquantes
df_clean <- df_clean %>% filter(!country %in% countries_with_more_than_20_missing$country)
## # A tibble: 0 × 2
## # ℹ 2 variables: country <chr>, missing_count <int>
df$country[grepl("turk", tolower(df$country))]
##   [1] "Turkiye"                  "Turkiye"                 
##   [3] "Turkiye"                  "Turkiye"                 
##   [5] "Turkiye"                  "Turkiye"                 
##   [7] "Turkiye"                  "Turkiye"                 
##   [9] "Turkiye"                  "Turkiye"                 
##  [11] "Turkiye"                  "Turkiye"                 
##  [13] "Turkiye"                  "Turkiye"                 
##  [15] "Turkiye"                  "Turkiye"                 
##  [17] "Turkiye"                  "Turkiye"                 
##  [19] "Turkiye"                  "Turkiye"                 
##  [21] "Turkiye"                  "Turkiye"                 
##  [23] "Turkiye"                  "Turkiye"                 
##  [25] "Turkiye"                  "Turkiye"                 
##  [27] "Turkiye"                  "Turkiye"                 
##  [29] "Turkiye"                  "Turkiye"                 
##  [31] "Turkiye"                  "Turkiye"                 
##  [33] "Turkiye"                  "Turkiye"                 
##  [35] "Turkiye"                  "Turkiye"                 
##  [37] "Turkiye"                  "Turkiye"                 
##  [39] "Turkiye"                  "Turkiye"                 
##  [41] "Turkiye"                  "Turkiye"                 
##  [43] "Turkiye"                  "Turkiye"                 
##  [45] "Turkiye"                  "Turkiye"                 
##  [47] "Turkiye"                  "Turkiye"                 
##  [49] "Turkiye"                  "Turkiye"                 
##  [51] "Turkiye"                  "Turkiye"                 
##  [53] "Turkiye"                  "Turkiye"                 
##  [55] "Turkiye"                  "Turkiye"                 
##  [57] "Turkiye"                  "Turkiye"                 
##  [59] "Turkiye"                  "Turkiye"                 
##  [61] "Turkiye"                  "Turkiye"                 
##  [63] "Turkiye"                  "Turkiye"                 
##  [65] "Turkiye"                  "Turkmenistan"            
##  [67] "Turkmenistan"             "Turkmenistan"            
##  [69] "Turkmenistan"             "Turkmenistan"            
##  [71] "Turkmenistan"             "Turkmenistan"            
##  [73] "Turkmenistan"             "Turkmenistan"            
##  [75] "Turkmenistan"             "Turkmenistan"            
##  [77] "Turkmenistan"             "Turkmenistan"            
##  [79] "Turkmenistan"             "Turkmenistan"            
##  [81] "Turkmenistan"             "Turkmenistan"            
##  [83] "Turkmenistan"             "Turkmenistan"            
##  [85] "Turkmenistan"             "Turkmenistan"            
##  [87] "Turkmenistan"             "Turkmenistan"            
##  [89] "Turkmenistan"             "Turkmenistan"            
##  [91] "Turkmenistan"             "Turkmenistan"            
##  [93] "Turkmenistan"             "Turkmenistan"            
##  [95] "Turkmenistan"             "Turkmenistan"            
##  [97] "Turkmenistan"             "Turkmenistan"            
##  [99] "Turkmenistan"             "Turkmenistan"            
## [101] "Turkmenistan"             "Turkmenistan"            
## [103] "Turkmenistan"             "Turkmenistan"            
## [105] "Turkmenistan"             "Turkmenistan"            
## [107] "Turkmenistan"             "Turkmenistan"            
## [109] "Turkmenistan"             "Turkmenistan"            
## [111] "Turkmenistan"             "Turkmenistan"            
## [113] "Turkmenistan"             "Turkmenistan"            
## [115] "Turkmenistan"             "Turkmenistan"            
## [117] "Turkmenistan"             "Turkmenistan"            
## [119] "Turkmenistan"             "Turkmenistan"            
## [121] "Turkmenistan"             "Turkmenistan"            
## [123] "Turkmenistan"             "Turkmenistan"            
## [125] "Turkmenistan"             "Turkmenistan"            
## [127] "Turkmenistan"             "Turkmenistan"            
## [129] "Turkmenistan"             "Turkmenistan"            
## [131] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [133] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [135] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [137] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [139] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [141] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [143] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [145] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [147] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [149] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [151] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [153] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [155] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [157] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [159] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [161] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [163] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [165] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [167] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [169] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [171] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [173] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [175] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [177] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [179] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [181] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [183] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [185] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [187] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [189] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [191] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [193] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [195] "Turks and Caicos Islands"
  • tolower(df$country)country sütunundaki tüm değerleri küçük harfe çevirir.

    • Böylece "Turkey", "TURKEY", "turkey" fark etmez.
  • grepl("turk", ...) → her bir ülke isminin içinde "turk" geçenleri TRUE/FALSE olarak döndürür.

  • df$country[...] → TRUE olan satırları seçer.

-    Yani `"turk"` geçen ülke adlarını listelemiş olursun.

    -   Bu sayede Türkiye’nin veri setindeki **tam adı** otomatik olarak bulunur.

    -    Sonraki adımda bu adı kullanarak veri filtreleme ve grafik çizme işlemi yapılabilir:
df_turkey <- df %>%
  filter(country == "Turkey")  # ya da unique çıktısına göre
  • filter(country == "Turkey") → veri setinde country sütununda “Turkey” olan satırları seçer.
  • %>% → pipe operatörü, önceki veri çerçevesini alır ve filter() fonksiyonuna gönderir.
  • Sonuç df_turkey adlı yeni bir veri çerçevesi olur ve sadece Türkiye verilerini içerir.
library(dplyr)
library(tidyr)
library(ggplot2)

# 1️⃣ Sadece gerçek ülkeleri bırak
df_countries <- df %>%
  filter(!grepl("World|Africa|Arab|Middle|Low|High|Developing|Emerging", country))

# 2️⃣ Türkiye'nin adını otomatik tespit et
turkey_name <- df_countries$country[grepl("turk", tolower(df_countries$country))][1]

if(is.na(turkey_name)){
  stop("Türkiye için veri bulunamadı. df$country içeriğini kontrol et.")
}

# 3️⃣ Türkiye verisini filtrele ve year sütununu temizle
df_turkey <- df_countries %>%
  filter(country == turkey_name) %>%
  mutate(
    year = as.numeric(gsub("[^0-9]", "", year))
  ) %>%
  select(year, EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS) %>%
  filter(!is.na(year))  # yılı olmayanları çıkar

# 4️⃣ Veriyi uzun formata çevir
df_long <- df_turkey %>%
  pivot_longer(
    cols = -year,
    names_to = "indicator",
    values_to = "value"
  )

# 5️⃣ Daha anlaşılır isimler verelim
df_long <- df_long %>%
  mutate(
    indicator = case_when(
      indicator == "EG.ELC.ACCS.ZS" ~ "Toplam",
      indicator == "EN.CLC.MDAT.ZS" ~ "Kırsal",
      indicator == "AG.LND.IRIG.AG.ZS" ~ "Kentsel",
      TRUE ~ indicator
    )
  )

# 6️⃣ Grafik oluştur
ggplot(df_long, aes(x = year, y = value, color = indicator)) +
  geom_line(size = 1) +
  geom_point(size = 2) +
  labs(
    title = paste0(turkey_name, " - Elektrik Erişimi Karşılaştırması"),
    x = "Yıl",
    y = "Elektriğe Erişim (%)",
    color = "Gösterge"
  ) +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Removed 136 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Warning: Removed 136 rows containing missing values or values outside the scale range
## (`geom_point()`).

print(countries_with_more_than_20_missing)
## # A tibble: 266 × 2
##    country                     missing_count
##    <chr>                               <int>
##  1 Afghanistan                            42
##  2 Africa Eastern and Southern            65
##  3 Africa Western and Central             65
##  4 Albania                                48
##  5 Algeria                                49
##  6 American Samoa                         65
##  7 Andorra                                65
##  8 Angola                                 65
##  9 Antigua and Barbuda                    65
## 10 Arab World                             65
## # ℹ 256 more rows
  1. countries_with_more_than_20_missing → önceden oluşturduğun veri çerçevesi.

    • çinde iki sütun var:
    -    `country` → ülke adı
    
    -    `missing_count` → eksik değer sayısı
  2. print() → bu veri çerçevesini ekrana yazdırır.

🔹 Ne işe yarıyor?

  • Bu sayede eksik veri sayısı 20’den fazla olan ülkeler listesini görebilirsin.

  • Örneğin, analiz veya grafik çizmeden önce çok eksik verisi olan ülkeleri elemek için kullanılır.

## # A tibble: 1 × 2
##   country            missing_count
##   <chr>                      <int>
## 1 West Bank and Gaza            30
# Filter out West Bank and Gaza
df <- df %>%
  filter(!(country %in% c("West Bank and Gaza")))
df %>% describe_all()
## # A tibble: 13 × 8
##    variable          type     na na_pct unique     min    mean     max
##    <chr>             <chr> <int>  <dbl>  <int>   <dbl>   <dbl>   <dbl>
##  1 country           chr       0    0      265   NA      NA      NA   
##  2 iso2c             chr       0    0      265   NA      NA      NA   
##  3 iso3c             chr       0    0      261   NA      NA      NA   
##  4 year              int       0    0       65 1960    1992    2024   
##  5 EG.ELC.ACCS.ZS    dbl    9393   54.5   2551    0.53   81.2   100   
##  6 EN.CLC.MDAT.ZS    dbl   17057   99      160    0       1.17    9.23
##  7 AG.LND.IRIG.AG.ZS dbl   16009   92.9   1161    0      11.1    89.0 
##  8 region            chr     780    4.5      9   NA      NA      NA   
##  9 capital           chr     780    4.5    211   NA      NA      NA   
## 10 longitude         chr     780    4.5    211   NA      NA      NA   
## 11 latitude          chr     780    4.5    211   NA      NA      NA   
## 12 income            chr     780    4.5      7   NA      NA      NA   
## 13 lending           chr     780    4.5      6   NA      NA      NA
  1. df %>% → pipe operatörü, df veri çerçevesini describe_all() fonksiyonuna gönderir.

  2. describe_all() → veri çerçevesindeki tüm sütunlar için özet istatistikler üretir.

-    Örnek çıktılar:

    -    `n` → gözlem sayısı

    -    `mean` → ortalama (numeric sütunlar için)

    -    `min`, `max` → minimum ve maksimum değerler

    -    `sd` → standart sapma

    -    `missing` → eksik değer sayısı
# Subset the original dataset 'df' to keep year bigger than 2000
dff <- df %>%
  filter(year>=2005)
  • df %>% → pipe operatörü, df veri çerçevesini sonraki fonksiyona gönderir.

  • filter(year >= 2005)year sütunu 2005 veya daha büyük olan satırları seçer.

  • Sonuç dff adlı yeni bir veri çerçevesi olur ve artık sadece 2005 ve sonrası yılları içerir.

Bu kod, veri setini 2005 ve sonrası yıllar ile sınırlar, böylece grafikler veya analizler sadece bu dönemi kapsar.

# Group by 'country' and count missing values within each group
missing_data_count <- dff %>%
  group_by(country) %>%
  summarize(missing_count = sum(is.na(EG.ELC.ACCS.ZS)), .groups = 'drop')
  1. dff %>% → pipe operatörü, dff veri çerçevesini sonraki fonksiyona gönderir.

    • dffsadece 2005 ve sonrası yılları içeren veri seti.
  2. group_by(country) → veriyi ülke bazında gruplar.

  3. summarize(missing_count = sum(is.na(EG.ELC.ACCS.ZS))) → her ülke için:

-    `EG.ELC.ACCS.ZS` sütunundaki **eksik değerleri sayar** (`NA` olanları toplar).

-    `missing_count` → her ülke için eksik veri sayısını içerir.
  1. .groups = 'drop' → özetleme sonrası gruplamayı kaldırır, düz bir tablo elde edilir.

  2. Sonuç olarak missing_data_counther ülke için toplam eksik değer sayısını içeren bir veri çerçevesi olur.

dff %>% describe_all()
## # A tibble: 13 × 8
##    variable          type     na na_pct unique    min    mean     max
##    <chr>             <chr> <int>  <dbl>  <int>  <dbl>   <dbl>   <dbl>
##  1 country           chr       0    0      265   NA     NA      NA   
##  2 iso2c             chr       0    0      265   NA     NA      NA   
##  3 iso3c             chr       0    0      261   NA     NA      NA   
##  4 year              int       0    0       20 2005   2014.   2024   
##  5 EG.ELC.ACCS.ZS    dbl     330    6.2   1621    0.8   82.2   100   
##  6 EN.CLC.MDAT.ZS    dbl    5132   96.8    160    0      1.17    9.23
##  7 AG.LND.IRIG.AG.ZS dbl    4253   80.2   1002    0     11.4    89.0 
##  8 region            chr     240    4.5      9   NA     NA      NA   
##  9 capital           chr     240    4.5    211   NA     NA      NA   
## 10 longitude         chr     240    4.5    211   NA     NA      NA   
## 11 latitude          chr     240    4.5    211   NA     NA      NA   
## 12 income            chr     240    4.5      7   NA     NA      NA   
## 13 lending           chr     240    4.5      6   NA     NA      NA
Sütun Açıklama
variable Sütun adı (örneğin country, EG.ELC.ACCS.ZS vb.)
type Sütunun veri tipi (chr = karakter, dbl = numeric, int = integer)
na Sütundaki eksik değer sayısı (NA sayısı)
na_pct Eksik değer yüzdesi (%)
unique Sütundaki benzersiz değer sayısı
# Örnek: EG.ELC.ACCS.ZS sütununda eksik veri sayısı <=20 olan ülkeler
countries_to_keep <- missing_data_count %>%
  filter(missing_count <= 20) %>%
  pull(country)  # sadece country sütununu al
  • missing_data_count %>% → pipe operatörü ile missing_data_count veri çerçevesini sonraki fonksiyona gönderir.

    • missing_data_count → daha önce her ülke için EG.ELC.ACCS.ZS eksik değerlerini saydığın tablo.
  • filter(missing_count <= 20) → eksik veri sayısı 20 veya daha az olan ülkeleri seçer.
  • pull(country) → sadece country sütununu alır ve vector hâline getirir.
Sonuç:

-    `countries_to_keep` → analiz için kullanılabilecek, **eksik verisi çok olmayan ülkelerin listesi** olur.
if (nrow(df) > 6) {
  df %>% describe_all()
}
## # A tibble: 13 × 8
##    variable          type     na na_pct unique     min    mean     max
##    <chr>             <chr> <int>  <dbl>  <int>   <dbl>   <dbl>   <dbl>
##  1 country           chr       0    0      265   NA      NA      NA   
##  2 iso2c             chr       0    0      265   NA      NA      NA   
##  3 iso3c             chr       0    0      261   NA      NA      NA   
##  4 year              int       0    0       65 1960    1992    2024   
##  5 EG.ELC.ACCS.ZS    dbl    9393   54.5   2551    0.53   81.2   100   
##  6 EN.CLC.MDAT.ZS    dbl   17057   99      160    0       1.17    9.23
##  7 AG.LND.IRIG.AG.ZS dbl   16009   92.9   1161    0      11.1    89.0 
##  8 region            chr     780    4.5      9   NA      NA      NA   
##  9 capital           chr     780    4.5    211   NA      NA      NA   
## 10 longitude         chr     780    4.5    211   NA      NA      NA   
## 11 latitude          chr     780    4.5    211   NA      NA      NA   
## 12 income            chr     780    4.5      7   NA      NA      NA   
## 13 lending           chr     780    4.5      6   NA      NA      NA
Sütun Açıklama
variable Sütun adı (örneğin country, EG.ELC.ACCS.ZS vb.)
type Sütunun veri tipi (chr = karakter, dbl = numeric, int = integer)
na Sütundaki eksik değer sayısı (NA sayısı)
na_pct Eksik değer yüzdesi (%)
unique Sütundaki benzersiz değer sayısı

WDI Göstergelerine Dayalı Ampirik Analize Geçiş

Küresel üretkenlik analizi, ülkelerin dünya ekonomisine katkılarının yalnızca nüfus büyüklüklerine değil, aynı zamanda mevcut kaynakları ne ölçüde etkin bir şekilde üretime dönüştürebildiklerine bağlı olduğunu göstermektedir. Bu üretkenlik kapasitesi; altyapı kalitesi, teknolojik gelişmişlik düzeyi, kurumsal etkinlik ve üretim süreçlerinin sürdürülebilirliği gibi yapısal faktörlerle yakından ilişkilidir.

Bu çerçevede, World Development Indicators (WDI) veri tabanından elde edilen göstergelerin incelenmesi, üretkenlik ve ekonomik kalkınmanın temel belirleyicilerini daha ayrıntılı biçimde analiz etme imkânı sunmaktadır. Elektriğe erişim, modern ekonomik faaliyetlerin ön koşulu niteliğinde olup üretim kapasitesi ve yaşam kalitesi üzerinde doğrudan etkiye sahiptir. İklim değişikliğiyle mücadeleye yönelik politikalar ise ülkelerin kurumsal olgunluğunu ve uzun vadeli planlama kapasitesini yansıtmaktadır. Bunun yanı sıra, sulanan tarım arazilerinin payı, özellikle tarımın hâlen önemli bir rol oynadığı ekonomilerde, üretim istikrarı ve verimlilik açısından kritik bir göstergedir.

Dolayısıyla EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS ve AG.LND.IRIG.AG.ZS göstergelerine dayalı ampirik analiz, küresel üretkenliğin değerlendirilmesine doğal bir devam niteliği taşımaktadır. Bu yaklaşım, ülkelerin dünya ekonomisindeki göreli konumlarını yalnızca toplam üretim düzeyleriyle değil; aynı zamanda bu üretimi mümkün kılan altyapısal, çevresel ve kurumsal koşullar üzerinden açıklamaya olanak tanımakta ve uzun vadeli kalkınma süreçlerinin daha bütüncül bir şekilde anlaşılmasını sağlamaktadır.

library(dplyr)
library(tidyr)
library(ggplot2)

# Supprimer les agrégats (World, regions, income groups)
df_countries <- df %>%
  filter(!grepl("World|Africa|Europe|Asia|Arab|Income|Low|High|Middle", country))

# Sélection des variables pertinentes
df_selected <- df_countries %>%
  select(
    country, year,
    EG.ELC.ACCS.ZS,
    EN.CLC.MDAT.ZS,
    AG.LND.IRIG.AG.ZS
  ) %>%
  mutate(year = as.numeric(year))
summary_stats <- df_selected %>%
  summarise(
    elec_mean = mean(EG.ELC.ACCS.ZS, na.rm = TRUE),
    climate_mean = mean(EN.CLC.MDAT.ZS, na.rm = TRUE),
    irrig_mean = mean(AG.LND.IRIG.AG.ZS, na.rm = TRUE)
  )

summary_stats
##   elec_mean climate_mean irrig_mean
## 1  81.55006     1.190369   11.19203

Göstergelerin ortalama değerleri, altyapı, çevre politikaları ve tarımsal kapasite açısından ülkeler arasında önemli farklılıklar bulunduğunu göstermektedir.

df_long <- df_selected %>%
  pivot_longer(
    cols = c(EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS),
    names_to = "indicator",
    values_to = "value"
  )
df_trend <- df_long %>%
  group_by(year, indicator) %>%
  summarise(mean_value = mean(value, na.rm = TRUE), .groups = "drop")

ggplot(df_trend, aes(x = year, y = mean_value, color = indicator)) +
  geom_line(size = 1) +
  labs(
    title = "Dünya Genelinde Seçilmiş Göstergelerin Zaman İçindeki Eğilimleri",
    x = "Yıl",
    y = "Ortalama Değer",
    color = "Gösterge"
  ) +
  theme_minimal()
## Warning: Removed 126 rows containing missing values or values outside the scale range
## (`geom_line()`).

Betimleyici istatistikler ve grafikler aracılığıyla zaman içerisindeki eğilimler incelenmiştir.

df_selected <- df_selected %>%
  mutate(
    elec_group = case_when(
      EG.ELC.ACCS.ZS >= 95 ~ "Yüksek Elektrik Erişimi",
      EG.ELC.ACCS.ZS < 95  ~ "Düşük Elektrik Erişimi"
    )
  )

ggplot(df_selected, aes(x = elec_group, y = AG.LND.IRIG.AG.ZS)) +
  geom_boxplot() +
  labs(
    title = "Elektrik Erişimi ile Tarımsal Sulama Arasındaki İlişki",
    x = "Elektrik Erişim Düzeyi",
    y = "Sulanan Tarım Arazisi (%)"
  ) +
  theme_minimal()
## Warning: Removed 14042 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

Elektriğe erişim ile tarımsal üretim kapasitesi arasında anlamlı farklılıklar gözlemlenmektedir.

df_corr <- df_selected %>%
  select(EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS) %>%
  na.omit()

cor(df_corr)
##                   EG.ELC.ACCS.ZS EN.CLC.MDAT.ZS AG.LND.IRIG.AG.ZS
## EG.ELC.ACCS.ZS         1.0000000    -0.55671399        0.14347765
## EN.CLC.MDAT.ZS        -0.5567140     1.00000000        0.02212977
## AG.LND.IRIG.AG.ZS      0.1434777     0.02212977        1.00000000

Korelasyon sonuçları, altyapı gelişmişliği ile kalkınma göstergeleri arasında pozitif ilişkiler olduğunu göstermektedir.

model <- lm(
  EG.ELC.ACCS.ZS ~ EN.CLC.MDAT.ZS + AG.LND.IRIG.AG.ZS,
  data = df_selected
)

summary(model)
## 
## Call:
## lm(formula = EG.ELC.ACCS.ZS ~ EN.CLC.MDAT.ZS + AG.LND.IRIG.AG.ZS, 
##     data = df_selected)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -49.531  -3.391   5.608   8.300  48.333 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        91.9408     4.0309  22.809  < 2e-16 ***
## EN.CLC.MDAT.ZS     -8.5299     1.8736  -4.553 4.16e-05 ***
## AG.LND.IRIG.AG.ZS   0.2542     0.2007   1.267    0.212    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.2 on 44 degrees of freedom
##   (15163 observations effacées parce que manquantes)
## Multiple R-squared:  0.3342, Adjusted R-squared:  0.304 
## F-statistic: 11.04 on 2 and 44 DF,  p-value: 0.0001298

Bu modeller aracılığıyla nedensel bir ilişki kurmaktan ziyade, değişkenler arasındaki istatistiksel ilişkiler değerlendirilmiştir.

df_turkey <- df_selected %>%
  filter(country == "Turkey")

ggplot(df_turkey, aes(x = year)) +
  geom_line(aes(y = EG.ELC.ACCS.ZS, color = "Elektrik")) +
  geom_line(aes(y = AG.LND.IRIG.AG.ZS, color = "Sulama")) +
  labs(
    title = "Türkiye'de Elektrik Erişimi ve Tarımsal Sulama",
    x = "Yıl",
    y = "Değer",
    color = "Gösterge"
  ) +
  theme_minimal()

colnames(df_selected)
## [1] "country"           "year"              "EG.ELC.ACCS.ZS"   
## [4] "EN.CLC.MDAT.ZS"    "AG.LND.IRIG.AG.ZS" "elec_group"
df_summary <- df_selected %>%
  group_by(year) %>%
  summarise(
    elec = mean(EG.ELC.ACCS.ZS, na.rm = TRUE),
    irrig = mean(AG.LND.IRIG.AG.ZS, na.rm = TRUE),
    climate = mean(EN.CLC.MDAT.ZS, na.rm = TRUE),
    .groups = "drop"
  )

ggplot(df_summary, aes(x = year)) +
  geom_line(aes(y = elec, color = "Elektrik")) +
  geom_line(aes(y = irrig, color = "Sulama")) +
  labs(
    title = "Dünya Genelinde Göstergelerin Zaman İçindeki Seyri",
    x = "Yıl",
    y = "Ortalama Değer",
    color = "Gösterge"
  ) +
  theme_minimal()
## Warning: Removed 31 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Removed 31 rows containing missing values or values outside the scale range
## (`geom_line()`).

Bu kod parçası, ülkeler arasında dağınık ve heterojen yapıya sahip olan Dünya Bankası verilerini bir araya getirerek, küresel düzeyde anlamlı ve karşılaştırılabilir eğilimler elde etmek amacıyla kullanılmaktadır. Tek tek ülkeler incelendiğinde sonuçlar çoğu zaman parçalı, gürültülü ve yorumlanması güç bir yapı sergilemektedir. Bu nedenle veriler, yıllara göre gruplanarak dünya ortalamaları hesaplanmıştır.

summarise() fonksiyonu aracılığıyla elektriğe erişim oranı, sulanan tarım arazilerinin payı ve iklim değişikliğiyle ilgili politika göstergeleri için her yılın ortalama değerleri elde edilmiştir. Bu yaklaşım, küresel kalkınma dinamiklerinin zaman içerisindeki genel seyrini daha net bir biçimde ortaya koymayı mümkün kılmaktadır.

Elde edilen ortalama değerlerin çizgi grafikleriyle görselleştirilmesi, altyapı gelişimi, tarımsal sürdürülebilirlik ve çevresel politika kapasitesinin uzun dönemde nasıl evrildiğini açık bir şekilde göstermektedir. Bu analiz, göstergeler arasında doğrudan nedensel bir ilişki kurmayı amaçlamaktan ziyade, küresel ölçekteki yapısal dönüşümleri ve genel eğilimleri betimleyici bir çerçevede sunması açısından çalışmanın temel amacıyla doğrudan örtüşmektedir.

ggplot(df, aes(x = year, y = EG.ELC.ACCS.ZS)) +
  geom_line() +
  labs(
    title = "Global Trend in Access to Electricity",
    x = "Year",
    y = "Access to Electricity (% of population)"
  )
## Warning: Removed 8218 rows containing missing values or values outside the scale range
## (`geom_line()`).

Grafik, dünya genelinde elektriğe erişimi olan nüfusun yüzdesinin zaman içindeki değişimini göstermektedir. Zaman içerisinde genel olarak artan bir eğilim gözlemlenmektedir. Bu durum, enerji altyapısının geliştirilmesine yönelik küresel çabaların ve temel hizmetlere erişimin yaygınlaştırılmasına yönelik politikaların etkili olduğunu göstermektedir. Özellikle gelişmekte olan ülkelerde elektriğe erişimin artması, ekonomik ve sosyal kalkınma açısından önemli bir ilerleme olarak değerlendirilmektedir.

Bununla birlikte, artış eğiliminin doğrusal olmaması, ülkeler ve bölgeler arasında devam eden eşitsizliklere işaret etmektedir. Ekonomik kısıtlar, kurumsal yetersizlikler ve politik istikrarsızlıklar, elektriğe erişimin bazı dönemlerde yavaşlamasına neden olmuş olabilir. Elektriğe erişim, üretkenlik, eğitim ve sağlık hizmetlerine erişim gibi birçok temel unsurun ön koşulu olduğundan, bu göstergedeki artış genel kalkınma seviyesindeki iyileşmeyi yansıtmaktadır. Ancak, sürdürülebilir ve kapsayıcı bir kalkınma için elektriğe erişimde kalan eşitsizliklerin azaltılmasına yönelik hedefe yönelik politikaların uygulanması gerekmektedir.

ggplot(df, aes(x = year, y = AG.LND.IRIG.AG.ZS)) +
  geom_line() +
  labs(
    title = "Share of Irrigated Agricultural Land Over Time",
    x = "Year",
    y = "Irrigated Agricultural Land (%)"
  )
## Warning: Removed 8468 rows containing missing values or values outside the scale range
## (`geom_line()`).

Bu çalışmada kullanılan göstergeler, ülkelerin ekonomik üretim düzeylerinden ziyade altyapı gelişmişliği, çevresel politika kapasitesi ve tarımsal sürdürülebilirlik düzeylerini ölçmektedir. Bu nedenle analiz, küresel üretkenlikten çok kalkınma ve sürdürülebilirlik boyutlarına odaklanmaktadır.

Sonuç :

Bu çalışmada, Dünya Bankası’nın World Development Indicators (WDI) veri tabanı kullanılarak ülkelerin kalkınma süreçleri altyapı gelişmişliği, çevresel politika kapasitesi ve tarımsal sürdürülebilirlik boyutlarıyla ele alınmıştır. Analiz, elektriğe erişim oranı (EG.ELC.ACCS.ZS), iklim değişikliğiyle ilgili politika göstergeleri (EN.CLC.MDAT.ZS) ve sulanan tarım arazilerinin payı (AG.LND.IRIG.AG.ZS) üzerine odaklanmıştır. Betimleyici istatistikler, grafikler ve basit ekonometrik modeller, özellikle elektriğe erişimin birçok kalkınma göstergesiyle birlikte hareket ettiğini ve altyapının ekonomik ve sosyal kalkınmada temel bir unsur olduğunu göstermektedir.

Buna karşılık, iklim politikaları ve tarımsal sulama göstergeleri ülkeler arasında daha heterojen bir yapı sergilemekte olup, bu farklılıklar büyük ölçüde kurumsal kapasite, coğrafi koşullar ve kalkınma düzeyleriyle ilişkilidir. Elde edilen bulgular, kalkınmanın yalnızca tek bir göstergeyle açıklanamayacağını; altyapı, çevresel sürdürülebilirlik ve tarımsal üretim politikalarının birlikte değerlendirilmesi gerektiğini ortaya koymaktadır.

Bununla birlikte, çalışma Dünya Bankası göstergelerine dayalı korelasyon ve basit regresyon analizleriyle sınırlıdır ve bu nedenle kesin nedensel ilişkiler kurmaya imkân vermemektedir. Ayrıca bazı ülkelerdeki veri eksiklikleri ve göstergelerin toplulaştırılmış yapısı sonuçların dikkatli yorumlanmasını gerektirmektedir. Gelecek çalışmalarda daha uzun zaman serileri, ek kalkınma göstergeleri ve gelişmiş ekonometrik yöntemler kullanılarak bu ilişkiler daha derinlemesine incelenebilir. Genel olarak bu çalışma, WDI verilerinin ülkelerin kalkınma dinamiklerini analiz etmede güçlü ve kullanışlı bir araç olduğunu ortaya koymaktadır.