Ülkeler arası karşılaştırılabilir verilerin mevcudiyeti, ekonomik, sosyal ve çevresel kalkınma dinamiklerinin analiz edilmesi açısından büyük önem taşımaktadır. Dünya Bankası tarafından sunulan World Development Indicators (WDI) veri tabanı; enerji, çevre, tarım ve beşerî kalkınma gibi birçok temel alanı kapsayan geniş bir gösterge seti içermektedir.
Bu projenin amacı, Dünya Bankası WDI veri tabanından seçilen bazı göstergeleri kullanarak altyapı olanakları, çevre politikaları ve tarımsal kalkınma arasındaki ilişkileri ampirik olarak incelemektir. Bu kapsamda analiz, elektrik erişimi, iklim değişikliğiyle ilgili politikalar ve sulanan tarım arazilerinin payı göstergelerine odaklanmaktadır.
Bu çalışma, Dünya Bankası verilerinin akademik bir çerçevede nasıl kullanılabileceğini göstermek amacıyla betimleyici ve basit ekonometrik analizleri bir araya getirmektedir.
Veri Setinin Tanıtımı
Bu projede kullanılan veriler, Dünya Bankası’nın World Development Indicators veri tabanından elde edilmiştir. WDI, çok sayıda ülke için yıllık zaman serileri sunarak ülkeler arası güvenilir karşılaştırmalar yapılmasına imkân tanımaktadır.
Çalışmada kullanılan göstergeler aşağıdaki gibidir:
EG.ELC.ACCS.ZS: Elektriğe erişim (% nüfus). Bu gösterge, bir ülkede nüfusun ne kadarının elektriğe erişimi olduğunu ölçmekte ve altyapı gelişmişliğinin önemli bir göstergesi olarak kabul edilmektedir.
EN.CLC.MDAT.ZS: İklim değişikliğiyle ilgili politika ve önlemler. Bu gösterge, ülkelerin iklim değişikliğiyle mücadele kapsamında uyguladıkları politika ve düzenlemelere ilişkin bilgi sunmaktadır.
AG.LND.IRIG.AG.ZS: Sulanan tarım arazilerinin payı (% tarım arazisi). Bu gösterge, tarımsal üretimin sürdürülebilirliği ve verimliliği açısından önemli bir ölçüttür.
Dünya Bankası veri tabanındaki URL’lerde yer alan “EG.ELC.ACCS.ZS”, “EN.CLC.MDAT.ZS” ve “AG.LND.IRIG.AG.ZS” kodları, ilgili göstergeler için kullanılan benzersiz tanımlayıcılar olup, analizin şeffaflığını ve tekrar edilebilirliğini sağlamaktadır.
Analiz süreci birkaç aşamadan oluşmaktadır. İlk aşamada veriler içe aktarılmış, temizlenmiş ve analiz için uygun hâle getirilmiştir. Bu süreçte eksik gözlemler ele alınmış ve ülkeler ile yıllar arasında tutarlılık sağlanmıştır.
İkinci aşamada betimleyici istatistikler ve grafikler aracılığıyla değişkenlerin dağılımları ve zaman içerisindeki eğilimleri incelenmiştir. Bu görsel analizler, ülkeler arasındaki farklılıkların daha net bir şekilde anlaşılmasına yardımcı olmaktadır.
Son aşamada ise, göstergeler arasındaki ilişkileri incelemek amacıyla basit doğrusal regresyon modelleri kullanılmıştır. Bu modeller aracılığıyla nedensel bir ilişki kurmaktan ziyade, değişkenler arasındaki istatistiksel ilişkiler değerlendirilmiştir.
Ampirik analiz, öncelikle verilerin grafiksel olarak incelenmesiyle başlamaktadır. Elektriğe erişim oranlarının, genellikle orta ve yüksek gelirli ülkelerde daha yüksek olduğu, düşük gelirli ülkelerde ise daha heterojen bir yapı sergilediği gözlemlenmektedir.
İklim politikalarına ilişkin göstergeler, kurumsal kapasitesi daha güçlü olan ülkelerde daha yaygın bir şekilde uygulanmaktadır. Benzer şekilde, sulanan tarım arazilerinin oranı bölgeler arasında büyük farklılıklar göstermekte olup, bu durum coğrafi ve iklimsel koşulların yanı sıra ekonomik faktörlerle de ilişkilidir.
Korelasyon analizleri ve basit regresyon sonuçları, elektriğe erişim ile kalkınma göstergeleri arasında pozitif ilişkiler olduğunu, tarımsal sulamanın ise tarımsal istikrar ve üretimle ilişkili olabileceğini göstermektedir. Ancak bu sonuçlar, verilerin toplulaştırılmış yapısı nedeniyle dikkatli yorumlanmalıdır.
Elde edilen bulgular, Dünya Bankası göstergelerinin kalkınma süreçlerinin analizinde güçlü bir araç sunduğunu ortaya koymaktadır. Elektriğe erişim, ekonomik ve sosyal göstergelerle sıklıkla birlikte hareket eden temel bir değişken olarak öne çıkmaktadır.
İklim politikaları ve tarımsal sulama ise ülkelerin kurumsal yapısına ve doğal koşullarına bağlı olarak farklı etkiler yaratmaktadır. Bu durum, kalkınma politikalarının ülkelere özgü koşullar dikkate alınarak tasarlanması gerektiğini göstermektedir.
Çalışmanın temel sınırlılıkları arasında, bazı ülkeler için veri eksiklikleri ve basit analiz yöntemleriyle güçlü nedensel çıkarımlar yapılamaması yer almaktadır.
library(WDI)
# Ham veri (SADECE BİR KEZ)
df <- WDI(
country = "all",
indicator = c(
"EG.ELC.ACCS.ZS",
"EN.CLC.MDAT.ZS",
"AG.LND.IRIG.AG.ZS"
)
)
WDI(…)
WDI() fonksiyonu, Dünya Bankası’nın World Development Indicators (WDI) veri tabanından ekonomik, sosyal, çevresel vb. göstergeleri çeker.
Fonksiyon bir data frame döndürür ve istediğimiz verileri tablolar halinde sunar.
country = “all”
Bu argüman, tüm ülkeler için veri çekmek istediğimizi belirtir.
Tek bir ülke için kod da kullanılabilir (ör. “TR” → Türkiye, “US” → ABD).
indicator = c(…)
Bu kısım, çekmek istediğimiz göstergeleri belirtir. Kullanılan WDI kodları şunlardır:
“EG.ELC.ACCS.ZS” → Elektriğe erişim (% nüfus) Nüfusun elektriğe erişim oranını gösterir.
“EN.CLC.MDAT.ZS” → Gelişmiş sanitasyon hizmeti kullanan nüfus (% nüfus) Gelişmiş sanitasyon (tuvalet) hizmetine erişen nüfus oranını gösterir.
“AG.LND.IRIG.AG.ZS” → Sulanan tarım arazisi oranı (% tarım arazisi) Tarım arazilerinin kaçının sulandığını gösterir.
<- df
WDI() fonksiyonundan dönen sonuç, df adında bir data frame içine kaydedilir.
df genellikle şu sütunları içerir:
country → ülke adı
iso2c → 2 harfli ISO kodu
year → veri yılı
İstenen göstergelerin sütunları (EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS)
Bu kod, tüm ülkeler için üç göstergenin (elektrik
erişimi, gelişmiş sanitasyon, sulanan tarım arazisi) verilerini çekip
df adlı bir tabloya kaydeder.
# Vérification rapide de la structure
str(df)
## 'data.frame': 17290 obs. of 7 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
## $ EG.ELC.ACCS.ZS : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Access to electricity (% of population)"
## $ EN.CLC.MDAT.ZS : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Droughts, floods, extreme temperatures (% of population, average 1990-2009)"
## $ AG.LND.IRIG.AG.ZS: num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Agricultural irrigated land (% of total agricultural land)"
# Nombre de pays restants
length(unique(df$country))
## [1] 266
str() fonksiyonu, bir R objesinin yapısını hızlıca gösterir.
df bir data frame olduğundan, bu komut:
Sütun adlarını ve türlerini (numeric, character, factor vb.) gösterir
Kaç satır ve sütun olduğunu gösterir
Her sütundaki ilk birkaç değeri özetler
Bu, veri çekerken hangi türde verilerle çalıştığını hızlıca anlamak için kullanılır.
df$country → df tablosundaki
ülke isimleri sütunu.
unique(df$country) → bu sütundaki benzersiz
(tekrarsız) ülke isimlerini alır.
length(...) → benzersiz ülke sayısını
verir.
i bu satır, df tablosunda kaç farklı ülke olduğunu
hesaplar.
Özet:
str(df) → veri çerçevesinin yapısını hızlıca kontrol
eder
length(unique(df$country)) → tabloda kaç farklı ülke
olduğunu verir.
library(ggplot2)
library() fonksiyonu, R’de bir paketi
yüklemek için kullanılır.
"ggplot2" paketi, veri
görselleştirme için en yaygın kullanılan paketlerden
biridir.
Bu paket, grafikler ve görselleştirmeler oluşturmayı kolaylaştırır (çizgi grafikleri, çubuk grafikleri, dağılım grafikleri vb.)
ggplot2’yi yüklemeden, ggplot() ve
ilgili fonksiyonları kullanamazsınız.
library(ggplot2) → ggplot2 paketini aktif hale
getirir ve bu paketle veri görselleştirmeleri oluşturmanızı
sağlar.
head(df)
## country iso2c iso3c year EG.ELC.ACCS.ZS EN.CLC.MDAT.ZS AG.LND.IRIG.AG.ZS
## 1 Afghanistan AF AFG 1960 NA NA NA
## 2 Afghanistan AF AFG 1961 NA NA NA
## 3 Afghanistan AF AFG 1962 NA NA NA
## 4 Afghanistan AF AFG 1963 NA NA NA
## 5 Afghanistan AF AFG 1964 NA NA NA
## 6 Afghanistan AF AFG 1965 NA NA NA
head() fonksiyonu, bir data frame veya
vektörün ilk birkaç satırını gösterir.
Varsayılan olarak ilk 6 satırı getirir.
Burada df tablosunun ilk 6 satırını hızlıca
görmek için kullanılıyor.
Bu, veri setini kontrol etmek, sütun adlarını ve değerleri hızlıca gözden geçirmek için sık kullanılan bir yöntemdir.
head(df) → df tablosunun ilk 6
satırını ekranda gösterir.
tidyr::smiths
## # A tibble: 2 × 5
## subject time age weight height
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 John Smith 1 33 90 1.87
## 2 Mary Smith 1 NA NA 1.54
reshape2::smiths
## subject time age weight height
## 1 John Smith 1 33 90 1.87
## 2 Mary Smith 1 NA NA 1.54
ekstra = WDI_data$country
# WDI ülke bilgilerini al
WDI_extra <- as.data.frame(WDI_data$country)
# Veri çerçevesindeki tüm sütun isimlerini göster
names(df)
## [1] "country" "iso2c" "iso3c"
## [4] "year" "EG.ELC.ACCS.ZS" "EN.CLC.MDAT.ZS"
## [7] "AG.LND.IRIG.AG.ZS"
summary(df$AG.LND.IRIG.AG.ZS)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 1.222 5.826 11.070 14.801 89.041 16062
summary(df$EN.CLC.MDAT.ZS)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0000 0.0202 0.2537 1.1699 1.2655 9.2266 17122
library(reshape2)
library(tidyr) # 'smiths' de tidyr sera utilisé par défaut
##
## Attachement du package : 'tidyr'
## L'objet suivant est masqué depuis 'package:reshape2':
##
## smiths
library(reshape2)reshape2 paketi, veri çerçevelerini yeniden
şekillendirmek (reshape) için kullanılır.
Özellikle:
- `melt()` → geniş formattaki veriyi uzun formata çevirir
- `dcast()` → uzun formattaki veriyi tekrar geniş formata çevirir
### `library(tidyr)`
- `tidyr` paketi, veri setlerini **temiz ve düzenli (tidy) hale getirmek** için kullanılır.
- Fonksiyonları arasında:
- `pivot_longer()` → geniş formatı uzun formata çevirir
- `pivot_wider()` → uzun formatı geniş formata çevirir
- `separate()` ve `unite()` → sütunları bölme veya birleştirme
- Yorum satırında belirtildiği gibi, `'smiths'` veri setinde **tidyr varsayılan olarak kullanılacak**.
✅*Özet:**
1. `reshape2` → veriyi **uzun/geniş form arasında dönüştürmek** için.
2. `tidyr` → veriyi **temiz ve düzenli (tidy) hale getirmek** için.
WDIsearch("electricity")
## indicator
## 25 1.1_ACCESS.ELECTRICITY.TOT
## 40 1.2_ACCESS.ELECTRICITY.RURAL
## 41 1.3_ACCESS.ELECTRICITY.URBAN
## 77 110400
## 113 2.0.cov.Ele
## 138 2.0.hoi.Ele
## 222 4.1.1_TOTAL.ELECTRICITY.OUTPUT
## 223 4.1.2_REN.ELECTRICITY.OUTPUT
## 236 4.1_SHARE.RE.IN.ELECTRICITY
## 972 9060000
## 2716 CC.CO2.EMSE.EH
## 2825 CC.ELEC.CON
## 2826 CC.ELEC.GEN
## 2875 CC.ESG.EUFE
## 2876 CC.ESG.EUMA
## 2924 CC.GHG.EMSE.EH
## 2946 CC.GHG.SDEG.EH
## 6856 EG.ELC.ACCS.RU.ZS
## 6857 EG.ELC.ACCS.UR.ZS
## 6858 EG.ELC.ACCS.ZS
## 6859 EG.ELC.COAL.KH
## 6860 EG.ELC.COAL.ZS
## 6861 EG.ELC.FOSL.ZS
## 6862 EG.ELC.HYRO.KH
## 6863 EG.ELC.HYRO.ZS
## 6866 EG.ELC.NGAS.KH
## 6867 EG.ELC.NGAS.ZS
## 6868 EG.ELC.NUCL.KH
## 6869 EG.ELC.NUCL.ZS
## 6870 EG.ELC.PETR.KH
## 6871 EG.ELC.PETR.ZS
## 6872 EG.ELC.PROD.KH
## 6873 EG.ELC.RNEW.KH
## 6874 EG.ELC.RNEW.ZS
## 6875 EG.ELC.RNWX.KH
## 6876 EG.ELC.RNWX.ZS
## 6896 elc_al_alot_dfcl_1529
## 6897 elc_al_alot_dfcl_3044
## 6898 elc_al_alot_dfcl_4564
## 6899 elc_al_alot_dfcl_65up
## 6900 elc_al_alot_dfcl_all
## 6901 elc_al_alot_dfcl_fem
## 6902 elc_al_alot_dfcl_male
## 6903 elc_al_alot_dfcl_rur
## 6904 elc_al_alot_dfcl_urb
## 6905 elc_any_dfcl_1529
## 6906 elc_any_dfcl_3044
## 6907 elc_any_dfcl_4564
## 6908 elc_any_dfcl_65up
## 6909 elc_any_dfcl_all
## 6910 elc_any_dfcl_cogn_all
## 6911 elc_any_dfcl_comm_all
## 6912 elc_any_dfcl_fem
## 6913 elc_any_dfcl_hearing_all
## 6914 elc_any_dfcl_male
## 6915 elc_any_dfcl_mobile_all
## 6916 elc_any_dfcl_rur
## 6917 elc_any_dfcl_seeing_all
## 6918 elc_any_dfcl_selfcare_all
## 6919 elc_any_dfcl_urb
## 6920 elc_none_dfcl_1529
## 6921 elc_none_dfcl_3044
## 6922 elc_none_dfcl_4564
## 6923 elc_none_dfcl_65up
## 6924 elc_none_dfcl_all
## 6925 elc_none_dfcl_fem
## 6926 elc_none_dfcl_male
## 6927 elc_none_dfcl_rur
## 6928 elc_none_dfcl_urb
## 6929 elc_nosome_dfcl_1529
## 6930 elc_nosome_dfcl_3044
## 6931 elc_nosome_dfcl_4564
## 6932 elc_nosome_dfcl_65up
## 6933 elc_nosome_dfcl_all
## 6934 elc_nosome_dfcl_fem
## 6935 elc_nosome_dfcl_male
## 6936 elc_nosome_dfcl_rur
## 6937 elc_nosome_dfcl_urb
## 6938 elc_some_dfcl_1529
## 6939 elc_some_dfcl_3044
## 6940 elc_some_dfcl_4564
## 6941 elc_some_dfcl_65up
## 6942 elc_some_dfcl_all
## 6943 elc_some_dfcl_fem
## 6944 elc_some_dfcl_male
## 6945 elc_some_dfcl_rur
## 6946 elc_some_dfcl_urb
## 7066 EN.CO2.ETOT.MT
## 7067 EN.CO2.ETOT.ZS
## 7140 EN.PRD.ELEC
## 7141 EN.PRD.ELEC.POP.ZS
## 10150 HOU.ELC.ACSN.ZS
## 10288 IC.CNS.ELEC.ZS
## 10349 IC.ELC.ACES.DFRN.DB1015
## 10350 IC.ELC.ACES.DFRN.DB1619
## 10351 IC.ELC.ACES.RK.DB19
## 10352 IC.ELC.ACS.COST
## 10353 IC.ELC.ACS.COST.DFRN
## 10354 IC.ELC.COMM.TRFF.CG.01.DB1619
## 10356 IC.ELC.GEN.ZS
## 10358 IC.ELC.LMTG.OUTG.01.DB1619
## 10359 IC.ELC.MONT.OUTG.01.DB1619
## 10362 IC.ELC.OUTG.FREQ.DURS.03.DB1619
## 10364 IC.ELC.OUTG.MN.DB1619
## 10366 IC.ELC.PRI.KH.DB1619
## 10367 IC.ELC.PROC.NO
## 10368 IC.ELC.PROC.NO.DFRN
## 10369 IC.ELC.REGU.MONT.01.DB1619
## 10370 IC.ELC.RSTOR.01.DB1619
## 10371 IC.ELC.RSTT.XD.08.DB1619
## 10372 IC.ELC.RSTT.XD.08.DFRN.DB1619
## 10373 IC.ELC.SAID.XD.DB1619
## 10374 IC.ELC.SAIF.XD.DB1619
## 10375 IC.ELC.TIME
## 10376 IC.ELC.TIME.DFRN
## 10377 IC.ELEC.COST.PC.ZS
## 10378 IC.ELEC.PROC
## 10379 IC.ELEC.TIME
## 10380 IC.ELEC.XQ
## 10425 IC.FRM.ELEC.ZS
## 10470 IC.FRM.INFRA.IN10_C
## 10472 IC.FRM.INFRA.IN12
## 10511 IC.FRM.OBS.OBST8
## 10777 IN.ENRGY.ELEC.GEN
## 13175 NA.GDP.ELEC.GAS.SNA08.CR
## 13176 NA.GDP.ELEC.GAS.SNA08.KR
## 13491 NV.IND.GELW.CD
## 13492 NV.IND.GELW.CN
## 13493 NV.IND.GELW.KN
## 20616 SG.COK.ELEC.ZS
## 21794 SL.EMP.ELC
## name
## 25 Access to electricity (% of total population)
## 40 Access to electricity (% of rural population)
## 41 Access to electricity (% of urban population)
## 77 110400:HOUSING, WATER, ELECTRICITY, GAS, AND OTHER FUELS
## 113 Coverage: Electricity
## 138 HOI: Electricity
## 222 Total electricity output (GWh)
## 223 Renewable energy electricity output (GWh)
## 236 Renewable electricity (% in total electricity output)
## 972 9060000:ACTUAL HOUSING, WATER, ELECTRICITY, GAS AND OTHER FUELS
## 2716 CO2 emissions by sector (Mt CO2 eq) - Electricity/Heat
## 2825 Electricity net consumption
## 2826 Electricity net generation
## 2875 Employment by sector and gender (% of total) - Electricity and utilities - Female
## 2876 Employment by sector and gender (% of total) - Electricity and utilities - Male
## 2924 Total GHG emissions by sector (Mt CO2 eq) - Electricity/Heat
## 2946 Sectoral drivers of GHG emissions growth in the period 2012-2018 - Electricity/Heat (contribution to total growth, %)
## 6856 Access to electricity, rural (% of rural population)
## 6857 Access to electricity, urban (% of urban population)
## 6858 Access to electricity (% of population)
## 6859 Electricity production from coal sources (kWh)
## 6860 Electricity production from coal sources (% of total)
## 6861 Electricity production from oil, gas and coal sources (% of total)
## 6862 Electricity production from hydroelectric sources (kWh)
## 6863 Electricity production from hydroelectric sources (% of total)
## 6866 Electricity production from natural gas sources (kWh)
## 6867 Electricity production from natural gas sources (% of total)
## 6868 Electricity production from nuclear sources (kWh)
## 6869 Electricity production from nuclear sources (% of total)
## 6870 Electricity production from oil sources (kWh)
## 6871 Electricity production from oil sources (% of total)
## 6872 Electricity production (kWh)
## 6873 Electricity production from renewable sources (kWh)
## 6874 Renewable electricity output (% of total electricity output)
## 6875 Electricity production from renewable sources, excluding hydroelectric (kWh)
## 6876 Electricity production from renewable sources, excluding hydroelectric (% of total)
## 6896 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with severe disability)
## 6897 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with severe disability)
## 6898 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with severe disability)
## 6899 Adults aged 65 or older with electricity (% of adults aged 65 or older with severe disability)
## 6900 Adults with electricity (% of adults with severe disability)
## 6901 Female adults with electricity (% of female adults with severe disability)
## 6902 Male adults with electricity (% of male adults with severe disability)
## 6903 Adults living in rural areas with electricity (% of adults living in rural areas with severe disability)
## 6904 Adults living in urban areas with electricity (% of adults living in urban areas with severe disability)
## 6905 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with any disability)
## 6906 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with any disability)
## 6907 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with any disability)
## 6908 Adults aged 65 or older with electricity (% of adults aged 65 or older with any disability)
## 6909 Adults with electricity (% of adults with any disability)
## 6910 Adults with electricity (% of adults with cognition disability)
## 6911 Adults with electricity (% of adults with communicating disability)
## 6912 Female adults with electricity (% of female adults with any disability)
## 6913 Adults with electricity (% of adults with hearing disability)
## 6914 Male adults with electricity (% of male adults with any disability)
## 6915 Adults with electricity (% of adults with mobile disability)
## 6916 Adults living in rural areas with electricity (% of adults living in rural areas with any disability)
## 6917 Adults with electricity (% of adults with seeing disability)
## 6918 Adults with electricity (% of adults with selfcare disability)
## 6919 Adults living in urban areas with electricity (% of adults living in urban areas with any disability)
## 6920 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with no disability)
## 6921 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with no disability)
## 6922 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with no disability)
## 6923 Adults aged 65 or older with electricity (% of adults aged 65 or older with no disability)
## 6924 Adults with electricity (% of adults with no disability)
## 6925 Female adults with electricity (% of female adults with no disability)
## 6926 Male adults with electricity (% of male adults with no disability)
## 6927 Adults living in rural areas with electricity (% of adults living in rural areas with no disability)
## 6928 Adults living in urban areas with electricity (% of adults living in urban areas with no disability)
## 6929 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with none or moderate disability)
## 6930 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with none or moderate disability)
## 6931 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with none or moderate disability)
## 6932 Adults aged 65 or older with electricity (% of adults aged 65 or older with none or moderate disability)
## 6933 Adults with electricity (% of adults with none or moderate disability)
## 6934 Female adults with electricity (% of female adults with none or moderate disability)
## 6935 Male adults with electricity (% of male adults with none or moderate disability)
## 6936 Adults living in rural areas with electricity (% of adults living in rural areas with none or moderate disability)
## 6937 Adults living in urban areas with electricity (% of adults living in urban areas with none or moderate disability)
## 6938 Adults aged 15 to 29 years with electricity (% of adults aged 15 to 29 years with moderate disability)
## 6939 Adults aged 30 to 44 years with electricity (% of adults aged 30 to 44 years with moderate disability)
## 6940 Adults aged 45 to 64 years with electricity (% of adults aged 45 to 64 years with moderate disability)
## 6941 Adults aged 65 or older with electricity (% of adults aged 65 or older with moderate disability)
## 6942 Adults with electricity (% of adults with moderate disability)
## 6943 Female adults with electricity (% of female adults with moderate disability)
## 6944 Male adults with electricity (% of male adults with moderate disability)
## 6945 Adults living in rural areas with electricity (% of adults living in rural areas with moderate disability)
## 6946 Adults living in urban areas with electricity (% of adults living in urban areas with moderate disability)
## 7066 CO2 emissions from electricity and heat production, total (million metric tons)
## 7067 CO2 emissions from electricity and heat production, total (% of total fuel combustion)
## 7140 Electricity production (million kwh)
## 7141 Electricity production (kwh per capita)
## 10150 Household Access to Electricity: Total (in % of total household)
## 10288 Electricity (% of managers surveyed ranking this as a major constraint)
## 10349 Getting electricity (DB10-15 methodology) - Score
## 10350 Getting electricity (DB16-20 methodology) - Score
## 10351 Rank: Getting electricity (1=most business-friendly regulations)
## 10352 Getting electricity: Cost to get electricity (% of income per capita)
## 10353 Getting electricity: Cost to get electricity (% of income per capita) - Score
## 10354 Getting electricity: Communication of tariffs and tariff changes (0-1) (DB16-20 methodology)
## 10356 Electricity from Generator (%)
## 10358 Getting electricity: Financial deterrents aimed at limiting outages (0-1) (DB16-20 methodology)
## 10359 Getting electricity: Mechanisms for monitoring outages (0-1) (DB16-20 methodology)
## 10362 Getting electricity: Total duration and frequency of outages per customer a year (0-3) (DB16-20 methodology)
## 10364 Getting electricity: Minimum outage time (in minutes) (DB16-20 methodology)
## 10366 Getting electricity: Price of electricity (US cents per kWh) (DB16-20 methodology)
## 10367 Getting electricity: Procedures (number)
## 10368 Getting electricity: Procedures (number) - Score
## 10369 Getting electricity: Regulatory monitoring (0-1) (DB16-20 methodology)
## 10370 Getting electricity: Mechanisms for restoring service (0-1) (DB16-20 methodology)
## 10371 Getting electricity: Reliability of supply and transparency of tariff index (0-8) (DB16-20 methodology)
## 10372 Getting electricity: Reliability of supply and transparency of tariff index (0-8) (DB16-20 methodology) - Score
## 10373 Getting electricity: System average interruption duration index (SAIDI) (DB16-20 methodology)
## 10374 Getting electricity: System average interruption frequency index (SAIFI) (DB16-20 methodology)
## 10375 Time required to get electricity (days)
## 10376 Getting electricity: Time (days) - Score
## 10377 Cost to get electricity connection (% of income per capita)
## 10378 Procedures required to get electricity (number)
## 10379 Time required to get electricity (days)
## 10380 Getting electricity (rank)
## 10425 Electricity (% of firms identifying this as a major constraint)
## 10470 If a generator is used, average proportion of electricity from a generator (%)
## 10472 Percent of firms identifying electricity as a major constraint
## 10511 Percent of firms choosing electricity as their biggest obstacle
## 10777 Total-Electricity Generated Gross (GWh)
## 13175 GDP on Electricity & Gas Supply Sector (in IDR Million), SNA 2008, Current Price
## 13176 GDP on Electricity & Gas Supply Sector (in IDR Million), SNA 2008, Constant Price
## 13491 Electricity, gas and water supply, value added (current US$)
## 13492 Electricity, gas and water supply, value added (current LCU)
## 13493 Electricity, gas and water supply, value added (constant LCU)
## 20616 Main cooking fuel: electricity (% of households)
## 21794 Number of people employed in electricity and utilities sector
WDIsearch("electricity") fonksiyonu senin
verin bağlamında:
Dünya Bankası WDI veri tabanında "electricity"
kelimesi geçen tüm göstergeleri listeler.
Senin verinde elektrik göstergesi olarak sadece
EG.ELC.ACCS.ZS var (elektriğe erişim %
nüfus).
Fonksiyon, ayrıca başka elektrik göstergeleri de gösterebilir,
ama senin analizinde sadece EG.ELC.ACCS.ZS
kullanılır.
Özet:
WDIsearch("electricity") → Elektrik ile ilgili mevcut
göstergeleri gösterir; senin verin için gerekli olan tek gösterge
EG.ELC.ACCS.ZS’dir.
- `EG.ELC.ACCS.ZS` → Elektriğe erişim (% nüfus)
- `EG.ELC.RNEW.ZS` → Yenilenebilir enerji ile elektrik üretim oranı
Özet:
WDIsearch("electricity") → "electricity"
kelimesi ile ilgili tüm WDI göstergelerini arar ve
listeler.
str(df$year) # year sütununun türünü gösterir
## int [1:17290] 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
unique(df$year) # year sütunundaki değerleri kontrol et
## [1] 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974
## [16] 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
## [31] 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
## [46] 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
## [61] 2020 2021 2022 2023 2024
unique(df$country)
## [1] "Afghanistan"
## [2] "Africa Eastern and Southern"
## [3] "Africa Western and Central"
## [4] "Albania"
## [5] "Algeria"
## [6] "American Samoa"
## [7] "Andorra"
## [8] "Angola"
## [9] "Antigua and Barbuda"
## [10] "Arab World"
## [11] "Argentina"
## [12] "Armenia"
## [13] "Aruba"
## [14] "Australia"
## [15] "Austria"
## [16] "Azerbaijan"
## [17] "Bahamas, The"
## [18] "Bahrain"
## [19] "Bangladesh"
## [20] "Barbados"
## [21] "Belarus"
## [22] "Belgium"
## [23] "Belize"
## [24] "Benin"
## [25] "Bermuda"
## [26] "Bhutan"
## [27] "Bolivia"
## [28] "Bosnia and Herzegovina"
## [29] "Botswana"
## [30] "Brazil"
## [31] "British Virgin Islands"
## [32] "Brunei Darussalam"
## [33] "Bulgaria"
## [34] "Burkina Faso"
## [35] "Burundi"
## [36] "Cabo Verde"
## [37] "Cambodia"
## [38] "Cameroon"
## [39] "Canada"
## [40] "Caribbean small states"
## [41] "Cayman Islands"
## [42] "Central African Republic"
## [43] "Central Europe and the Baltics"
## [44] "Chad"
## [45] "Channel Islands"
## [46] "Chile"
## [47] "China"
## [48] "Colombia"
## [49] "Comoros"
## [50] "Congo, Dem. Rep."
## [51] "Congo, Rep."
## [52] "Costa Rica"
## [53] "Cote d'Ivoire"
## [54] "Croatia"
## [55] "Cuba"
## [56] "Curacao"
## [57] "Cyprus"
## [58] "Czechia"
## [59] "Denmark"
## [60] "Djibouti"
## [61] "Dominica"
## [62] "Dominican Republic"
## [63] "Early-demographic dividend"
## [64] "East Asia & Pacific (excluding high income)"
## [65] "East Asia & Pacific (IDA & IBRD countries)"
## [66] "East Asia & Pacific"
## [67] "Ecuador"
## [68] "Egypt, Arab Rep."
## [69] "El Salvador"
## [70] "Equatorial Guinea"
## [71] "Eritrea"
## [72] "Estonia"
## [73] "Eswatini"
## [74] "Ethiopia"
## [75] "Euro area"
## [76] "Europe & Central Asia (excluding high income)"
## [77] "Europe & Central Asia (IDA & IBRD countries)"
## [78] "Europe & Central Asia"
## [79] "European Union"
## [80] "Faroe Islands"
## [81] "Fiji"
## [82] "Finland"
## [83] "Fragile and conflict affected situations"
## [84] "France"
## [85] "French Polynesia"
## [86] "Gabon"
## [87] "Gambia, The"
## [88] "Georgia"
## [89] "Germany"
## [90] "Ghana"
## [91] "Gibraltar"
## [92] "Greece"
## [93] "Greenland"
## [94] "Grenada"
## [95] "Guam"
## [96] "Guatemala"
## [97] "Guinea-Bissau"
## [98] "Guinea"
## [99] "Guyana"
## [100] "Haiti"
## [101] "Heavily indebted poor countries (HIPC)"
## [102] "High income"
## [103] "Honduras"
## [104] "Hong Kong SAR, China"
## [105] "Hungary"
## [106] "IBRD only"
## [107] "Iceland"
## [108] "IDA & IBRD total"
## [109] "IDA blend"
## [110] "IDA only"
## [111] "IDA total"
## [112] "India"
## [113] "Indonesia"
## [114] "Iran, Islamic Rep."
## [115] "Iraq"
## [116] "Ireland"
## [117] "Isle of Man"
## [118] "Israel"
## [119] "Italy"
## [120] "Jamaica"
## [121] "Japan"
## [122] "Jordan"
## [123] "Kazakhstan"
## [124] "Kenya"
## [125] "Kiribati"
## [126] "Korea, Dem. People's Rep."
## [127] "Korea, Rep."
## [128] "Kosovo"
## [129] "Kuwait"
## [130] "Kyrgyz Republic"
## [131] "Lao PDR"
## [132] "Late-demographic dividend"
## [133] "Latin America & Caribbean (excluding high income)"
## [134] "Latin America & Caribbean"
## [135] "Latin America & the Caribbean (IDA & IBRD countries)"
## [136] "Latvia"
## [137] "Least developed countries: UN classification"
## [138] "Lebanon"
## [139] "Lesotho"
## [140] "Liberia"
## [141] "Libya"
## [142] "Liechtenstein"
## [143] "Lithuania"
## [144] "Low & middle income"
## [145] "Low income"
## [146] "Lower middle income"
## [147] "Luxembourg"
## [148] "Macao SAR, China"
## [149] "Madagascar"
## [150] "Malawi"
## [151] "Malaysia"
## [152] "Maldives"
## [153] "Mali"
## [154] "Malta"
## [155] "Marshall Islands"
## [156] "Mauritania"
## [157] "Mauritius"
## [158] "Mexico"
## [159] "Micronesia, Fed. Sts."
## [160] "Middle East, North Africa, Afghanistan & Pakistan (excluding high income)"
## [161] "Middle East, North Africa, Afghanistan & Pakistan (IDA & IBRD)"
## [162] "Middle East, North Africa, Afghanistan & Pakistan"
## [163] "Middle income"
## [164] "Moldova"
## [165] "Monaco"
## [166] "Mongolia"
## [167] "Montenegro"
## [168] "Morocco"
## [169] "Mozambique"
## [170] "Myanmar"
## [171] "Namibia"
## [172] "Nauru"
## [173] "Nepal"
## [174] "Netherlands"
## [175] "New Caledonia"
## [176] "New Zealand"
## [177] "Nicaragua"
## [178] "Niger"
## [179] "Nigeria"
## [180] "North America"
## [181] "North Macedonia"
## [182] "Northern Mariana Islands"
## [183] "Norway"
## [184] "Not classified"
## [185] "OECD members"
## [186] "Oman"
## [187] "Other small states"
## [188] "Pacific island small states"
## [189] "Pakistan"
## [190] "Palau"
## [191] "Panama"
## [192] "Papua New Guinea"
## [193] "Paraguay"
## [194] "Peru"
## [195] "Philippines"
## [196] "Poland"
## [197] "Portugal"
## [198] "Post-demographic dividend"
## [199] "Pre-demographic dividend"
## [200] "Puerto Rico (US)"
## [201] "Qatar"
## [202] "Romania"
## [203] "Russian Federation"
## [204] "Rwanda"
## [205] "Samoa"
## [206] "San Marino"
## [207] "Sao Tome and Principe"
## [208] "Saudi Arabia"
## [209] "Senegal"
## [210] "Serbia"
## [211] "Seychelles"
## [212] "Sierra Leone"
## [213] "Singapore"
## [214] "Sint Maarten (Dutch part)"
## [215] "Slovak Republic"
## [216] "Slovenia"
## [217] "Small states"
## [218] "Solomon Islands"
## [219] "Somalia, Fed. Rep."
## [220] "South Africa"
## [221] "South Asia (IDA & IBRD)"
## [222] "South Asia"
## [223] "South Sudan"
## [224] "Spain"
## [225] "Sri Lanka"
## [226] "St. Kitts and Nevis"
## [227] "St. Lucia"
## [228] "St. Martin (French part)"
## [229] "St. Vincent and the Grenadines"
## [230] "Sub-Saharan Africa (excluding high income)"
## [231] "Sub-Saharan Africa (IDA & IBRD countries)"
## [232] "Sub-Saharan Africa"
## [233] "Sudan"
## [234] "Suriname"
## [235] "Sweden"
## [236] "Switzerland"
## [237] "Syrian Arab Republic"
## [238] "Tajikistan"
## [239] "Tanzania"
## [240] "Thailand"
## [241] "Timor-Leste"
## [242] "Togo"
## [243] "Tonga"
## [244] "Trinidad and Tobago"
## [245] "Tunisia"
## [246] "Turkiye"
## [247] "Turkmenistan"
## [248] "Turks and Caicos Islands"
## [249] "Tuvalu"
## [250] "Uganda"
## [251] "Ukraine"
## [252] "United Arab Emirates"
## [253] "United Kingdom"
## [254] "United States"
## [255] "Upper middle income"
## [256] "Uruguay"
## [257] "Uzbekistan"
## [258] "Vanuatu"
## [259] "Venezuela, RB"
## [260] "Viet Nam"
## [261] "Virgin Islands (U.S.)"
## [262] "West Bank and Gaza"
## [263] "World"
## [264] "Yemen, Rep."
## [265] "Zambia"
## [266] "Zimbabwe"
str(df)
## 'data.frame': 17290 obs. of 7 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ...
## $ EG.ELC.ACCS.ZS : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Access to electricity (% of population)"
## $ EN.CLC.MDAT.ZS : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Droughts, floods, extreme temperatures (% of population, average 1990-2009)"
## $ AG.LND.IRIG.AG.ZS: num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Agricultural irrigated land (% of total agricultural land)"
dplyr ve tidyr gibi paketler kullanılarak R ortamında veri manipülasyonu yapılmakta ve verinin analiz için uygun, düzenli bir yapıya kavuşturulması sağlanmaktadır.
# Install required packages (uncomment and run if needed)
# install.packages("dplyr")
# install.packages("tidyr") # If not installed previously
library(dplyr)
##
## Attachement du package : 'dplyr'
## Les objets suivants sont masqués depuis 'package:stats':
##
## filter, lag
## Les objets suivants sont masqués depuis 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyr)
Bu çalışmada ayrıca explore paketi de kullanılacaktır. R programlama dilindeki explore paketi, veri keşfi ve analizini kolaylaştırmak amacıyla geliştirilmiş bir araç setidir. Bu paket, veri setinin daha kapsamlı bir şekilde incelenmesini sağlayan çeşitli fonksiyonlar sunmakta ve özellikle analiz sürecinin başlangıç aşamasında betimleyici istatistiklerin elde edilmesine yardımcı olmaktadır.
Öğrenciler için not: Gerekli paketler daha önce yüklenmemişse install.packages() fonksiyonu kullanılarak kurulmalıdır. Bu derste, paketlerin daha önce yüklü olduğu varsayıldığından install.packages() fonksiyonu tekrar kullanılmayacaktır.
explore paketinin bir parçası olan describe_all() fonksiyonu, bir veri setindeki tüm değişkenler için aynı anda betimleyici istatistikler üretmek amacıyla kullanılır. Bu fonksiyon; ortalama, medyan, standart sapma, minimum ve maksimum değerler ile çeyrek değerleri (quartiles) hesaplayarak her bir değişken için özet bilgiler sunar.
R’de sıklıkla magrittr paketiyle ilişkilendirilen boru (pipe) operatörü %>%, birden fazla işlemin ardışık olarak zincirlenmesine olanak tanır. Bu operatör, bir fonksiyonun çıktısını bir sonraki fonksiyonun girdisi olarak kullanarak kodun okunabilirliğini ve verimliliğini artırır.
df %>% describe_all() ifadesinde %>% operatörü, df veri setini doğrudan describe_all() fonksiyonuna aktarır ve böylece veri setindeki tüm değişkenler için kapsamlı betimleyici istatistikler elde edilmesini sağlar.
library(dplyr)
mtcars %>%
filter(mpg > 20)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
## Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
## Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
## Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
## Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2
## Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
## Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
## Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1
## Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2
## Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
## Volvo 142E 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
library(dplyr)
# Load the "explore" package
library(explore)
# Describe all columns in the dataset using describe_all() function
df %>% describe_all()
## # A tibble: 7 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 65 1960 1992 2024
## 5 EG.ELC.ACCS.ZS dbl 9431 54.5 2553 0.53 81.2 100
## 6 EN.CLC.MDAT.ZS dbl 17122 99 160 0 1.17 9.23
## 7 AG.LND.IRIG.AG.ZS dbl 16062 92.9 1173 0 11.1 89.0
## # A tibble: 6 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 63 1960 1.99e 3 2.02e 3
## 5 EG.ELC.ACCS.ZS dbl 3393 20.2 13243 8824746. 1.21e12 1.01e14
## 6 AG.LND.IRIG.AG.ZS dbl 93 0.6 16460 2646 2.16e 8 7.95e 9
df %>% describe_all() komutunun çalıştırılması, explore paketine ait describe_all() fonksiyonunun df veri seti üzerinde uygulanmasını sağlar. Bu işlem, veri setindeki her bir değişken için kapsamlı betimleyici istatistikler üreterek veri yapısı, değişken türleri, eksik gözlemler ve temel istatistiksel özellikler hakkında genel bir bakış sunar. Bu çıktı, daha ileri analizlere geçmeden önce veri setinin özelliklerini anlamak açısından önemlidir.
Veri seti, 1960–2022 dönemini kapsayacak şekilde 266 farklı ülkeye ait gözlemler içermektedir.
Mevcut değişkenler şu şekilde özetlenebilir:
country değişkeni karakter (metin) türündedir ve ülke adlarını temsil etmektedir.
iso2c ve iso3c değişkenleri de karakter türünde olup, ülkeler için kullanılan standart kodları ifade etmektedir.
year değişkeni tamsayı (integer) formatındadır ve 1960’tan 2022’ye kadar olan yılları kapsamaktadır.
EG.ELC.ACCS.ZS değişkeni sayısal (double) formatta olup, nüfusun elektriğe erişim oranını göstermektedir. Bu değişken için gözlemlerin yaklaşık %20,2’si eksiktir.
AG.LND.IRIG.AG.ZS değişkeni de sayısal (double) formatta olup, tarım arazilerinin sulama altyapısına sahip olan kısmını ifade etmektedir. Bu değişkende eksik gözlem oranı oldukça düşüktür ve yaklaşık %0,6 seviyesindedir.
Genel olarak veri seti, uzun bir zaman dilimi boyunca çok sayıda ülkeye ait önemli kalkınma göstergelerini içermektedir. Bazı değişkenlerde eksik gözlemler bulunmasına rağmen, veri seti küresel kalkınma eğilimlerini incelemek ve ekonometrik analizler yapmak için yeterince zengin bir yapı sunmaktadır.
# Extract unique countries in the dataset
countries <- unique(df$country)
R’de unique() fonksiyonu, bir vektör, veri çerçevesi (data frame) veya dizi (array) içindeki tekrarlanmayan (benzersiz) değerleri elde etmek için kullanılır.
knitr::kable(countries)
| x |
|---|
| Afghanistan |
| Africa Eastern and Southern |
| Africa Western and Central |
| Albania |
| Algeria |
| American Samoa |
| Andorra |
| Angola |
| Antigua and Barbuda |
| Arab World |
| Argentina |
| Armenia |
| Aruba |
| Australia |
| Austria |
| Azerbaijan |
| Bahamas, The |
| Bahrain |
| Bangladesh |
| Barbados |
| Belarus |
| Belgium |
| Belize |
| Benin |
| Bermuda |
| Bhutan |
| Bolivia |
| Bosnia and Herzegovina |
| Botswana |
| Brazil |
| British Virgin Islands |
| Brunei Darussalam |
| Bulgaria |
| Burkina Faso |
| Burundi |
| Cabo Verde |
| Cambodia |
| Cameroon |
| Canada |
| Caribbean small states |
| Cayman Islands |
| Central African Republic |
| Central Europe and the Baltics |
| Chad |
| Channel Islands |
| Chile |
| China |
| Colombia |
| Comoros |
| Congo, Dem. Rep. |
| Congo, Rep. |
| Costa Rica |
| Cote d’Ivoire |
| Croatia |
| Cuba |
| Curacao |
| Cyprus |
| Czechia |
| Denmark |
| Djibouti |
| Dominica |
| Dominican Republic |
| Early-demographic dividend |
| East Asia & Pacific (excluding high income) |
| East Asia & Pacific (IDA & IBRD countries) |
| East Asia & Pacific |
| Ecuador |
| Egypt, Arab Rep. |
| El Salvador |
| Equatorial Guinea |
| Eritrea |
| Estonia |
| Eswatini |
| Ethiopia |
| Euro area |
| Europe & Central Asia (excluding high income) |
| Europe & Central Asia (IDA & IBRD countries) |
| Europe & Central Asia |
| European Union |
| Faroe Islands |
| Fiji |
| Finland |
| Fragile and conflict affected situations |
| France |
| French Polynesia |
| Gabon |
| Gambia, The |
| Georgia |
| Germany |
| Ghana |
| Gibraltar |
| Greece |
| Greenland |
| Grenada |
| Guam |
| Guatemala |
| Guinea-Bissau |
| Guinea |
| Guyana |
| Haiti |
| Heavily indebted poor countries (HIPC) |
| High income |
| Honduras |
| Hong Kong SAR, China |
| Hungary |
| IBRD only |
| Iceland |
| IDA & IBRD total |
| IDA blend |
| IDA only |
| IDA total |
| India |
| Indonesia |
| Iran, Islamic Rep. |
| Iraq |
| Ireland |
| Isle of Man |
| Israel |
| Italy |
| Jamaica |
| Japan |
| Jordan |
| Kazakhstan |
| Kenya |
| Kiribati |
| Korea, Dem. People’s Rep. |
| Korea, Rep. |
| Kosovo |
| Kuwait |
| Kyrgyz Republic |
| Lao PDR |
| Late-demographic dividend |
| Latin America & Caribbean (excluding high income) |
| Latin America & Caribbean |
| Latin America & the Caribbean (IDA & IBRD countries) |
| Latvia |
| Least developed countries: UN classification |
| Lebanon |
| Lesotho |
| Liberia |
| Libya |
| Liechtenstein |
| Lithuania |
| Low & middle income |
| Low income |
| Lower middle income |
| Luxembourg |
| Macao SAR, China |
| Madagascar |
| Malawi |
| Malaysia |
| Maldives |
| Mali |
| Malta |
| Marshall Islands |
| Mauritania |
| Mauritius |
| Mexico |
| Micronesia, Fed. Sts. |
| Middle East, North Africa, Afghanistan & Pakistan (excluding high income) |
| Middle East, North Africa, Afghanistan & Pakistan (IDA & IBRD) |
| Middle East, North Africa, Afghanistan & Pakistan |
| Middle income |
| Moldova |
| Monaco |
| Mongolia |
| Montenegro |
| Morocco |
| Mozambique |
| Myanmar |
| Namibia |
| Nauru |
| Nepal |
| Netherlands |
| New Caledonia |
| New Zealand |
| Nicaragua |
| Niger |
| Nigeria |
| North America |
| North Macedonia |
| Northern Mariana Islands |
| Norway |
| Not classified |
| OECD members |
| Oman |
| Other small states |
| Pacific island small states |
| Pakistan |
| Palau |
| Panama |
| Papua New Guinea |
| Paraguay |
| Peru |
| Philippines |
| Poland |
| Portugal |
| Post-demographic dividend |
| Pre-demographic dividend |
| Puerto Rico (US) |
| Qatar |
| Romania |
| Russian Federation |
| Rwanda |
| Samoa |
| San Marino |
| Sao Tome and Principe |
| Saudi Arabia |
| Senegal |
| Serbia |
| Seychelles |
| Sierra Leone |
| Singapore |
| Sint Maarten (Dutch part) |
| Slovak Republic |
| Slovenia |
| Small states |
| Solomon Islands |
| Somalia, Fed. Rep. |
| South Africa |
| South Asia (IDA & IBRD) |
| South Asia |
| South Sudan |
| Spain |
| Sri Lanka |
| St. Kitts and Nevis |
| St. Lucia |
| St. Martin (French part) |
| St. Vincent and the Grenadines |
| Sub-Saharan Africa (excluding high income) |
| Sub-Saharan Africa (IDA & IBRD countries) |
| Sub-Saharan Africa |
| Sudan |
| Suriname |
| Sweden |
| Switzerland |
| Syrian Arab Republic |
| Tajikistan |
| Tanzania |
| Thailand |
| Timor-Leste |
| Togo |
| Tonga |
| Trinidad and Tobago |
| Tunisia |
| Turkiye |
| Turkmenistan |
| Turks and Caicos Islands |
| Tuvalu |
| Uganda |
| Ukraine |
| United Arab Emirates |
| United Kingdom |
| United States |
| Upper middle income |
| Uruguay |
| Uzbekistan |
| Vanuatu |
| Venezuela, RB |
| Viet Nam |
| Virgin Islands (U.S.) |
| West Bank and Gaza |
| World |
| Yemen, Rep. |
| Zambia |
| Zimbabwe |
Kullandığımız veri setinde, gerçek ülkeleri temsil etmeyen bazı gözlemler bulunmaktadır. Bunlar arasında Not classified, OECD members veya Other small states gibi tanımlayıcı ifadeler yer almaktadır. Analizin doğruluğunu sağlamak için, bu ülke dışı gözlemlerin veri setinden çıkarılması gerekmektedir.
WDI paketi, ek bilgiler sunmakta olup WDI_data$country adlı bir veri seti içermektedir. Bu veri seti, ülkeler hakkında daha ayrıntılı ve açıklayıcı bilgiler sağlamaktadır. Bu tamamlayıcı veri kullanılarak, mevcut veri setimiz ülke bilgileri açısından zenginleştirilebilir.
Kendi veri setimiz ile WDI_data$country veri setini birlikte kullanarak, ülke niteliği taşımayan gözlemleri tespit etmek ve bunları veri setinden çıkarmak mümkündür. Bu işlem sonucunda analiz, yalnızca gerçek ülkelere ait gözlemler üzerinden gerçekleştirilecek ve böylece daha doğru, güvenilir ve anlamlı sonuçlar elde edilecektir.
WDI_extra <- as.data.frame(WDI_data$country)
WDI_data$country → WDI_data veri
setindeki country sütununu alır.
as.data.frame() → bu sütunu data
frame formatına çevirir.
- Böylece üzerinde R’da **data frame işlemleri** (filter, select, mutate vb.) kolayca yapılabilir.
Sonuç olarak `WDI_extra` adında bir **yeni data frame** oluşur ve içinde sadece **ülke/bölge isimleri** bulunur.
df <- left_join(df, WDI_extra)
## Joining with `by = join_by(country, iso2c, iso3c)`
WDI_extra içinde hangi ülkelerin veya
bölgelerin olduğunu görebilirsin.df %>% describe_all()
## # A tibble: 13 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 266 NA NA NA
## 2 iso2c chr 0 0 266 NA NA NA
## 3 iso3c chr 0 0 262 NA NA NA
## 4 year int 0 0 65 1960 1992 2024
## 5 EG.ELC.ACCS.ZS dbl 9431 54.5 2553 0.53 81.2 100
## 6 EN.CLC.MDAT.ZS dbl 17122 99 160 0 1.17 9.23
## 7 AG.LND.IRIG.AG.ZS dbl 16062 92.9 1173 0 11.1 89.0
## 8 region chr 780 4.5 9 NA NA NA
## 9 capital chr 780 4.5 211 NA NA NA
## 10 longitude chr 780 4.5 211 NA NA NA
## 11 latitude chr 780 4.5 211 NA NA NA
## 12 income chr 780 4.5 7 NA NA NA
## 13 lending chr 780 4.5 6 NA NA NA
Bu veri seti genel olarak ülke ve yıl bilgilerini, bölgesel ve başkent bilgilerini ve bazı ekonomik ve altyapı göstergelerini içermektedir. Veri setimizde, özellikle elektriğe erişim oranı (EG.ELC.ACCS.ZS) ve tarım arazilerinin sulama oranı (AG.LND.IRIG.AG.ZS) gibi bazı önemli değişkenlerde eksik gözlemler bulunduğu görülmektedir. Kapsamlı ve güvenilir istatistiksel analizler yapabilmek için bu eksik verilerin uygun yöntemlerle ele alınması büyük önem taşımaktadır.
country, iso2c, iso3c, region, capital, longitude gibi değişkenlerde eksik veri yoktur.
year değişkeni 1960–2024 yıllarını kapsamakta ve eksiksizdir.
EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS gibi ekonomik ve altyapı göstergelerinde eksik gözlemler oldukça fazladır (bazı değişkenlerde %50’nin üzerinde).
Bu nedenle analizlerde bu eksik verilerin göz önünde bulundurulması ve gerekirse uygun imputation yöntemleri veya analiz tekniklerinin kullanılması önerilir.
# Group by 'country' and count missing values within each group
missing_data_count <- df %>%
group_by(country) %>%
summarize(missing_count = sum(is.na(AG.LND.IRIG.AG.ZS)), .groups = 'drop')
# Identify countries with all missing data or more than 20 missing points
countries_with_all_missing <- missing_data_count %>%
filter(missing_count == 65) # Change 66 to the total number of observations per country
countries_with_more_than_20_missing <- missing_data_count %>%
filter(missing_count > 20) # Change 20 to your desired threshold
# View countries with all missing data or more than 20 missing points
print(countries_with_all_missing)
## # A tibble: 145 × 2
## country missing_count
## <chr> <int>
## 1 Africa Eastern and Southern 65
## 2 Africa Western and Central 65
## 3 American Samoa 65
## 4 Andorra 65
## 5 Angola 65
## 6 Antigua and Barbuda 65
## 7 Arab World 65
## 8 Aruba 65
## 9 Bahamas, The 65
## 10 Barbados 65
## # ℹ 135 more rows
group_by(country) → veriyi ülke bazında
gruplar.
summarize() → her grup için
AG.LND.IRIG.AG.ZS sütunundaki NA (eksik) değerlerin
toplamını hesaplar.
.groups = 'drop' → sonuçta gruplamayı kaldırır, düz
bir tablo elde edilir.
- Eğer bir ülkenin **tüm gözlemleri NA** ise burada listelenir.
- `65` → o ülkedeki toplam yıl/gözlem sayısı, senin veri setine göre değişebilir.
20 → senin belirlediğin eşik değeri.
Sadece tüm verisi eksik olan ülkeler yazdırılır.
Benzer şekilde countries_with_more_than_20_missing
da yazdırılabilir:
### Özet:
- Bu kod, **ülkelerdeki eksik değerleri kontrol etmek** ve gerekirse eksik verisi çok olan ülkeleri **analiz dışında bırakmak** için kullanılır.
- Özellikle zaman serisi analizlerinde, eksik verisi çok olan ülkeler trendi bozabileceği için bu kontrol önemlidir.
# Retirer les pays avec toutes les valeurs manquantes
df_clean <- df %>% filter(!country %in% countries_with_all_missing$country)
# Retirer les pays avec plus de 20 valeurs manquantes
df_clean <- df_clean %>% filter(!country %in% countries_with_more_than_20_missing$country)
## # A tibble: 0 × 2
## # ℹ 2 variables: country <chr>, missing_count <int>
df$country[grepl("turk", tolower(df$country))]
## [1] "Turkiye" "Turkiye"
## [3] "Turkiye" "Turkiye"
## [5] "Turkiye" "Turkiye"
## [7] "Turkiye" "Turkiye"
## [9] "Turkiye" "Turkiye"
## [11] "Turkiye" "Turkiye"
## [13] "Turkiye" "Turkiye"
## [15] "Turkiye" "Turkiye"
## [17] "Turkiye" "Turkiye"
## [19] "Turkiye" "Turkiye"
## [21] "Turkiye" "Turkiye"
## [23] "Turkiye" "Turkiye"
## [25] "Turkiye" "Turkiye"
## [27] "Turkiye" "Turkiye"
## [29] "Turkiye" "Turkiye"
## [31] "Turkiye" "Turkiye"
## [33] "Turkiye" "Turkiye"
## [35] "Turkiye" "Turkiye"
## [37] "Turkiye" "Turkiye"
## [39] "Turkiye" "Turkiye"
## [41] "Turkiye" "Turkiye"
## [43] "Turkiye" "Turkiye"
## [45] "Turkiye" "Turkiye"
## [47] "Turkiye" "Turkiye"
## [49] "Turkiye" "Turkiye"
## [51] "Turkiye" "Turkiye"
## [53] "Turkiye" "Turkiye"
## [55] "Turkiye" "Turkiye"
## [57] "Turkiye" "Turkiye"
## [59] "Turkiye" "Turkiye"
## [61] "Turkiye" "Turkiye"
## [63] "Turkiye" "Turkiye"
## [65] "Turkiye" "Turkmenistan"
## [67] "Turkmenistan" "Turkmenistan"
## [69] "Turkmenistan" "Turkmenistan"
## [71] "Turkmenistan" "Turkmenistan"
## [73] "Turkmenistan" "Turkmenistan"
## [75] "Turkmenistan" "Turkmenistan"
## [77] "Turkmenistan" "Turkmenistan"
## [79] "Turkmenistan" "Turkmenistan"
## [81] "Turkmenistan" "Turkmenistan"
## [83] "Turkmenistan" "Turkmenistan"
## [85] "Turkmenistan" "Turkmenistan"
## [87] "Turkmenistan" "Turkmenistan"
## [89] "Turkmenistan" "Turkmenistan"
## [91] "Turkmenistan" "Turkmenistan"
## [93] "Turkmenistan" "Turkmenistan"
## [95] "Turkmenistan" "Turkmenistan"
## [97] "Turkmenistan" "Turkmenistan"
## [99] "Turkmenistan" "Turkmenistan"
## [101] "Turkmenistan" "Turkmenistan"
## [103] "Turkmenistan" "Turkmenistan"
## [105] "Turkmenistan" "Turkmenistan"
## [107] "Turkmenistan" "Turkmenistan"
## [109] "Turkmenistan" "Turkmenistan"
## [111] "Turkmenistan" "Turkmenistan"
## [113] "Turkmenistan" "Turkmenistan"
## [115] "Turkmenistan" "Turkmenistan"
## [117] "Turkmenistan" "Turkmenistan"
## [119] "Turkmenistan" "Turkmenistan"
## [121] "Turkmenistan" "Turkmenistan"
## [123] "Turkmenistan" "Turkmenistan"
## [125] "Turkmenistan" "Turkmenistan"
## [127] "Turkmenistan" "Turkmenistan"
## [129] "Turkmenistan" "Turkmenistan"
## [131] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [133] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [135] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [137] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [139] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [141] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [143] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [145] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [147] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [149] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [151] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [153] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [155] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [157] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [159] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [161] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [163] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [165] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [167] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [169] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [171] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [173] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [175] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [177] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [179] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [181] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [183] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [185] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [187] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [189] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [191] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [193] "Turks and Caicos Islands" "Turks and Caicos Islands"
## [195] "Turks and Caicos Islands"
tolower(df$country) → country
sütunundaki tüm değerleri küçük harfe çevirir.
"Turkey", "TURKEY",
"turkey" fark etmez.grepl("turk", ...) → her bir ülke isminin içinde
"turk" geçenleri TRUE/FALSE olarak
döndürür.
df$country[...] → TRUE olan satırları
seçer.
- Yani `"turk"` geçen ülke adlarını listelemiş olursun.
- Bu sayede Türkiye’nin veri setindeki **tam adı** otomatik olarak bulunur.
- Sonraki adımda bu adı kullanarak veri filtreleme ve grafik çizme işlemi yapılabilir:
df_turkey <- df %>%
filter(country == "Turkey") # ya da unique çıktısına göre
filter(country == "Turkey") → veri setinde
country sütununda “Turkey” olan satırları
seçer.%>% → pipe operatörü, önceki veri çerçevesini alır
ve filter() fonksiyonuna gönderir.df_turkey adlı yeni bir veri
çerçevesi olur ve sadece Türkiye verilerini içerir.library(dplyr)
library(tidyr)
library(ggplot2)
# 1️⃣ Sadece gerçek ülkeleri bırak
df_countries <- df %>%
filter(!grepl("World|Africa|Arab|Middle|Low|High|Developing|Emerging", country))
# 2️⃣ Türkiye'nin adını otomatik tespit et
turkey_name <- df_countries$country[grepl("turk", tolower(df_countries$country))][1]
if(is.na(turkey_name)){
stop("Türkiye için veri bulunamadı. df$country içeriğini kontrol et.")
}
# 3️⃣ Türkiye verisini filtrele ve year sütununu temizle
df_turkey <- df_countries %>%
filter(country == turkey_name) %>%
mutate(
year = as.numeric(gsub("[^0-9]", "", year))
) %>%
select(year, EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS) %>%
filter(!is.na(year)) # yılı olmayanları çıkar
# 4️⃣ Veriyi uzun formata çevir
df_long <- df_turkey %>%
pivot_longer(
cols = -year,
names_to = "indicator",
values_to = "value"
)
# 5️⃣ Daha anlaşılır isimler verelim
df_long <- df_long %>%
mutate(
indicator = case_when(
indicator == "EG.ELC.ACCS.ZS" ~ "Toplam",
indicator == "EN.CLC.MDAT.ZS" ~ "Kırsal",
indicator == "AG.LND.IRIG.AG.ZS" ~ "Kentsel",
TRUE ~ indicator
)
)
# 6️⃣ Grafik oluştur
ggplot(df_long, aes(x = year, y = value, color = indicator)) +
geom_line(size = 1) +
geom_point(size = 2) +
labs(
title = paste0(turkey_name, " - Elektrik Erişimi Karşılaştırması"),
x = "Yıl",
y = "Elektriğe Erişim (%)",
color = "Gösterge"
) +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Removed 136 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Warning: Removed 136 rows containing missing values or values outside the scale range
## (`geom_point()`).
print(countries_with_more_than_20_missing)
## # A tibble: 266 × 2
## country missing_count
## <chr> <int>
## 1 Afghanistan 42
## 2 Africa Eastern and Southern 65
## 3 Africa Western and Central 65
## 4 Albania 48
## 5 Algeria 49
## 6 American Samoa 65
## 7 Andorra 65
## 8 Angola 65
## 9 Antigua and Barbuda 65
## 10 Arab World 65
## # ℹ 256 more rows
countries_with_more_than_20_missing → önceden
oluşturduğun veri çerçevesi.
- `country` → ülke adı
- `missing_count` → eksik değer sayısıprint() → bu veri çerçevesini ekrana
yazdırır.
Bu sayede eksik veri sayısı 20’den fazla olan ülkeler listesini görebilirsin.
Örneğin, analiz veya grafik çizmeden önce çok eksik verisi olan ülkeleri elemek için kullanılır.
## # A tibble: 1 × 2
## country missing_count
## <chr> <int>
## 1 West Bank and Gaza 30
# Filter out West Bank and Gaza
df <- df %>%
filter(!(country %in% c("West Bank and Gaza")))
df %>% describe_all()
## # A tibble: 13 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 265 NA NA NA
## 2 iso2c chr 0 0 265 NA NA NA
## 3 iso3c chr 0 0 261 NA NA NA
## 4 year int 0 0 65 1960 1992 2024
## 5 EG.ELC.ACCS.ZS dbl 9393 54.5 2551 0.53 81.2 100
## 6 EN.CLC.MDAT.ZS dbl 17057 99 160 0 1.17 9.23
## 7 AG.LND.IRIG.AG.ZS dbl 16009 92.9 1161 0 11.1 89.0
## 8 region chr 780 4.5 9 NA NA NA
## 9 capital chr 780 4.5 211 NA NA NA
## 10 longitude chr 780 4.5 211 NA NA NA
## 11 latitude chr 780 4.5 211 NA NA NA
## 12 income chr 780 4.5 7 NA NA NA
## 13 lending chr 780 4.5 6 NA NA NA
df %>% → pipe operatörü, df veri
çerçevesini describe_all() fonksiyonuna gönderir.
describe_all() → veri çerçevesindeki tüm
sütunlar için özet istatistikler üretir.
- Örnek çıktılar:
- `n` → gözlem sayısı
- `mean` → ortalama (numeric sütunlar için)
- `min`, `max` → minimum ve maksimum değerler
- `sd` → standart sapma
- `missing` → eksik değer sayısı
# Subset the original dataset 'df' to keep year bigger than 2000
dff <- df %>%
filter(year>=2005)
df %>% → pipe operatörü, df veri
çerçevesini sonraki fonksiyona gönderir.
filter(year >= 2005) → year sütunu
2005 veya daha büyük olan satırları seçer.
Sonuç dff adlı yeni bir veri çerçevesi olur ve artık
sadece 2005 ve sonrası yılları içerir.
Bu kod, veri setini 2005 ve sonrası yıllar ile sınırlar, böylece grafikler veya analizler sadece bu dönemi kapsar.
# Group by 'country' and count missing values within each group
missing_data_count <- dff %>%
group_by(country) %>%
summarize(missing_count = sum(is.na(EG.ELC.ACCS.ZS)), .groups = 'drop')
dff %>% → pipe operatörü, dff veri
çerçevesini sonraki fonksiyona gönderir.
dff → sadece 2005 ve sonrası yılları içeren
veri seti.group_by(country) → veriyi ülke bazında
gruplar.
summarize(missing_count = sum(is.na(EG.ELC.ACCS.ZS)))
→ her ülke için:
- `EG.ELC.ACCS.ZS` sütunundaki **eksik değerleri sayar** (`NA` olanları toplar).
- `missing_count` → her ülke için eksik veri sayısını içerir.
.groups = 'drop' → özetleme sonrası gruplamayı
kaldırır, düz bir tablo elde edilir.
Sonuç olarak missing_data_count → her ülke
için toplam eksik değer sayısını içeren bir veri çerçevesi
olur.
dff %>% describe_all()
## # A tibble: 13 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 265 NA NA NA
## 2 iso2c chr 0 0 265 NA NA NA
## 3 iso3c chr 0 0 261 NA NA NA
## 4 year int 0 0 20 2005 2014. 2024
## 5 EG.ELC.ACCS.ZS dbl 330 6.2 1621 0.8 82.2 100
## 6 EN.CLC.MDAT.ZS dbl 5132 96.8 160 0 1.17 9.23
## 7 AG.LND.IRIG.AG.ZS dbl 4253 80.2 1002 0 11.4 89.0
## 8 region chr 240 4.5 9 NA NA NA
## 9 capital chr 240 4.5 211 NA NA NA
## 10 longitude chr 240 4.5 211 NA NA NA
## 11 latitude chr 240 4.5 211 NA NA NA
## 12 income chr 240 4.5 7 NA NA NA
## 13 lending chr 240 4.5 6 NA NA NA
| Sütun | Açıklama |
|---|---|
variable |
Sütun adı (örneğin country, EG.ELC.ACCS.ZS
vb.) |
type |
Sütunun veri tipi (chr = karakter, dbl =
numeric, int = integer) |
na |
Sütundaki eksik değer sayısı (NA sayısı) |
na_pct |
Eksik değer yüzdesi (%) |
unique |
Sütundaki benzersiz değer sayısı |
# Örnek: EG.ELC.ACCS.ZS sütununda eksik veri sayısı <=20 olan ülkeler
countries_to_keep <- missing_data_count %>%
filter(missing_count <= 20) %>%
pull(country) # sadece country sütununu al
missing_data_count %>% → pipe operatörü ile
missing_data_count veri çerçevesini sonraki fonksiyona
gönderir.
missing_data_count → daha önce her ülke için
EG.ELC.ACCS.ZS eksik değerlerini saydığın tablo.filter(missing_count <= 20) → eksik veri sayısı
20 veya daha az olan ülkeleri seçer.pull(country) → sadece country sütununu
alır ve vector hâline getirir.Sonuç:
- `countries_to_keep` → analiz için kullanılabilecek, **eksik verisi çok olmayan ülkelerin listesi** olur.
if (nrow(df) > 6) {
df %>% describe_all()
}
## # A tibble: 13 × 8
## variable type na na_pct unique min mean max
## <chr> <chr> <int> <dbl> <int> <dbl> <dbl> <dbl>
## 1 country chr 0 0 265 NA NA NA
## 2 iso2c chr 0 0 265 NA NA NA
## 3 iso3c chr 0 0 261 NA NA NA
## 4 year int 0 0 65 1960 1992 2024
## 5 EG.ELC.ACCS.ZS dbl 9393 54.5 2551 0.53 81.2 100
## 6 EN.CLC.MDAT.ZS dbl 17057 99 160 0 1.17 9.23
## 7 AG.LND.IRIG.AG.ZS dbl 16009 92.9 1161 0 11.1 89.0
## 8 region chr 780 4.5 9 NA NA NA
## 9 capital chr 780 4.5 211 NA NA NA
## 10 longitude chr 780 4.5 211 NA NA NA
## 11 latitude chr 780 4.5 211 NA NA NA
## 12 income chr 780 4.5 7 NA NA NA
## 13 lending chr 780 4.5 6 NA NA NA
| Sütun | Açıklama |
|---|---|
variable |
Sütun adı (örneğin country, EG.ELC.ACCS.ZS
vb.) |
type |
Sütunun veri tipi (chr = karakter, dbl =
numeric, int = integer) |
na |
Sütundaki eksik değer sayısı (NA sayısı) |
na_pct |
Eksik değer yüzdesi (%) |
unique |
Sütundaki benzersiz değer sayısı |
Küresel üretkenlik analizi, ülkelerin dünya ekonomisine katkılarının yalnızca nüfus büyüklüklerine değil, aynı zamanda mevcut kaynakları ne ölçüde etkin bir şekilde üretime dönüştürebildiklerine bağlı olduğunu göstermektedir. Bu üretkenlik kapasitesi; altyapı kalitesi, teknolojik gelişmişlik düzeyi, kurumsal etkinlik ve üretim süreçlerinin sürdürülebilirliği gibi yapısal faktörlerle yakından ilişkilidir.
Bu çerçevede, World Development Indicators (WDI) veri tabanından elde edilen göstergelerin incelenmesi, üretkenlik ve ekonomik kalkınmanın temel belirleyicilerini daha ayrıntılı biçimde analiz etme imkânı sunmaktadır. Elektriğe erişim, modern ekonomik faaliyetlerin ön koşulu niteliğinde olup üretim kapasitesi ve yaşam kalitesi üzerinde doğrudan etkiye sahiptir. İklim değişikliğiyle mücadeleye yönelik politikalar ise ülkelerin kurumsal olgunluğunu ve uzun vadeli planlama kapasitesini yansıtmaktadır. Bunun yanı sıra, sulanan tarım arazilerinin payı, özellikle tarımın hâlen önemli bir rol oynadığı ekonomilerde, üretim istikrarı ve verimlilik açısından kritik bir göstergedir.
Dolayısıyla EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS ve AG.LND.IRIG.AG.ZS göstergelerine dayalı ampirik analiz, küresel üretkenliğin değerlendirilmesine doğal bir devam niteliği taşımaktadır. Bu yaklaşım, ülkelerin dünya ekonomisindeki göreli konumlarını yalnızca toplam üretim düzeyleriyle değil; aynı zamanda bu üretimi mümkün kılan altyapısal, çevresel ve kurumsal koşullar üzerinden açıklamaya olanak tanımakta ve uzun vadeli kalkınma süreçlerinin daha bütüncül bir şekilde anlaşılmasını sağlamaktadır.
library(dplyr)
library(tidyr)
library(ggplot2)
# Supprimer les agrégats (World, regions, income groups)
df_countries <- df %>%
filter(!grepl("World|Africa|Europe|Asia|Arab|Income|Low|High|Middle", country))
# Sélection des variables pertinentes
df_selected <- df_countries %>%
select(
country, year,
EG.ELC.ACCS.ZS,
EN.CLC.MDAT.ZS,
AG.LND.IRIG.AG.ZS
) %>%
mutate(year = as.numeric(year))
summary_stats <- df_selected %>%
summarise(
elec_mean = mean(EG.ELC.ACCS.ZS, na.rm = TRUE),
climate_mean = mean(EN.CLC.MDAT.ZS, na.rm = TRUE),
irrig_mean = mean(AG.LND.IRIG.AG.ZS, na.rm = TRUE)
)
summary_stats
## elec_mean climate_mean irrig_mean
## 1 81.55006 1.190369 11.19203
Göstergelerin ortalama değerleri, altyapı, çevre politikaları ve tarımsal kapasite açısından ülkeler arasında önemli farklılıklar bulunduğunu göstermektedir.
df_long <- df_selected %>%
pivot_longer(
cols = c(EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS),
names_to = "indicator",
values_to = "value"
)
df_trend <- df_long %>%
group_by(year, indicator) %>%
summarise(mean_value = mean(value, na.rm = TRUE), .groups = "drop")
ggplot(df_trend, aes(x = year, y = mean_value, color = indicator)) +
geom_line(size = 1) +
labs(
title = "Dünya Genelinde Seçilmiş Göstergelerin Zaman İçindeki Eğilimleri",
x = "Yıl",
y = "Ortalama Değer",
color = "Gösterge"
) +
theme_minimal()
## Warning: Removed 126 rows containing missing values or values outside the scale range
## (`geom_line()`).
Betimleyici istatistikler ve grafikler aracılığıyla zaman içerisindeki eğilimler incelenmiştir.
df_selected <- df_selected %>%
mutate(
elec_group = case_when(
EG.ELC.ACCS.ZS >= 95 ~ "Yüksek Elektrik Erişimi",
EG.ELC.ACCS.ZS < 95 ~ "Düşük Elektrik Erişimi"
)
)
ggplot(df_selected, aes(x = elec_group, y = AG.LND.IRIG.AG.ZS)) +
geom_boxplot() +
labs(
title = "Elektrik Erişimi ile Tarımsal Sulama Arasındaki İlişki",
x = "Elektrik Erişim Düzeyi",
y = "Sulanan Tarım Arazisi (%)"
) +
theme_minimal()
## Warning: Removed 14042 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
Elektriğe erişim ile tarımsal üretim kapasitesi arasında anlamlı farklılıklar gözlemlenmektedir.
df_corr <- df_selected %>%
select(EG.ELC.ACCS.ZS, EN.CLC.MDAT.ZS, AG.LND.IRIG.AG.ZS) %>%
na.omit()
cor(df_corr)
## EG.ELC.ACCS.ZS EN.CLC.MDAT.ZS AG.LND.IRIG.AG.ZS
## EG.ELC.ACCS.ZS 1.0000000 -0.55671399 0.14347765
## EN.CLC.MDAT.ZS -0.5567140 1.00000000 0.02212977
## AG.LND.IRIG.AG.ZS 0.1434777 0.02212977 1.00000000
Korelasyon sonuçları, altyapı gelişmişliği ile kalkınma göstergeleri arasında pozitif ilişkiler olduğunu göstermektedir.
model <- lm(
EG.ELC.ACCS.ZS ~ EN.CLC.MDAT.ZS + AG.LND.IRIG.AG.ZS,
data = df_selected
)
summary(model)
##
## Call:
## lm(formula = EG.ELC.ACCS.ZS ~ EN.CLC.MDAT.ZS + AG.LND.IRIG.AG.ZS,
## data = df_selected)
##
## Residuals:
## Min 1Q Median 3Q Max
## -49.531 -3.391 5.608 8.300 48.333
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 91.9408 4.0309 22.809 < 2e-16 ***
## EN.CLC.MDAT.ZS -8.5299 1.8736 -4.553 4.16e-05 ***
## AG.LND.IRIG.AG.ZS 0.2542 0.2007 1.267 0.212
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.2 on 44 degrees of freedom
## (15163 observations effacées parce que manquantes)
## Multiple R-squared: 0.3342, Adjusted R-squared: 0.304
## F-statistic: 11.04 on 2 and 44 DF, p-value: 0.0001298
Bu modeller aracılığıyla nedensel bir ilişki kurmaktan ziyade, değişkenler arasındaki istatistiksel ilişkiler değerlendirilmiştir.
df_turkey <- df_selected %>%
filter(country == "Turkey")
ggplot(df_turkey, aes(x = year)) +
geom_line(aes(y = EG.ELC.ACCS.ZS, color = "Elektrik")) +
geom_line(aes(y = AG.LND.IRIG.AG.ZS, color = "Sulama")) +
labs(
title = "Türkiye'de Elektrik Erişimi ve Tarımsal Sulama",
x = "Yıl",
y = "Değer",
color = "Gösterge"
) +
theme_minimal()
colnames(df_selected)
## [1] "country" "year" "EG.ELC.ACCS.ZS"
## [4] "EN.CLC.MDAT.ZS" "AG.LND.IRIG.AG.ZS" "elec_group"
df_summary <- df_selected %>%
group_by(year) %>%
summarise(
elec = mean(EG.ELC.ACCS.ZS, na.rm = TRUE),
irrig = mean(AG.LND.IRIG.AG.ZS, na.rm = TRUE),
climate = mean(EN.CLC.MDAT.ZS, na.rm = TRUE),
.groups = "drop"
)
ggplot(df_summary, aes(x = year)) +
geom_line(aes(y = elec, color = "Elektrik")) +
geom_line(aes(y = irrig, color = "Sulama")) +
labs(
title = "Dünya Genelinde Göstergelerin Zaman İçindeki Seyri",
x = "Yıl",
y = "Ortalama Değer",
color = "Gösterge"
) +
theme_minimal()
## Warning: Removed 31 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Removed 31 rows containing missing values or values outside the scale range
## (`geom_line()`).
Bu kod parçası, ülkeler arasında dağınık ve heterojen yapıya sahip olan Dünya Bankası verilerini bir araya getirerek, küresel düzeyde anlamlı ve karşılaştırılabilir eğilimler elde etmek amacıyla kullanılmaktadır. Tek tek ülkeler incelendiğinde sonuçlar çoğu zaman parçalı, gürültülü ve yorumlanması güç bir yapı sergilemektedir. Bu nedenle veriler, yıllara göre gruplanarak dünya ortalamaları hesaplanmıştır.
summarise() fonksiyonu aracılığıyla elektriğe erişim
oranı, sulanan tarım arazilerinin payı ve iklim değişikliğiyle ilgili
politika göstergeleri için her yılın ortalama değerleri elde edilmiştir.
Bu yaklaşım, küresel kalkınma dinamiklerinin zaman içerisindeki genel
seyrini daha net bir biçimde ortaya koymayı mümkün kılmaktadır.
Elde edilen ortalama değerlerin çizgi grafikleriyle görselleştirilmesi, altyapı gelişimi, tarımsal sürdürülebilirlik ve çevresel politika kapasitesinin uzun dönemde nasıl evrildiğini açık bir şekilde göstermektedir. Bu analiz, göstergeler arasında doğrudan nedensel bir ilişki kurmayı amaçlamaktan ziyade, küresel ölçekteki yapısal dönüşümleri ve genel eğilimleri betimleyici bir çerçevede sunması açısından çalışmanın temel amacıyla doğrudan örtüşmektedir.
ggplot(df, aes(x = year, y = EG.ELC.ACCS.ZS)) +
geom_line() +
labs(
title = "Global Trend in Access to Electricity",
x = "Year",
y = "Access to Electricity (% of population)"
)
## Warning: Removed 8218 rows containing missing values or values outside the scale range
## (`geom_line()`).
Grafik, dünya genelinde elektriğe erişimi olan nüfusun yüzdesinin zaman içindeki değişimini göstermektedir. Zaman içerisinde genel olarak artan bir eğilim gözlemlenmektedir. Bu durum, enerji altyapısının geliştirilmesine yönelik küresel çabaların ve temel hizmetlere erişimin yaygınlaştırılmasına yönelik politikaların etkili olduğunu göstermektedir. Özellikle gelişmekte olan ülkelerde elektriğe erişimin artması, ekonomik ve sosyal kalkınma açısından önemli bir ilerleme olarak değerlendirilmektedir.
Bununla birlikte, artış eğiliminin doğrusal olmaması, ülkeler ve bölgeler arasında devam eden eşitsizliklere işaret etmektedir. Ekonomik kısıtlar, kurumsal yetersizlikler ve politik istikrarsızlıklar, elektriğe erişimin bazı dönemlerde yavaşlamasına neden olmuş olabilir. Elektriğe erişim, üretkenlik, eğitim ve sağlık hizmetlerine erişim gibi birçok temel unsurun ön koşulu olduğundan, bu göstergedeki artış genel kalkınma seviyesindeki iyileşmeyi yansıtmaktadır. Ancak, sürdürülebilir ve kapsayıcı bir kalkınma için elektriğe erişimde kalan eşitsizliklerin azaltılmasına yönelik hedefe yönelik politikaların uygulanması gerekmektedir.
ggplot(df, aes(x = year, y = AG.LND.IRIG.AG.ZS)) +
geom_line() +
labs(
title = "Share of Irrigated Agricultural Land Over Time",
x = "Year",
y = "Irrigated Agricultural Land (%)"
)
## Warning: Removed 8468 rows containing missing values or values outside the scale range
## (`geom_line()`).
Bu çalışmada kullanılan göstergeler, ülkelerin ekonomik üretim düzeylerinden ziyade altyapı gelişmişliği, çevresel politika kapasitesi ve tarımsal sürdürülebilirlik düzeylerini ölçmektedir. Bu nedenle analiz, küresel üretkenlikten çok kalkınma ve sürdürülebilirlik boyutlarına odaklanmaktadır.
Bu çalışmada, Dünya Bankası’nın World Development Indicators (WDI) veri tabanı kullanılarak ülkelerin kalkınma süreçleri altyapı gelişmişliği, çevresel politika kapasitesi ve tarımsal sürdürülebilirlik boyutlarıyla ele alınmıştır. Analiz, elektriğe erişim oranı (EG.ELC.ACCS.ZS), iklim değişikliğiyle ilgili politika göstergeleri (EN.CLC.MDAT.ZS) ve sulanan tarım arazilerinin payı (AG.LND.IRIG.AG.ZS) üzerine odaklanmıştır. Betimleyici istatistikler, grafikler ve basit ekonometrik modeller, özellikle elektriğe erişimin birçok kalkınma göstergesiyle birlikte hareket ettiğini ve altyapının ekonomik ve sosyal kalkınmada temel bir unsur olduğunu göstermektedir.
Buna karşılık, iklim politikaları ve tarımsal sulama göstergeleri ülkeler arasında daha heterojen bir yapı sergilemekte olup, bu farklılıklar büyük ölçüde kurumsal kapasite, coğrafi koşullar ve kalkınma düzeyleriyle ilişkilidir. Elde edilen bulgular, kalkınmanın yalnızca tek bir göstergeyle açıklanamayacağını; altyapı, çevresel sürdürülebilirlik ve tarımsal üretim politikalarının birlikte değerlendirilmesi gerektiğini ortaya koymaktadır.
Bununla birlikte, çalışma Dünya Bankası göstergelerine dayalı korelasyon ve basit regresyon analizleriyle sınırlıdır ve bu nedenle kesin nedensel ilişkiler kurmaya imkân vermemektedir. Ayrıca bazı ülkelerdeki veri eksiklikleri ve göstergelerin toplulaştırılmış yapısı sonuçların dikkatli yorumlanmasını gerektirmektedir. Gelecek çalışmalarda daha uzun zaman serileri, ek kalkınma göstergeleri ve gelişmiş ekonometrik yöntemler kullanılarak bu ilişkiler daha derinlemesine incelenebilir. Genel olarak bu çalışma, WDI verilerinin ülkelerin kalkınma dinamiklerini analiz etmede güçlü ve kullanışlı bir araç olduğunu ortaya koymaktadır.