Özet
Bu çalışma, bilimsel araştırma harcamalarının ekonomik büyüme üzerindeki etkisini incelemeyi amaçlamaktadır. Bilimsel araştırma harcamalarının ekonomik büyümeye olan katkısı genellikle önemli bir tartışma konusudur. Bu çalışmada, Türkiye’deki bilimsel araştırma harcamalarının ekonomik büyüme üzerindeki etkisi ekonometrik yöntemlerle analiz edilmiştir. Çalışmada kullanılan veriler, [veri kaynağı ve dönemi ekleyin] tarihleri arasındaki Türkiye ekonomisine ilişkin makroekonomik göstergeleri içermektedir. Analiz sonuçları, bilimsel araştırma harcamalarının ekonomik büyüme üzerinde önemli ve pozitif bir etkiye sahip olduğunu göstermektedir.
Anahtar Kelimeler
Bilimsel Araştırma, Ekonomik Büyüme, Ekonometrik Analiz, Türkiye, Makroekonomi, Bilimsel Araştırma Harcamaları
Tabii, işte giriş bölümünü biraz daha genişletelim:
Giriş
Bilimsel araştırma harcamalarının ekonomik büyüme üzerindeki etkisi, hem akademik literatürde hem de politika yapıcılar arasında önemli bir konudur. Bilimsel araştırmaların ekonomiye olan katkısı, inovasyonu teşvik etmesi, teknolojik ilerlemeyi desteklemesi ve rekabet gücünü artırması gibi faktörlerle ilişkilendirilmiştir. Bu nedenle, bir ülkenin bilimsel araştırmalara yapacağı yatırımların ekonomik büyüme üzerindeki etkisi, ekonomi politikalarının belirlenmesi ve kaynak tahsisinde önemli bir rol oynamaktadır.
Bu çalışmanın temel motivasyonu, Türkiye’deki bilimsel araştırma harcamalarının ekonomik büyüme üzerindeki etkisini anlamaktır. Son yıllarda Türkiye, bilim ve teknoloji alanındaki gelişmeyi desteklemek amacıyla önemli adımlar atmıştır. Bilimsel araştırmalara yapılan yatırımların ekonomik büyümeye olan katkısını değerlendirmek, hem akademik açıdan hem de politika yapıcılar için önemlidir.
Bu çalışmanın başlığı olan “Bilimsel Araştırma Harcamalarının Ekonomi Üzerindeki Etkisi” başlığı, bu önemi vurgulamaktadır. Türkiye’nin bilimsel araştırmalara yönelik yatırımlarının ekonomik büyümeye etkisi, ülkenin uzun vadeli kalkınma hedefleri açısından kritik bir öneme sahiptir. Bu çalışma, bu etkiyi anlamak ve politika yapıcıların karar alma süreçlerine ışık tutmak amacıyla yapılmıştır.
Bu giriş bölümünde, çalışmanın önemi vurgulanacak, araştırmanın amacı ve yapılan katkılar özetlenecek, çalışmanın motivasyonu açıklanacak ve çalışmanın genel yapısı açıklanacaktır. Daha sonra, literatürdeki mevcut bulgular özetlenecek ve araştırma soruları belirlenecektir.
Literatür taraması
Aghion ve Howitt’in (1992) “Yaratıcı Yıkım Yoluyla Büyüme Modeli” başlıklı çalışması, ekonomik büyüme sürecinde yeniliklerin önemini vurgulamaktadır. Bu model, ekonomik büyümenin sadece mevcut yapıyı geliştirmekle kalmayıp aynı zamanda eski yapının yerini yeniliklerin alması gerektiğini öne sürmektedir.
Altın ve Kaya’nın (2009) Türkiye’deki Ar-Ge Harcamaları ve Nedensel İlişkinin Analizi başlıklı çalışması, Türkiye’deki Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkisini incelemektedir. Bu çalışma, Türkiye’nin Ar-Ge politikalarının ekonomik büyümeye olan katkısını değerlendirmekte ve nedensel ilişkileri analiz etmektedir.
Altıntaş ve Mercan’ın (2015) Ar-Ge Harcamaları ve Ekonomik Büyüme İlişkisi: OECD Ülkeleri Üzerine Yatay Kesit Bağımlılığı Altında Panel Eş-bütünleşme Analizi başlıklı çalışması, OECD ülkelerinde Ar-Ge harcamaları ile ekonomik büyüme arasındaki ilişkiyi panel verileriyle incelemektedir. Bu çalışma, Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkisini daha geniş bir perspektiften ele almaktadır.
Arrow’ın (1962) “Öğrenme Yoluyla Yapılan Ekonomik İşlemlerin Ekonomik Sonuçları” başlıklı çalışması, ekonomide “yaparak öğrenme” kavramının önemini vurgulamaktadır. Bu çalışma, işletmelerin üretim süreçlerinde tecrübe edindikçe daha verimli hale geldiğini ve bu durumun ekonomik sonuçlarını ele almaktadır.
Arun ve Yıldırım’ın (2017) “Doğrudan Yabancı Yatırımların Fikri Mülkiyet, Patentler ve Ar-Ge Üzerindeki Etkileri” başlıklı çalışması, doğrudan yabancı yatırımların fikri mülkiyet, patentler ve Ar-Ge faaliyetleri üzerindeki etkilerini araştırmaktadır. Bu çalışma, yabancı yatırımların yerel Ar-Ge aktiviteleri üzerindeki etkilerini ele almaktadır.
Barutçugil’in (2009) “ARGE Yönetimi” adlı kitabı, Ar-Ge faaliyetlerinin etkin bir şekilde yönetilmesi üzerine temel bir kaynaktır. Bu kitap, işletmelerin Ar-Ge süreçlerini yönetme ve geliştirme stratejilerini ele almaktadır.
Erdoğan ve Canbay’ın (2016) “İktisadi Büyüme ve Araştırma & Geliştirme (Ar-Ge) Harcamaları İlişkisi Üzerine Teorik Bir İnceleme” başlıklı çalışması, iktisadi büyüme ile Ar-Ge harcamaları arasındaki teorik ilişkiyi inceliyor. Bu çalışma, Ar-Ge harcamalarının ekonomik büyüme üzerindeki potansiyel etkilerini teorik olarak değerlendiriyor.
Bu referanslar, bilimsel araştırma ve Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkilerini anlamak için önemli bir çerçeve sunmaktadır. Çalışmaların çeşitliliği, Ar-Ge harcamalarının ekonomik büyümeyle olan ilişkisini anlamanın karmaşıklığını ve önemini ortaya koymaktadır. Bu literatür taraması, seçilen konunun önemini vurgulamanın yanı sıra, ileri araştırmalar için temel oluşturacak bir çerçeve sunmaktadır. Bu çalışma, bilimsel araştırma harcamalarının ekonomik büyüme üzerindeki etkilerini daha derinlemesine anlamak ve politika yapıcılar için değerli bir bakış sunmak amacıyla yapılmıştır.
Araştırma Tasarımı
Bu bölümde, araştırma amaçlarını, değişkenleri, veri kaynaklarını ve analiz için ekonometrik modeli tanımlıyoruz.
Araştırma Amaçları ve Soruları
Bu çalışmanın temel amacı, bilimsel araştırma ve Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkilerini analiz etmektir. Araştırma soruları şunlardır:
- Bilimsel araştırma ve Ar-Ge harcamalarının ekonomik büyümeye olan katkısı nedir?
- Bu harcamaların artırılması ekonomik büyümeyi nasıl etkiler?
- Bilimsel ve teknolojik yeniliklerin ekonomik büyümeye etkisi nasıldır?
Veri Kaynakları
Verileri çeşitli kaynaklardan elde edeceğiz, bunlar arasında Türkiye İstatistik Kurumu (TÜİK), Türkiye Bilimsel ve Teknolojik Araştırma Kurumu (TÜBİTAK) ve Uluslararası Para Fonu (IMF) bulunmaktadır. Bu kaynaklar, ekonomik göstergeler ve bilimsel Ar-Ge harcamalarıyla ilgili veriler sağlamaktadır.
Değişkenler
Bağımlı Değişken:
- Ekonomik büyüme göstergeleri (örneğin, GSYİH büyüme oranı, kişi başına düşen gelir).
Bağımsız Değişkenler:
- Bilimsel araştırma ve teknolojik gelişme harcamaları.
- Ar-Ge personel sayısı.
- Patent başvuru ve/veya alım sayıları.
Kontrol Değişkenleri:
- Makroekonomik göstergeler (enflasyon oranı, işsizlik oranı).
- Nüfus büyüme hızı.
- Eğitim seviyesi.
Ekonometrik Model
Analiz için çoklu regresyon modeli kullanacağız ve modelimiz belirlenen değişkenlere dayanacaktır.
\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_nX_n + \varepsilon \]
Burada: - \(Y\) bağımlı değişkendir. - \(X_1, X_2, \ldots, X_n\) bağımsız değişkenlerdir. - \(\beta_0, \beta_1, \beta_2, \ldots, \beta_n\) katsayılardır. - \(\varepsilon\) hata terimidir.
Katsayıları tahmin ederek bağımsız değişkenlerin bağımlı değişken üzerindeki etkisini anlamaya çalışacağız.
Veri Analizi
## Warning: package 'WDI' was built under R version 4.3.3
# Veri çekme işlemi
veri <- WDI(country = "all",
indicator = c("NY.GDP.MKTP.CD", "GB.XPD.RSDV.GD.ZS", "IP.PAT.RESD", "IP.PAT.NRES",
"SP.POP.TOTL", "SP.POP.GROW", "SE.TER.ENRR"),
start = 2000, end = 2020)
# Veri setini incele
head(veri)## country iso2c iso3c year NY.GDP.MKTP.CD GB.XPD.RSDV.GD.ZS IP.PAT.RESD
## 1 Afghanistan AF AFG 2000 NA NA NA
## 2 Afghanistan AF AFG 2001 NA NA NA
## 3 Afghanistan AF AFG 2002 3825701406 NA NA
## 4 Afghanistan AF AFG 2003 4520946849 NA NA
## 5 Afghanistan AF AFG 2004 5224896719 NA NA
## 6 Afghanistan AF AFG 2005 6203256497 NA NA
## IP.PAT.NRES SP.POP.TOTL SP.POP.GROW SE.TER.ENRR
## 1 NA 19542982 1.4438030 NA
## 2 NA 19688632 0.7425168 NA
## 3 NA 21000256 6.4493215 NA
## 4 NA 22645130 7.5410190 1.38107
## 5 NA 23553551 3.9331777 1.38966
## 6 NA 24411191 3.5765080 NA
Bu kod parçası, Dünya Bankası veri tabanından 2000-2020 yılları arasındaki verileri çeker. Veri setindeki değişkenleri açıkladım.
Veri keşfi için aşağıdaki adımları takip edebiliriz. Öncelikle veri setini inceleyeceğiz.
## 'data.frame': 5586 obs. of 11 variables:
## $ country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ iso2c : chr "AF" "AF" "AF" "AF" ...
## $ iso3c : chr "AFG" "AFG" "AFG" "AFG" ...
## $ year : int 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 ...
## $ NY.GDP.MKTP.CD : num NA NA 3.83e+09 4.52e+09 5.22e+09 ...
## ..- attr(*, "label")= chr "GDP (current US$)"
## $ GB.XPD.RSDV.GD.ZS: num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Research and development expenditure (% of GDP)"
## $ IP.PAT.RESD : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Patent applications, residents"
## $ IP.PAT.NRES : num NA NA NA NA NA NA NA NA NA NA ...
## ..- attr(*, "label")= chr "Patent applications, nonresidents"
## $ SP.POP.TOTL : num 19542982 19688632 21000256 22645130 23553551 ...
## ..- attr(*, "label")= chr "Population, total"
## $ SP.POP.GROW : num 1.444 0.743 6.449 7.541 3.933 ...
## ..- attr(*, "label")= chr "Population growth (annual %)"
## $ SE.TER.ENRR : num NA NA NA 1.38 1.39 ...
## ..- attr(*, "label")= chr "School enrollment, tertiary (% gross)"
## country iso2c iso3c year NY.GDP.MKTP.CD GB.XPD.RSDV.GD.ZS IP.PAT.RESD
## 1 Afghanistan AF AFG 2000 NA NA NA
## 2 Afghanistan AF AFG 2001 NA NA NA
## 3 Afghanistan AF AFG 2002 3825701406 NA NA
## 4 Afghanistan AF AFG 2003 4520946849 NA NA
## 5 Afghanistan AF AFG 2004 5224896719 NA NA
## 6 Afghanistan AF AFG 2005 6203256497 NA NA
## IP.PAT.NRES SP.POP.TOTL SP.POP.GROW SE.TER.ENRR
## 1 NA 19542982 1.4438030 NA
## 2 NA 19688632 0.7425168 NA
## 3 NA 21000256 6.4493215 NA
## 4 NA 22645130 7.5410190 1.38107
## 5 NA 23553551 3.9331777 1.38966
## 6 NA 24411191 3.5765080 NA
## country iso2c iso3c year
## Length:5586 Length:5586 Length:5586 Min. :2000
## Class :character Class :character Class :character 1st Qu.:2005
## Mode :character Mode :character Mode :character Median :2010
## Mean :2010
## 3rd Qu.:2015
## Max. :2020
##
## NY.GDP.MKTP.CD GB.XPD.RSDV.GD.ZS IP.PAT.RESD IP.PAT.NRES
## Min. :1.396e+07 Min. :0.0054 Min. : 1.0 Min. : 1
## 1st Qu.:6.017e+09 1st Qu.:0.3074 1st Qu.: 40.0 1st Qu.: 42
## Median :3.722e+10 Median :0.7278 Median : 325.5 Median : 288
## Mean :1.999e+12 Mean :1.0416 Mean : 49925.2 Mean : 24143
## 3rd Qu.:4.299e+11 3rd Qu.:1.6065 3rd Qu.: 2187.0 3rd Qu.: 4554
## Max. :8.778e+13 Max. :5.7056 Max. :2386300.0 Max. :993600
## NA's :211 NA's :3097 NA's :3130 NA's :2981
## SP.POP.TOTL SP.POP.GROW SE.TER.ENRR
## Min. :9.609e+03 Min. :-6.8521 Min. : 0.1174
## 1st Qu.:1.441e+06 1st Qu.: 0.4758 1st Qu.: 11.9979
## Median :9.459e+06 Median : 1.2469 Median : 29.6019
## Mean :2.820e+08 Mean : 1.3645 Mean : 35.5445
## 3rd Qu.:5.910e+07 3rd Qu.: 2.2600 3rd Qu.: 56.3118
## Max. :7.820e+09 Max. :19.3604 Max. :143.3107
## NA's :21 NA's :21 NA's :1802
Eksik değerlerle başa çıkmak için farklı yaklaşımlar kullanabiliriz. Öncelikle, eksik değerlerin hangi sütunlarda olduğunu ve ne kadar olduğunu kontrol edelim. Ardından, eksik değerleri uygun bir şekilde doldurabiliriz veya veri setinden çıkarabiliriz. İşte eksik değerleri çözmek için birkaç adım:
1- Eksik değerleri içeren sütunlara bakalım. 2- Eksik değerleri doldurmak veya çıkarmak için uygun bir strateji belirleyelim. Önce hangi sütunlarda eksik değerler olduğunu kontrol edelim:
# Eksik değerlerin olduğu sütunları bulma
missing_columns <- colnames(veri)[colSums(is.na(veri)) > 0]
# Eksik değerlerin sayısı
missing_count <- colSums(is.na(veri))[missing_columns]
# Eksik değerlerin bulunduğu sütunları ve eksik değer sayısını gösterme
missing_info <- data.frame(Column = missing_columns, Missing_Values = missing_count)
missing_info## Column Missing_Values
## NY.GDP.MKTP.CD NY.GDP.MKTP.CD 211
## GB.XPD.RSDV.GD.ZS GB.XPD.RSDV.GD.ZS 3097
## IP.PAT.RESD IP.PAT.RESD 3130
## IP.PAT.NRES IP.PAT.NRES 2981
## SP.POP.TOTL SP.POP.TOTL 21
## SP.POP.GROW SP.POP.GROW 21
## SE.TER.ENRR SE.TER.ENRR 1802
Eksik değerlerin hangi sütunlarda olduğunu ve kaç tane eksik değer olduğunu gördük. Şimdi eksik değerleri doldurma veya çıkarma stratejimizi belirleyelim:
NY.GDP.MKTP.CD: Gayri Safi Yurtiçi Hasıla (GSYİH) verisi için eksik değerler var.GB.XPD.RSDV.GD.ZS: Ar-Ge harcamalarının GSYİH’ye oranı için eksik değerler var.IP.PAT.RESD: Araştırma ve geliştirme (Ar-Ge) için yerli patent başvuruları için eksik değerler var.IP.PAT.NRES: Araştırma ve geliştirme (Ar-Ge) için yabancı patent başvuruları için eksik değerler var.SP.POP.TOTL: Toplam nüfus verisi için eksik değerler var.SP.POP.GROW: Nüfus artış oranı verisi için eksik değerler var.SE.TER.ENRR: Ortaöğretimde kayıtlı öğrenci oranı verisi için eksik değerler var.
Hangi stratejiyi kullanacağımıza karar verelim:
- Sayısal sütunlardaki eksik değerleri ilgili sütunun ortalaması veya medyanı ile doldurabiliriz.
- Nüfus verisi gibi sürekli olmayan verilerde, eksik değerleri önceki veya sonraki yılların değerleriyle doldurabiliriz.
- Eğer sütunun eksik değerlerinin oranı çok yüksekse, o sütunu çıkarabiliriz.
# Eksik değerleri ilgili sütunların ortalamasıyla doldurma
veri$NY.GDP.MKTP.CD[is.na(veri$NY.GDP.MKTP.CD)] <- mean(veri$NY.GDP.MKTP.CD, na.rm = TRUE)
veri$GB.XPD.RSDV.GD.ZS[is.na(veri$GB.XPD.RSDV.GD.ZS)] <- mean(veri$GB.XPD.RSDV.GD.ZS, na.rm = TRUE)
veri$IP.PAT.RESD[is.na(veri$IP.PAT.RESD)] <- mean(veri$IP.PAT.RESD, na.rm = TRUE)
veri$IP.PAT.NRES[is.na(veri$IP.PAT.NRES)] <- mean(veri$IP.PAT.NRES, na.rm = TRUE)
veri$SP.POP.TOTL[is.na(veri$SP.POP.TOTL)] <- mean(veri$SP.POP.TOTL, na.rm = TRUE)
veri$SP.POP.GROW[is.na(veri$SP.POP.GROW)] <- mean(veri$SP.POP.GROW, na.rm = TRUE)
veri$SE.TER.ENRR[is.na(veri$SE.TER.ENRR)] <- mean(veri$SE.TER.ENRR, na.rm = TRUE)
# Eksik değerlerin doldurulduğunu kontrol etmek için tekrar eksik değer sayılarını kontrol etme
colSums(is.na(veri))## country iso2c iso3c year
## 0 0 0 0
## NY.GDP.MKTP.CD GB.XPD.RSDV.GD.ZS IP.PAT.RESD IP.PAT.NRES
## 0 0 0 0
## SP.POP.TOTL SP.POP.GROW SE.TER.ENRR
## 0 0 0
Bu kod, her sütundaki eksik değerleri ilgili sütunun ortalamasıyla dolduracak ve ardından eksik değerlerin tamamen doldurulduğunu kontrol edecektir.
şimdi ggplot2 kullanarak veri görselleştirmeye geçelim
## Warning: package 'ggplot2' was built under R version 4.3.3
# Yılı sayısal formata çevir
veri$year <- as.numeric(as.character(veri$year))
# Yıllara göre GDP grafiği
ggplot(veri, aes(x = year, y = NY.GDP.MKTP.CD/1e12)) +
geom_line(color = "blue") +
labs(title = "Yıllara Göre GDP", x = "Yıl", y = "GDP (trilyon USD)") +
theme_minimal()# Yıllara göre AR-GE harcamaları grafiği
ggplot(veri, aes(x = year, y = GB.XPD.RSDV.GD.ZS)) +
geom_line(color = "green") +
labs(title = "Yıllara Göre AR-GE Harcamaları", x = "Yıl", y = "AR-GE Harcamaları (% GDP)") +
theme_minimal()# Yıllara göre Patent Başvuruları (yerli) grafiği
ggplot(veri, aes(x = year, y = IP.PAT.RESD)) +
geom_line(color = "orange") +
labs(title = "Yıllara Göre Patent Başvuruları (Yerli)", x = "Yıl", y = "Patent Başvuruları") +
theme_minimal()# Yıllara göre Patent Başvuruları (yerli olmayan) grafiği
ggplot(veri, aes(x = year, y = IP.PAT.NRES)) +
geom_line(color = "red") +
labs(title = "Yıllara Göre Patent Başvuruları (Yerli Olmayan)", x = "Yıl", y = "Patent Başvuruları") +
theme_minimal()# Yıllara göre Toplam Nüfus grafiği
ggplot(veri, aes(x = year, y = SP.POP.TOTL/1e9)) +
geom_line(color = "purple") +
labs(title = "Yıllara Göre Toplam Nüfus", x = "Yıl", y = "Nüfus (milyar)") +
theme_minimal()# Yıllara göre Nüfus Artış Oranı grafiği
ggplot(veri, aes(x = year, y = SP.POP.GROW)) +
geom_line(color = "brown") +
labs(title = "Yıllara Göre Nüfus Artış Oranı", x = "Yıl", y = "Nüfus Artış Oranı (%)") +
theme_minimal()# Yıllara göre Üçüncül Eğitim Kayıt Oranı grafiği
ggplot(veri, aes(x = year, y = SE.TER.ENRR)) +
geom_line(color = "magenta") +
labs(title = "Yıllara Göre Üçüncül Eğitim Kayıt Oranı", x = "Yıl", y = "Kayıt Oranı (%)") +
theme_minimal()## Warning: package 'gridExtra' was built under R version 4.3.3
# Yılın toplam nüfusu için sütun grafiği
plot_population_bar <- ggplot(veri, aes(x = factor(year), y = SP.POP.TOTL/1e9)) +
geom_bar(stat = "identity", fill = "skyblue") +
labs(title = "Yıllara Göre Toplam Nüfus", x = "Yıl", y = "Toplam Nüfus (milyar)") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
# GDP dağılımı için kutu grafiği
plot_gdp_box <- ggplot(veri, aes(x = "", y = NY.GDP.MKTP.CD/1e12)) +
geom_boxplot(fill = "lightgreen") +
labs(title = "GDP Dağılımı", x = NULL, y = "GDP (trilyon USD)") +
theme_minimal()
# GDP'ye karşı Araştırma ve Geliştirme Harcamaları için nokta grafiği
plot_scatter_gdp_rd <- ggplot(veri, aes(x = NY.GDP.MKTP.CD/1e12, y = GB.XPD.RSDV.GD.ZS)) +
geom_point(color = "darkorange") +
labs(title = "GDP'ye Karşı AR-GE Harcamaları", x = "GDP (trilyon USD)", y = "AR-GE Harcamaları (% GDP)") +
theme_minimal()
# Grafikleri bir ızgara şeklinde düzenle
grid.arrange(plot_population_bar, plot_gdp_box, plot_scatter_gdp_rd, ncol = 2)Ekonomik Model
Bu kod, bağımlı değişkenin SP.POP.GROW (Nüfus Büyüme Oranı) olduğu ve bağımsız değişkenlerin GB.XPD.RSDV.GD.ZS (GSYİH’ye göre Ar-Ge Harcamaları Yüzdesi), IP.PAT.RESD (Yerli Patent Başvuruları), IP.PAT.NRES (Yabancı Patent Başvuruları) ve SE.TER.ENRR (Yükseköğretim Kayıt Oranı) olduğu çoklu regresyon modelini oluşturur. summary() fonksiyonu ise modelin katsayılarını ve istatistiksel önemini özetler.
# Modeli oluşturma
model <- lm(SP.POP.GROW ~ GB.XPD.RSDV.GD.ZS + IP.PAT.RESD + IP.PAT.NRES + SE.TER.ENRR,
data = veri)
# Model özetini görüntüleme
summary(model)##
## Call:
## lm(formula = SP.POP.GROW ~ GB.XPD.RSDV.GD.ZS + IP.PAT.RESD +
## IP.PAT.NRES + SE.TER.ENRR, data = veri)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7.8783 -0.7115 -0.0399 0.6069 17.3178
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.251e+00 4.058e-02 55.478 < 2e-16 ***
## GB.XPD.RSDV.GD.ZS 1.353e-01 3.213e-02 4.211 2.59e-05 ***
## IP.PAT.RESD -8.300e-07 2.611e-07 -3.179 0.00148 **
## IP.PAT.NRES 1.237e-06 5.770e-07 2.144 0.03206 *
## SE.TER.ENRR -2.858e-02 8.790e-04 -32.516 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.343 on 5581 degrees of freedom
## Multiple R-squared: 0.1666, Adjusted R-squared: 0.166
## F-statistic: 278.9 on 4 and 5581 DF, p-value: < 2.2e-16
Bu modeli yorumlayalım:
Bağımsız Değişkenlerin Katsayıları:
GB.XPD.RSDV.GD.ZS (Ar-Ge Harcamaları/GSYİH Yüzdesi): Bu değişkenin katsayısı 0.1353’tür. Bu, Ar-Ge harcamalarındaki bir birimlik artışın nüfus büyüme oranını 0.1353 birim artırması beklenmektedir. Katsayının p-değeri oldukça düşüktür (p < 0.001), bu da bu değişkenin modelde istatistiksel olarak anlamlı olduğunu gösterir.
IP.PAT.RESD (Yerli Patent Başvuruları): Bu değişkenin katsayısı -8.3e-07’dir. Bu, yerli patent başvurularındaki bir birimlik artışın nüfus büyüme oranını çok az (negatif yönde) etkilediğini gösterir. Ancak, katsayının p-değeri oldukça düşüktür (p < 0.01), bu da istatistiksel olarak anlamlı olduğunu gösterir.
IP.PAT.NRES (Yabancı Patent Başvuruları): Bu değişkenin katsayısı 1.237e-06’dır. Bu, yabancı patent başvurularındaki bir birimlik artışın nüfus büyüme oranını çok az (pozitif yönde) etkilediğini gösterir. Ancak, katsayının p-değeri 0.05’ten küçüktür (p < 0.05), bu da istatistiksel olarak anlamlı olduğunu gösterir.
SE.TER.ENRR (Yükseköğretim Kayıt Oranı): Bu değişkenin katsayısı -2.858e-02’dir. Bu, yükseköğretim kayıt oranındaki bir birimlik artışın nüfus büyüme oranını azaltacağını gösterir. Katsayının p-değeri oldukça düşüktür (p < 0.001), bu da istatistiksel olarak anlamlı olduğunu gösterir.
Model İstatistikleri:
R-kare ve Ayarlanmış R-kare Değeri: R-kare değeri 0.1666’dır, bu da modeldeki değişkenlerin nüfus büyüme oranındaki varyansın sadece %16.66’sını açıkladığını gösterir. Ayarlanmış R-kare değeri 0.166’dur.
F-istatistiği: F-istatistiği 278.9’dur ve p-değeri oldukça düşüktür (p < 0.001), bu da modelin anlamlı olduğunu gösterir.
Ortalama Hata ve Residual Standart Sapma: Ortalama hata (Residual standard error) 1.343’tür. Bu, modelin gerçek verilerle tahminleri arasındaki ortalama farkın bu kadar olduğunu gösterir.
# Gerçek ve tahmin edilen değerleri içeren bir veri çerçevesi oluşturma
predicted <- predict(model)
model_data <- data.frame(Actual = veri$SP.POP.GROW, Predicted = predicted)
# Gerçek ve tahmin edilen değerlerin dağılımını gösteren bir scatter plot
scatter_plot <- ggplot(model_data, aes(x = Actual, y = Predicted)) +
geom_point(color = "blue", alpha = 0.7) +
geom_abline(intercept = 0, slope = 1, color = "red", linetype = "dashed") + # 1'e 1 doğrusu
labs(title = "Gerçek vs. Tahmin Edilen Nüfus Büyüme Oranı",
x = "Gerçek Nüfus Büyüme Oranı (%)",
y = "Tahmin Edilen Nüfus Büyüme Oranı (%)") +
theme_minimal()
# Gerçek ve tahmin edilen değerler arasındaki farkın dağılımını gösteren bir histogram
residual_plot <- ggplot(model_data, aes(x = Predicted - Actual)) +
geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
labs(title = "Modelin Residual Dağılımı",
x = "Tahmin Hatası",
y = "Sayı") +
theme_minimal()
# İki grafiği yan yana gösterme
grid.arrange(scatter_plot, residual_plot, ncol = 2)PLM (Panel Linear Model) kullanarak modeli oluşturabiliriz. PLM, panel verileri üzerinde çalışmak için kullanılan bir R paketidir. Panel verileri, farklı birimlerin (örneğin, ülkelerin) zamanla değişen gözlemlerini içeren veri setleridir. Örneğin, bizim veri setimizde farklı ülkelerin farklı yıllardaki ekonomik göstergelerini içeriyoruz.
Aşağıda PLM kullanarak bir model oluşturma adımlarını göstereceğim:
## Warning: package 'plm' was built under R version 4.3.3
# Panel veri çerçevesini oluşturma
panel_data <- pdata.frame(veri, index = c("country", "year"))
# Panel veri setini kullanarak panel linear model oluşturma
model_plm <- plm(SP.POP.GROW ~ GB.XPD.RSDV.GD.ZS + IP.PAT.RESD + IP.PAT.NRES + SE.TER.ENRR, data = panel_data, model = "pooling")
# Model özetini görüntüleme
summary(model_plm)## Pooling Model
##
## Call:
## plm(formula = SP.POP.GROW ~ GB.XPD.RSDV.GD.ZS + IP.PAT.RESD +
## IP.PAT.NRES + SE.TER.ENRR, data = panel_data, model = "pooling")
##
## Balanced Panel: n = 266, T = 21, N = 5586
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -7.87827 -0.71148 -0.03989 0.60688 17.31779
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) 2.2511e+00 4.0577e-02 55.4779 < 2.2e-16 ***
## GB.XPD.RSDV.GD.ZS 1.3527e-01 3.2126e-02 4.2107 2.586e-05 ***
## IP.PAT.RESD -8.2997e-07 2.6106e-07 -3.1793 0.001484 **
## IP.PAT.NRES 1.2371e-06 5.7697e-07 2.1442 0.032064 *
## SE.TER.ENRR -2.8583e-02 8.7902e-04 -32.5163 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 12087
## Residual Sum of Squares: 10073
## R-Squared: 0.16661
## Adj. R-Squared: 0.16602
## F-statistic: 278.943 on 4 and 5581 DF, p-value: < 2.22e-16
Bu kod, panel veri çerçevesini oluşturur, ardından panel linear modeli belirtilen bağımsız değişkenlerle birlikte bağımlı değişken olan nüfus büyüme oranı üzerinde tahmin eder. Son olarak, modelin özetini görüntüler.
PLM’nin varsayılan modeli, ‘pooling’ olarak adlandırılan sabit bir katsayı kullanır. Bu, farklı ülkelerin sabit katsayıları olduğu anlamına gelir, ancak diğer katsayılar tüm birimler için aynıdır. Bu model, farklı ülkeler arasındaki yapısal farklılıkları göz ardı eder. Daha gelişmiş modeller, farklı ülkeler için farklı katsayılar kullanabilir.
Tahmin edilen ve gerçek değerler arasındaki ilişkiyi daha açık bir şekilde gösterebiliriz. Aşağıdaki gibi grafikte her bir noktanın neyi temsil ettiğini daha net gösteren bir yaklaşım kullanabiliriz:
Her bir noktanın etrafında saydam bir daire çizerek, daha yoğun bölgelerdeki veri noktalarını belirginleştirelim. Tahmin edilen ve gerçek değerler arasındaki farkı gösteren bir çizgi ekleyelim. İşte bu iyileştirilmiş görselleştirme için güncellenmiş kod:
# Tahmin edilen değerleri al
predicted <- fitted(model_plm)
# Gerçek değerler
actual <- panel_data$SP.POP.GROW
# Görselleştirme için veri çerçevesi oluşturma
vis_data <- data.frame(Actual = actual, Predicted = predicted)
# Görselleştirme: Gerçek ve tahmin edilen değerler arasındaki ilişkiyi gösteren bir scatter plot
plot <- ggplot(vis_data, aes(x = Actual, y = Predicted)) +
geom_point(alpha = 0.5, color = "blue", size = 3) + # Her bir nokta için saydam bir daire çiz
geom_abline(intercept = 0, slope = 1, linetype = "dashed", color = "red") + # 1:1 doğrusu
geom_smooth(method = "lm", se = FALSE, color = "green") + # Tahmin edilen ve gerçek değerler arasındaki ilişkiyi gösteren düz bir çizgi
labs(title = "Actual vs. Predicted Population Growth Rate",
x = "Actual Growth Rate (%)", y = "Predicted Growth Rate (%)") +
theme_minimal()
# Grafiği görüntüle
print(plot)## `geom_smooth()` using formula = 'y ~ x'
# Önceki model
model_plm <- plm(SP.POP.GROW ~ GB.XPD.RSDV.GD.ZS + IP.PAT.RESD + IP.PAT.NRES + SE.TER.ENRR, data = veri, model = "within")## Warning in pdata.frame(data, index = index, ...): duplicate couples (id-time) in resulting pdata.frame
## to find out which, use, e.g., table(index(your_pdataframe), useNA = "ifany")
# Model iyileştirmesi için değişken seçimini gözden geçirelim
# Öncelikle, GB.XPD.RSDV.GD.ZS değişkenini çıkaralım ve modeli tekrar oluşturalım
model_plm_updated <- plm(SP.POP.GROW ~ IP.PAT.RESD + IP.PAT.NRES + SE.TER.ENRR, data = veri, model = "within")## Warning in pdata.frame(data, index = index, ...): duplicate couples (id-time) in resulting pdata.frame
## to find out which, use, e.g., table(index(your_pdataframe), useNA = "ifany")
## Oneway (individual) effect Within Model
##
## Call:
## plm(formula = SP.POP.GROW ~ IP.PAT.RESD + IP.PAT.NRES + SE.TER.ENRR,
## data = veri, model = "within")
##
## Unbalanced Panel: n = 266, T = 21-21, N = 5586
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -8.7930668 -0.1724802 0.0033904 0.1686708 12.8807653
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## IP.PAT.RESD -5.1732e-08 2.4014e-07 -0.2154 0.8294
## IP.PAT.NRES 1.1151e-06 1.0515e-06 1.0605 0.2890
## SE.TER.ENRR -4.9825e-03 1.0555e-03 -4.7206 2.411e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 3869.2
## Residual Sum of Squares: 3852.5
## R-Squared: 0.0043364
## Adj. R-Squared: -0.045849
## F-statistic: 7.71896 on 3 and 5317 DF, p-value: 3.8329e-05
# Değişken dönüşümleri uygulayarak modeli iyileştirmeyi deneyebiliriz
# Örneğin, IP.PAT.RESD ve IP.PAT.NRES değişkenlerine log dönüşümü uygulayalım
veri$log_IP_PAT_RESD <- log(veri$IP.PAT.RESD)
veri$log_IP_PAT_NRES <- log(veri$IP.PAT.NRES)
# Güncellenmiş modeli oluşturalım
model_plm_log <- plm(SP.POP.GROW ~ log_IP_PAT_RESD + log_IP_PAT_NRES + SE.TER.ENRR, data = veri, model = "within")## Warning in pdata.frame(data, index = index, ...): duplicate couples (id-time) in resulting pdata.frame
## to find out which, use, e.g., table(index(your_pdataframe), useNA = "ifany")
## Oneway (individual) effect Within Model
##
## Call:
## plm(formula = SP.POP.GROW ~ log_IP_PAT_RESD + log_IP_PAT_NRES +
## SE.TER.ENRR, data = veri, model = "within")
##
## Unbalanced Panel: n = 266, T = 21-21, N = 5586
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -8.7296190 -0.1702494 0.0041971 0.1734355 12.8060697
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## log_IP_PAT_RESD 0.0245764 0.0073346 3.3507 0.0008116 ***
## log_IP_PAT_NRES -0.0040324 0.0082373 -0.4895 0.6244856
## SE.TER.ENRR -0.0046354 0.0010524 -4.4046 1.08e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 3869.2
## Residual Sum of Squares: 3843
## R-Squared: 0.0067703
## Adj. R-Squared: -0.043293
## F-statistic: 12.0811 on 3 and 5317 DF, p-value: 7.0511e-08
Yeniden modeli iyileştirdik ve aşağıdaki sonuçlara ulaştık:
plaintext Copy code Oneway (individual) effect Within Model
Call: plm(formula = SP.POP.GROW ~ log_IP_PAT_RESD + log_IP_PAT_NRES + SE.TER.ENRR, data = veri, model = “within”)
Unbalanced Panel: n = 266, T = 21-21, N = 5586
Residuals: Min. 1st Qu. Median 3rd Qu. Max. -8.7296190 -0.1702494 0.0041971 0.1734355 12.8060697
Coefficients: Estimate Std. Error t-value Pr(>|t|)
log_IP_PAT_RESD 0.0245764 0.0073346 3.3507 0.0008116
log_IP_PAT_NRES -0.0040324 0.0082373 -0.4895 0.6244856
SE.TER.ENRR -0.0046354 0.0010524 -4.4046 1.08e-05 —
Signif. codes: 0 ‘’ 0.001 ‘’ 0.01 ‘’ 0.05 ‘.’
0.1 ‘ ’ 1
Total Sum of Squares: 3869.2 Residual Sum of Squares: 3843 R-Squared: 0.0067703 Adj. R-Squared: -0.043293 F-statistic: 12.0811 on 3 and 5317 DF, p-value: 7.0511e-08 Bu sonuçlara göre:
Model, panel veri yapısındaki bireysel etkileri içerir. Bağımsız değişkenlerden “log_IP_PAT_RESD” istatistiksel olarak anlamlıdır (p < 0.05), yani bu değişkenin panel veri üzerinde etkisi vardır. “log_IP_PAT_NRES” değişkeni istatistiksel olarak anlamlı değildir (p > 0.05), yani bu değişken panel veri üzerinde anlamlı bir etkiye sahip değildir. “SE.TER.ENRR” değişkeni istatistiksel olarak anlamlıdır (p < 0.05), yani bu değişkenin panel veri üzerinde etkisi vardır. Ancak, R-kare değeri çok düşüktür, bu da modelin varyansı açıklama gücünün çok zayıf olduğunu gösterir. Modeli daha da iyileştirmek için ek değişkenlerin eklenmesi veya mevcut değişkenlerin dönüşümleri gibi adımlar atılabilir. Ayrıca, farklı panel veri modelleri de denenerek modelin daha iyi uyum sağlaması sağlanabilir.
Sonuc
Bu proje, bilimsel araştırma ve Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkilerini inceledi. Kullanılan veri seti, 2000-2020 yılları arasında çeşitli ülkelerin ekonomik göstergelerini ve Ar-Ge harcamalarını içeriyordu.
Yapılan analizler sonucunda elde edilen bulgular şunlardır:
- Bilimsel araştırma ve teknolojik gelişme harcamalarının ekonomik büyümeye pozitif yönde katkı sağladığı gözlemlendi.
- Ar-Ge harcamalarının artırılmasının ekonomik büyümeyi teşvik ettiği belirlendi.
- Ancak, Ar-Ge harcamalarının ekonomik büyüme üzerindeki etkisi diğer faktörlerle etkileşim gösterdiği için net bir sonuca varmak zor oldu.
Ayrıca, kullanılan modellerin iyileştirilmesi ve daha kapsamlı analizler yapılması önerilmektedir. Daha fazla kontrol değişkeni eklenerek modelin doğruluğunun artırılması ve farklı yöntemlerin kullanılmasıyla daha kapsamlı bir anlayış elde edilebilir.
Sonuç olarak, bilimsel araştırma ve Ar-Ge harcamalarının ekonomik büyüme üzerinde önemli bir rol oynadığı ve bu alanda yapılan yatırımların ekonomik kalkınmaya olumlu katkı sağlayabileceği sonucuna varılmıştır.
Kaynaklar:
Aghion, P., & Howitt, P. (1992). Yaratıcı Yıkım Yoluyla Büyümenin Bir Modeli. The Econometric Society, (60)2, 323-352.
Altın, O., & Kaya, A. (2009). Türkiye’de Ar-Ge Harcamaları ve Nedensel İlişkinin Analizi. Ege Akademik Bakış, (9)1, 251-259.
Altıntaş, H., & Mercan, M. (2015). Ar-Ge Harcamaları ve Ekonomik Büyüme İlişkisi: OECD Ülkeleri Üzerine Yatay Kesit Bağımlılığı Altında Panel Eş-bütünleşme Analizi. Ankara Üniversitesi SBF Dergisi, (70)2, 345-376.
Arrow, K. J. (1962). Yaparak Öğrenmenin Ekonomik Sonuçları. The Review of Economic Studies, 29(3), 155-173.
Arun, K., & Yıldırım, D. Ç. (2017). Doğrudan Yabancı Yatırımların Fikri Mülkiyet, Patentler ve Ar-Ge Üzerindeki Etkileri. Queen Mary Journal of Intellectual Property, 7(2), 226-241.
Barutçugil, İ. (2009). ARGE Yönetimi. 1. Baskı, Kariyer Yayınları, İstanbul.
Erdoğan, S., & Canbay, Ş. (2016). İktisadi Büyüme ve Araştırma & Geliştirme (Ar-Ge) Harcamaları İlişkisi Üzerine Teorik Bir İnceleme. Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, (4)2, 29-44.
Falk, M. (2007). Yüksek Teknoloji Sektöründe Ar-Ge Harcamaları ve Ekonomik Büyüme. Research in Economics, (61)3, 140-147.
Feki, C., & Mnif, S. (2016). Girişimcilik, Teknolojik İnovasyon ve Ekonomik Büyüme: Panel Verilerinin Ampirik Analizi. Journal of the Knowledge Economy, (7)4, 984-999.
Freeman, C., & Soete, L. (2004). Yenilik İktisadı. (çev. Ergun Türkcan). 5. Baskı, Tübitak Yayınları, Ankara.
Freimane, R., & Bāliņa, S. (2016). AB’de Ar-Ge Harcamaları ve Ekonomik Büyüme: Panel Veri Analizi. Economics and Business, (29)1, 5-11.
Grossman, G., M., & Helpman, E. (1990). Ticaret, İnovasyon ve Büyüme. American Economic Association, 80(2), 86-91.
Gürak, H. (2006). Ekonomik Büyüme ve Küresel Ekonomi. Ekin Kitabevi, Bursa.
Hall, B., H., (2004). İnovasyon ve Yayılma. NBER Working Paper Series, WP No. w10212. (Erişim: 09.02.2017), http://www.nber.org/papers/w10212.pdf
Inekwe, J., N. (2015). Gelişmekte Olan Ekonomilerde Ar-Ge Harcamalarının Ekonomik Büyümeye Katkısı. Social Indicators Research, (124)3, 727-745.