Wooldridge Ekonometriye Giriş

Cilt 1 - Bölüm 2

Hüseyin Utku Demir

Karabük Üniversitesi, Dr. Öğr. Üy.

2022/10/12 (2022-10-12 tarihinde yenilendi)

Basit Regresyon Modeli

Wooldridge Kitap Ders Sunumu, Kitaptan alıntılanmıştır.

  • Basit regresyon modeli iki değişken arasındaki ilişkiyi incelemek için kullanılabilir.

  • y ve x bir anakütleyi temsil eden iki değişkendir.

  • Biz “y’yi x’e göre açıklama” ya da “y’nin x’teki değişmeler ile nasıl değiştiğini inceleme” ile ilgilenmekteyiz.

y’yi x’e göre açıklayacak model yazma

Üç sorun ile karşı karşıyayız.

  • İki değişken arasında hiçbir zaman tam bir ilişki olmadığından y’yi etkileyen diğer faktörleri nasıl hesaba katarız?

  • y ve x arasındaki fonksiyonel ilişki nasıldır?

  • y ve x arasında ceteris paribus bir ilişki yakaladığımızdan nasıl emin olabiliriz?

Basit regresyon modeli

\[ y = \beta_0 + \beta_1 x + u \]

  • y bağımlı değişken, açıklanan değişken, tepki değişkeni, öngörülen değiken veya bağlanan olarak adlandırılır.

  • x ise bağımsız değişken, açıklayıcı değişken, kontrol değişkeni, öngören değişken veya açıklayıcı olarak adlandırılmaktadır.

  • İlişkide hata terimi veya bozulma adı verilen \(u\) değişkeni, y’yi etkileyen x’ten başka diğer faktörleri temsil etmektedir.

Gözlemlenemeyeni temsil eden \(u\)

  • Basit bir regresyon analizi x’ten başka y’yi etkileyen tüm gözlemlenmeyen faktörleri etkin bir şekilde ele almaktadır. \(u\) gözlemlenmeyeni temsil eder.

\[ \Delta u = 0 \ \textrm{ise} \ \Delta y = \beta_1 \Delta x \]

Gözlemlenemeyeni temsil eden \(u\)

  • Bu denklem y ve x arasındaki fonksiyonel ilişki konusunu ele alır.

  • u’daki diğer faktörler sabit tutulursa, u’daki değişim sıfırdır, o halde x, y üzerinde doğrusal bir etkiye sahiptir.

Eğim parametresi ve Kesim parametresi

  • \(\beta_1\), y ve x arasındaki ilişkide eğim parametresi’dir

  • \(\beta_0\), sabit terim yada kesim parametresi olarak adlandırılır.

Örnek 2.1, Soya fasülyesi verimi

\[ yield = \beta_0 + \beta_1 fertilizer + u \]

  • Bu örnekteki, y değişkeni, yield (verim) ve x değişkeni fertilizer (gübre) dir.

  • Tarım araştırmacısı diğer faktörler sabit tutulurken gübrenin verim üzerindeki etkisi (\(\beta_1\)) ile ilgilenir.

  • Hata terimi \(u\), toprak kalitesi, yağış v.b. faktörleri içerir.

Örnek 2.2, Basit ücret denklemi

\[ wage = \beta_0 + \beta_1 educ + u \]

  • Eğer y değişkeni, wage (ücret) saat başına $ cinsinden , x değişkeni, educ (eğitim) alınan eğitim yılı cinsinden ölçülürse, \(\beta_1\), diğer tüm faktörler sabit tutulurken artı bir yıllık eğitimin saatlik ücret değişimini ölçer.

  • Bu faktörlerden bazıları, iş deneyimi, doğuştan gelen yetenek, görev süresi, iş ahlakı gibi sayısız diğer şeylerdir.

Koşullu sıfır ortalama varsayımı

  • Ücret örneğinde \(u\)’nun doğuştan gelen yetenek ile aynı olduğunu varsayalım.

  • Bu durumda yeteneğin ortalama düzeyi eğitim yılları ne olursa olsun olması gerekmektedir.

  • E(yetenek | 8), yani 8 yıllık eğitime sahip herkes için ortalama yetenek, E(yetenek | 16), yani 16 yıllık eğitime sahip herkes için ortalama yeteneğe eşit olmak zorundadır.

Koşullu sıfır ortalama varsayımı

  • Sadece 8 ve 16 için değil, aslında ortalama yetenek düzeyi, bütün eğitim düzeyleri için aynı olmalıdır.

  • Bu durumda E(u | x) = E(u) = 0 olur ve bu duruma koşullu sıfır ortalama varsayımı denilir.

  • Eğer ortalama yetenek, eğitim yılları için artıyorsa, yani ortalamada daha yetenekli insanlar daha eğitimli olmayı tercih ediyorlarsa, bu varsayım geçerliliğini kaybeder.

Koşullu sıfır ortalama varsayımı

  • Bu varsayım u’nun içinde olduğunu düşündüğümüz diğer gözlemlenemeyen ve kontrol edilmeyen değişkenler için de geçerlidir.

  • Basit regresyon analizine güvenmeden önce açıklığa kavuşturulması gereken en önemli konulardan biridir.

Sıradan En Küçük Kareler Tahminlerini Elde Etme

  • Sıradan En Küçük Kareler, SEKK (Ordinary Least Squares, OLS), \(\beta_0\) ve \(\beta_1\)’i tahmin etme.

\[ y_i = \beta_0 + \beta_1 x_i + u_i \]

  • Burada \(u_i\), i gözlem için hata terimidir ve \(x_i\) dışında, \(y_i\)’yi etkileyen diğer tüm faktörleri içerir.

  • İşlemler için, kitabınızın 28 ve 29. sayfalarına ve ders içinde yapılan hesaplamalara bakınız.

Örnek 2.3, CEO Maaşı ve Özsermaye Getirisi

  • Bu örnek uygulamasını yaparken R-studio kullanın ve açıklaması için sayfa 33’te bulunan örneği okuyun.

\[ salary = \beta_0 + \beta_1 roe + u \]

  • wooldridge veri setinde ceosal1 veri setini kullanın
library(wooldridge)
data("ceosal1")

Örnek 6.2 ceosal veri seti

library(rmarkdown)
paged_table(ceosal1)

Maaş (Salary) Ortalama, en küçük ve en büyük değerler

  • Ortalama maaş
mean(ceosal1$salary)
[1] 1281.12
  • En küçük ve en büyük maaş
min(ceosal1$salary)
[1] 223
max(ceosal1$salary)
[1] 14822

Özsermaye (roe) Ortalama, en küçük ve en büyük değerler

  • Ortalama özsermaye
mean(ceosal1$roe)
[1] 17.18421
  • En küçük ve en büyük özsermaye
min(ceosal1$roe)
[1] 0.5
max(ceosal1$roe)
[1] 56.3

Örnek 2.3 SEKK regresyon doğrusu

lm(salary ~ roe, data = ceosal1)

Call:
lm(formula = salary ~ roe, data = ceosal1)

Coefficients:
(Intercept)          roe  
      963.2         18.5  
  • roe 0 ise maaş 1000 dolar ile ölçüldüğünden, kesim parametresi \(bera_0\), 963,191 dolara eşit olur.

  • Özsermaye getirisi %1 puan artarsa, maaş 18,500 dolar değişecektir.

Tahmin (roe = 30 ise maaş ne olur?)

\[ \hat{salary} = 963,191 + 18,501 \cdot 30 = 1,518,221 \]

Örnek 2.4 Ücret ve Eğitim

  • Örneği okuyun (sayfa 34), rstudio ile örneği tekrarlayın, wage1 veri setini kullanın
data(wage1)
  • Ortalama ücret
mean(wage1$wage)
[1] 5.896103

Örnek 2.4 Ücret ve Eğitim

  • SEKK (ikinci yöntem)
lm(wage1$wage ~ wage1$educ)

Call:
lm(formula = wage1$wage ~ wage1$educ)

Coefficients:
(Intercept)   wage1$educ  
    -0.9049       0.5414  
  • Sekiz yıllık eğitim almış bir kişinin tahmini ücreti

\[ -0.90 + 0.54 \cdot (8) = 3.42 \]

Örnek 2.5 Oylama Sonuçları ve Kampanya Harcamaları

  • vote1 veri setini kullanın, örneği sayfa 35’den okuyun, tekrar edin.
data(vote1)
lm(vote1$voteA ~ vote1$shareA)

Call:
lm(formula = vote1$voteA ~ vote1$shareA)

Coefficients:
 (Intercept)  vote1$shareA  
     26.8122        0.4638  

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

  • model sonuçlarını daha önce almıştık

\[ \hat{salary} = 963,191 + 18,501 \cdot roe \]

  • tablonun roe değerlerini biliyoruz, ilk 15 ceo değeri, ilk 15 roe için bir veri seti oluşturalım ve adına roe_15 diyelim. Not: kodun içinde bulunan köşeli parantez, ilgili değişkenin kaç gözlemini almak istediğinizi yazacağınız yerdir.

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

roe_15 <- ceosal1$roe[1:15]
roe_15
 [1] 14.1 10.9 23.5  5.9 13.8 20.0 16.4 16.3 10.5 26.3 25.9 26.8 14.8 22.3 56.3

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

  • aynı işlemi tablonun ikinci sütunu salary için de yapalım ve adına salary_15 diyelim
salary_15 <- ceosal1$salary[1:15]
salary_15
 [1] 1095 1001 1122  578 1368 1145 1078 1094 1237  833  567  933 1339  937 2011
  • bu iki yeni değişkeni birleştirip tablo için veri seti oluşturalım ve adına Tablo2_2 diyelim. Not: cbind komutu, iki listeyi sütün olarak birleştirir. (cbind, column bind)

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

Tablo2_2 <- cbind(roe_15, salary_15)
Tablo2_2
      roe_15 salary_15
 [1,]   14.1      1095
 [2,]   10.9      1001
 [3,]   23.5      1122
 [4,]    5.9       578
 [5,]   13.8      1368
 [6,]   20.0      1145
 [7,]   16.4      1078
 [8,]   16.3      1094
 [9,]   10.5      1237
[10,]   26.3       833
[11,]   25.9       567
[12,]   26.8       933
[13,]   14.8      1339
[14,]   22.3       937
[15,]   56.3      2011

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

  • tablonun ilk iki satırını oluşturduk bu iki sütuna üçüncü sütunu yani salaryhat’i eklemeliyiz. Tahmin formülümüzle (betaları bildiğimiz için) üçüncü sütunu ekleyebiliriz.
salaryhat <- 963.191 + 18.501 * roe_15 

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

  • Tablonun 4. sütunu bulduğumuz tahminlerin gerçek salary değerinden farkını aldığımız uhat, yani hata terimini verecektir.
uhat <- salary_15 - salaryhat
  • bu dört sütunu aynı tabloda toplayabiriz
Tablo2_2 <- cbind(roe_15, salary_15, salaryhat, uhat)

Tablo 2.2 yi gösterelim

Örnek 2,6 İlk 15 CEO için teorik değerler ve artıklar tablosu

Tablo2_2 
      roe_15 salary_15 salaryhat        uhat
 [1,]   14.1      1095  1224.055 -129.055107
 [2,]   10.9      1001  1164.852 -163.851893
 [3,]   23.5      1122  1397.965 -275.964500
 [4,]    5.9       578  1072.347 -494.346902
 [5,]   13.8      1368  1218.505  149.495196
 [6,]   20.0      1145  1333.211 -188.211000
 [7,]   16.4      1078  1266.607 -188.607393
 [8,]   16.3      1094  1264.757 -170.757286
 [9,]   10.5      1237  1157.452   79.548500
[10,]   26.3       833  1449.767 -616.767286
[11,]   25.9       567  1442.367 -875.366893
[12,]   26.8       933  1459.018 -526.017786
[13,]   14.8      1339  1237.006  101.994196
[14,]   22.3       937  1375.763 -438.763286
[15,]   56.3      2011  2004.797    6.202714