ödev2

discrim verileri

library(wooldridge)

data("discrim")

mean(discrim$prpblck)

## [1] NA

sd(discrim$prpblck)

## [1] NA

mean(discrim$income)

## [1] NA

sd(discrim$income)

## [1] NA

sum(is.na(discrim$prpblck))

## [1] 1

sum(is.na(discrim$income))

## [1] 1

mean(discrim$prpblck,na.rm = TRUE)

## [1] 0.1134864

sd(discrim$prpblck,na.rm = TRUE)

## [1] 0.1824165

mean(discrim$income, na.rm = TRUE)

## [1] 47053.78

sd(discrim$income, na.rm = TRUE)

## [1] 13179.29

Kısıtsız Model

kisitsiz_model <- lm(psoda~prpblck+income, data = discrim)

summary(kisitsiz_model)

## 
## Call:
## lm(formula = psoda ~ prpblck + income, data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.29401 -0.05242  0.00333  0.04231  0.44322 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 9.563e-01  1.899e-02  50.354  < 2e-16 ***
## prpblck     1.150e-01  2.600e-02   4.423 1.26e-05 ***
## income      1.603e-06  3.618e-07   4.430 1.22e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08611 on 398 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.06422,    Adjusted R-squared:  0.05952 
## F-statistic: 13.66 on 2 and 398 DF,  p-value: 1.835e-06

Kısıtlı Model

kisitli_model <- lm(psoda~prpblck, data = discrim)

summary(kisitli_model)

## 
## Call:
## lm(formula = psoda ~ prpblck, data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.30884 -0.05963  0.01135  0.03206  0.44840 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.03740    0.00519  199.87  < 2e-16 ***
## prpblck      0.06493    0.02396    2.71  0.00702 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.0881 on 399 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.01808,    Adjusted R-squared:  0.01561 
## F-statistic: 7.345 on 1 and 399 DF,  p-value: 0.007015

Kısıtsız R kare: 0.05952 Kısıtlı R kare: 0.01561

(0.05952-0.01561)/(1-0.05952)

## [1] 0.04668892

logkisitsiz_model <- lm(log(psoda)~prpblck+log(income), data = discrim)

summary(logkisitsiz_model)

## 
## Call:
## lm(formula = log(psoda) ~ prpblck + log(income), data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.33563 -0.04695  0.00658  0.04334  0.35413 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.79377    0.17943  -4.424 1.25e-05 ***
## prpblck      0.12158    0.02575   4.722 3.24e-06 ***
## log(income)  0.07651    0.01660   4.610 5.43e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.0821 on 398 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.06809,    Adjusted R-squared:  0.06341 
## F-statistic: 14.54 on 2 and 398 DF,  p-value: 8.039e-07

paste( (0.2*100)*0.122, "yüzdelik artış")

## [1] "2.44 yüzdelik artış"

logdiscrimregprpov <- lm(log(psoda)~prpblck+log(income)+prppov, data = discrim)

summary(logdiscrimregprpov)

## 
## Call:
## lm(formula = log(psoda) ~ prpblck + log(income) + prppov, data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.32218 -0.04648  0.00651  0.04272  0.35622 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.46333    0.29371  -4.982  9.4e-07 ***
## prpblck      0.07281    0.03068   2.373   0.0181 *  
## log(income)  0.13696    0.02676   5.119  4.8e-07 ***
## prppov       0.38036    0.13279   2.864   0.0044 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08137 on 397 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.08696,    Adjusted R-squared:  0.08006 
## F-statistic:  12.6 on 3 and 397 DF,  p-value: 6.917e-08

cor(log(discrim$income), discrim$prppov, use = "complete.obs")

## [1] -0.838467

psoda: orta boy soda fiyatı, 1. dalga pfries: küçük boy patates kızartması fiyatı, 1. dalga pentree: ana yemek (burger veya tavuk) fiyatı, 1. dalga wagest: başlangıç ücreti, 1. dalga nmgrs: yönetici sayısı, 1. dalga nregs: kasa sayısı, 1. dalga hrsopen: açık kalma saatleri, 1. dalga emp: çalışan sayısı, 1. dalga psoda2: orta boy soda fiyatı, 2. dalga pfries2: küçük boy patates kızartması fiyatı, 2. dalga pentree2: ana yemek fiyatı, 2. dalga wagest2: başlangıç ücreti, 2. dalga nmgrs2: yönetici sayısı, 2. dalga nregs2: kasa sayısı, 2. dalga hrsopen2: açık kalma saatleri, 2. dalga emp2: çalışan sayısı, 2. dalga compown: şirket sahipliğinde olan (1 ise) chain: zincir (BK = 1, KFC = 2, Roy Rogers = 3, Wendy’s = 4) density: nüfus yoğunluğu, kasaba crmrte: suç oranı, kasaba state: eyalet (NJ = 1, PA = 2) prpblck: siyah nüfus oranı, posta kodu prppov: yoksulluk oranı, posta kodu prpncar: arabası olmayanların oranı, posta kodu hseval: ortalama konut değeri, posta kodu nstores: mağaza sayısı, posta kodu income: ortalama aile geliri, posta kodu county: ilçe etiketi lpsoda: log(orta boy soda fiyatı) lpfries: log(küçük boy patates kızartması fiyatı) lhseval: log(ortalama konut değeri) lincome: log(ortalama gelir) ldensity: log(nüfus yoğunluğu) NJ: New Jersey için 1 BK: Burger King için 1 KFC: Kentucky Fried Chicken için 1 RR: Roy Rogers için 1 Notlar Ortak bir final projesi atamak istiyorsanız bu iyi bir veri seti olacaktır. Pek çok olası bağımlı değişken vardır, yani çeşitli fast-food ürünlerinin fiyatları. Temel değişken, yoksulluk, gelir, konut değerleri vb. kontrollerin yanı sıra nüfusun siyah olan kısmıdır. Bu veriler aynı zamanda David Card ve Alan Krueger’in asgari ücretin istihdam üzerindeki etkilerinin tahminine ilişkin ünlü çalışmasında da kullanılmıştır. Ayrıntılı bir analiz için Card ve Krueger’in Myth and Measurement, 1997, Princeton University Press adlı kitabına bakın.

David Card ve Alan B. Krueger, asgari ücretle ilgili çığır açıcı araştırmalarıyla ulusal haberlere konu oldular. Burada, daha yüksek asgari ücretlerin düşük ücretli işçiler için işleri azalttığı yönündeki geleneksel görüşe karşı güçlü bir yeni meydan okuma sunuyorlar. Kamu politikası ve ekonomik araştırmanın yönü için önemli çıkarımları olan bir çalışmada yazarlar, 1992’de New Jersey’deki asgari ücret artışı, 1988’de Kaliforniya’daki asgari ücret artışı ve 1990-91’de federal asgari ücret artışları dahil olmak üzere bir dizi yakın tarihli olaydan alınan verileri kullanarak standart ekonomik teoriyi teste tabi tutuyorlar. Her durumda, asgari ücretteki artışların ücretlerde artışa yol açtığını, ancak işlerde kayba yol açmadığını gösteren bir dizi kanıt sunuyorlar.

Card ve Krueger’in araştırmasının ayırt edici bir özelliği, bazı işçiler için asgari ücret arttığında ancak diğerleri için artmadığında oluşan “tedavi” ve “kontrol” grupları arasındaki karşılaştırmalar da dahil olmak üzere, doğa bilimlerinden ödünç alınan ampirik yöntemlerin kullanılmasıdır. Ek olarak, yazarlar asgari ücret hakkındaki önceki literatürü eleştirel bir şekilde yeniden inceliyor ve bunun da daha yüksek bir asgari ücretin işleri azalttığı iddiasını desteklemediğini buluyorlar. Son olarak, asgari ücretin aile kazançları, yoksulluk sonuçları ve düşük ücretli işverenlerin borsa değerlemesi üzerindeki etkileri belgeleniyor. Genel olarak, bu kitap asgari ücret hakkındaki ekonomistlerin düşüncesine hakim olan işgücü piyasasının standart modelini sorguluyor. Ayrıca, Washington’da ve ülke genelindeki eyalet meclislerinde asgari ücret hakkındaki tartışmanın terimlerini değiştirecek.

Regresyon

model <- lm(psoda~prpblck+prppov+income, data = discrim)

summary(model)

## 
## Call:
## lm(formula = psoda ~ prpblck + prppov + income, data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.28891 -0.05253  0.00210  0.03965  0.44514 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 9.278e-01  2.799e-02  33.147  < 2e-16 ***
## prpblck     8.888e-02  3.210e-02   2.769  0.00588 ** 
## prppov      1.575e-01  1.138e-01   1.384  0.16708    
## income      2.032e-06  4.763e-07   4.266 2.49e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08602 on 397 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.06871,    Adjusted R-squared:  0.06168 
## F-statistic: 9.764 on 3 and 397 DF,  p-value: 3.145e-06

Değişkenlerin arasında pozitif yönlü ir ilişki yoktur.

F Testi

result <- lm(psoda~prpblck+prppov+income, data=discrim)

summary(result)

## 
## Call:
## lm(formula = psoda ~ prpblck + prppov + income, data = discrim)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.28891 -0.05253  0.00210  0.03965  0.44514 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 9.278e-01  2.799e-02  33.147  < 2e-16 ***
## prpblck     8.888e-02  3.210e-02   2.769  0.00588 ** 
## prppov      1.575e-01  1.138e-01   1.384  0.16708    
## income      2.032e-06  4.763e-07   4.266 2.49e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08602 on 397 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.06871,    Adjusted R-squared:  0.06168 
## F-statistic: 9.764 on 3 and 397 DF,  p-value: 3.145e-06

P değeri 0.5’ten büyük olduğu için değişkenler arasında anlamlı bir fark yoktur.