This version: 2025-06-29
Titleは、R11などのように、適当な番号を入れること。
保存するファイルの名前は、R11などのように、適当な番号を入れること。
library(wooldridge)
data("jtrain")
library(wooldridge)
data("jtrain")
このデータは、以下の論文に基づいている。
From H. Holzer, R. Block, M. Cheatham, and J. Knott (1993), Are Training Subsidies Effective? The Michigan Experience, Industrial and Labor Relations Review 46, 625-636.
\(year:\) 1987, 1988, or 1989
\(union:\) もし労働組合に加入している場合は1、そうでない場合は0
\(lscrap:\) 100アイテムあたりのスクラップ率の対数値
\(hrsemp:\) (総トレーニング時間) / (トレーニングを受けた従業員数)
\(lsales:\) 年間売上の対数値
\(lemploy:\) 従業員数の対数値
最初に、subset
関数を使用して、1987年の観測値で、労働組合に加入していない観測値のみとする。同時に、select
引数を使用して、関心のある変数のみとする。
jtrain_subset <- subset(jtrain, subset = (year == 1987 & union == 0),
select = c(year, union, lscrap, hrsemp, lsales, lemploy))
ここでは、線形モデルを用いて、hrsemp
(総トレーニング時間/トレーニングを受けた従業員数)、lsales
(年間売上の対数値)、およびlemploy
(従業員数の対数値)を、lscrap
(スクラップ率の対数値)に対して回帰する。
推定式は、以下の通りである。
\[lscrap = \alpha + \beta_1 hrsemp + \beta_2 lsales + \beta_3 lemploy\]
コードは、以下の通りである。
linear_model <- lm(lscrap ~ hrsemp + lsales + lemploy, data = jtrain_subset)
以下のコードで回帰結果を表示する:
summary(linear_model)
##
## Call:
## lm(formula = lscrap ~ hrsemp + lsales + lemploy, data = jtrain_subset)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.6301 -0.7523 -0.4016 0.8697 2.8273
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.45837 5.68677 2.191 0.0380 *
## hrsemp -0.02927 0.02280 -1.283 0.2111
## lsales -0.96203 0.45252 -2.126 0.0436 *
## lemploy 0.76147 0.40743 1.869 0.0734 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.376 on 25 degrees of freedom
## (97 observations deleted due to missingness)
## Multiple R-squared: 0.2624, Adjusted R-squared: 0.1739
## F-statistic: 2.965 on 3 and 25 DF, p-value: 0.05134
hrsemp
の係数は、統計的に有意ではなく、総トレーニング時間がスクラップ率に与える影響は統計的に有意ではないことを示す。