This version: 2025-06-29


1 はじめに

2 Rマークダウンファイルの生成は以下の通り。

2.1 Step 1

  • イメージ:

2.2 Step 2

Titleは、R11などのように、適当な番号を入れること。

  • イメージ:

2.3 Step 3

  • イメージ:

2.4 Step 4

保存するファイルの名前は、R11などのように、適当な番号を入れること。

  • イメージ:

3 データの読み込み

  • wooldridgeパッケージを読み込む: library(wooldridge)
  • “jtrain”データセットを読み込む: data("jtrain")
library(wooldridge)
data("jtrain")

このデータは、以下の論文に基づいている。

From H. Holzer, R. Block, M. Cheatham, and J. Knott (1993), Are Training Subsidies Effective? The Michigan Experience, Industrial and Labor Relations Review 46, 625-636.

3.1 変数の説明

\(year:\) 1987, 1988, or 1989

\(union:\) もし労働組合に加入している場合は1、そうでない場合は0

\(lscrap:\) 100アイテムあたりのスクラップ率の対数値

  • 製造された製品100個のうち、不良として廃棄されたものの数(率)であり、製造品質や生産効率の指標

\(hrsemp:\) (総トレーニング時間) / (トレーニングを受けた従業員数)

\(lsales:\) 年間売上の対数値

\(lemploy:\) 従業員数の対数値

4 データの準備

最初に、subset関数を使用して、1987年の観測値で、労働組合に加入していない観測値のみとする。同時に、select引数を使用して、関心のある変数のみとする。

jtrain_subset <- subset(jtrain, subset = (year == 1987 & union == 0),
                        select = c(year, union, lscrap, hrsemp, lsales, lemploy))

5 多変量線形回帰モデルの推定

6 推定式

ここでは、線形モデルを用いて、hrsemp(総トレーニング時間/トレーニングを受けた従業員数)、lsales(年間売上の対数値)、およびlemploy(従業員数の対数値)を、lscrap(スクラップ率の対数値)に対して回帰する。

推定式は、以下の通りである。

\[lscrap = \alpha + \beta_1 hrsemp + \beta_2 lsales + \beta_3 lemploy\]

6.1 推定コード

コードは、以下の通りである。

linear_model <- lm(lscrap ~ hrsemp + lsales + lemploy, data = jtrain_subset)

6.2 推定結果の表示

以下のコードで回帰結果を表示する:

summary(linear_model)
## 
## Call:
## lm(formula = lscrap ~ hrsemp + lsales + lemploy, data = jtrain_subset)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.6301 -0.7523 -0.4016  0.8697  2.8273 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept) 12.45837    5.68677   2.191   0.0380 *
## hrsemp      -0.02927    0.02280  -1.283   0.2111  
## lsales      -0.96203    0.45252  -2.126   0.0436 *
## lemploy      0.76147    0.40743   1.869   0.0734 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.376 on 25 degrees of freedom
##   (97 observations deleted due to missingness)
## Multiple R-squared:  0.2624, Adjusted R-squared:  0.1739 
## F-statistic: 2.965 on 3 and 25 DF,  p-value: 0.05134

7 結果の解釈

  • hrsempの係数は、統計的に有意ではなく、総トレーニング時間がスクラップ率に与える影響は統計的に有意ではないことを示す。

8 参考文献