2025年度 経済データ分析演習B2
2025-11-22
出席登録は13:00から14:30まででに登録してください
出席番号
612398711
クラスコード
gsrnanuj
母集団回帰式(population regression)
母集団で想定される回帰式
\(y_i = \alpha^{\ast} + \beta^{\ast}x_i + \epsilon_i ~ (i = 1, \cdots, N)\)
標本回帰式(sample regression)
標本を用いて求められた回帰式
\(y_i = \alpha + \beta x_i + e_i ~ (i = 1, \cdots, n)\)
推定(estimation)(前回の復習)
母集団を特徴づける未知のパラメータ(母数、parameter)を標本から推測すること
回帰分析(regression analysis)
母集団で想定される回帰式を特徴づける未知のパラメータを標本を用いて求められた回帰式から推測すること
母集団回帰式:\(y_i = \alpha^{\ast} + \beta{\ast} x_i + \varepsilon_i ~ (i = 1, \cdots , N)\)
標本回帰式:\(y_i = \alpha + \beta x_i +e_i ~ (i = 1, \cdots, n)\)
標本サイズが十分に大きい場合には、次の関係が成立する
パラメータ
推定された標本回帰係数の期待値(平均)は、母集団の真のパラメータに等しくなる
\(E[\hat{\alpha}] = \alpha^{\ast}, ~ E[\hat{\beta}] = \beta^{\ast}\)
標準誤差(standard error, se)
\(SE_\hat{\alpha} = s_e \sqrt{\frac{1}{n} + \frac{\bar{x}^2}{\Sigma_{i=1}^n (x_i - \bar{x})^2}}, ~ SE_{\hat{\beta}} = \frac{s_e}{\sqrt{\Sigma_{i=1}^n (x_i - \bar{x})^2}}\)
標本回帰係数の標本分布は正規分布(normal distribudtion)となる
仮説検定 (hypothesis testing)
母集団に関するある仮説が、推定された値からと統計的に成り立つのか検証
仮説検定の論理
対立仮説\(H_1\)の正しさを主張するために、対立仮説とは反対の帰無仮説\(H_0\)の正しさを否定する
帰無仮説\(H_0:\beta = \beta_0\)
対立仮説\(H_1:\beta \neq \beta_0\)
\(\beta\)に関する標準化正規分布
\(H_0:\beta = 0\)
\(H_1:\beta \neq 0\)
有意水準(significant level)
帰無仮説が間違っている(棄却する)と判断できる基準となる確率
有意水準
重回帰分析:説明変数が2つ以上で被説明変数を説明する回帰式
\(y_i = \alpha + \beta_1 x_{1i} + \beta_2 x_{2i} + \cdots + \beta_k x_{ki} + e_i ~ (i = 1, 2, \cdots, n)\)
偏回帰係数(partial regression coefficient)
重回帰式において、j番目の偏回帰係数\(\beta_j\)は、他の変数を一定とした場合で、\(x_{ji}\)を1単位増やした場合の\(y\)の変化量を示す
自由度調整済み決定係数(adjusted coefficient of determination)
\(\bar{R^2} = 1 - \frac{n-1}{n-k} \frac{\Sigma_{i=1}^{n}\hat{u}_i^2}{\Sigma_{i=1}^{n}(y_i-\bar{y})^2}\)
\(y_i = \alpha + \beta x_i + \varepsilon_i\)
\(\beta\)はどんな値をとる?
Call:
lm(formula = con_consump ~ con_income, data = df)
Residuals:
Min 1Q Median 3Q Max
-9.0428 -1.8058 -0.2153 1.5779 23.5779
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.3877 0.4061 0.955 0.34
con_income 0.6034 0.0398 15.161 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.664 on 282 degrees of freedom
(13 observations deleted due to missingness)
Multiple R-squared: 0.4491, Adjusted R-squared: 0.4471
F-statistic: 229.9 on 1 and 282 DF, p-value: < 2.2e-16
Coefficients
\[ \begin{array}{rccccc} \hat{y}_i &= &0.388&+&0.603 x_i\\[-3pt] & & (0.406) & & (0.040)^{***} \end{array} \]
例:支出と収入の関係
「収入は正で有意水準0.1%で統計的に有意であり、収入が1万円増加すると、支出が約6,034円増加することがわかる」
Call:
lm(formula = Q62 ~ Q56, data = data)
Residuals:
Min 1Q Median 3Q Max
-94940 -24139 -12988 14316 274316
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17988.1 3471.5 5.182 4.08e-07 ***
Q56 769.6 297.4 2.588 0.0101 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 39000 on 295 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.0222, Adjusted R-squared: 0.01889
F-statistic: 6.699 on 1 and 295 DF, p-value: 0.01013
基本
所得の原データ
アルバイト所得の原データ
例)アルバイト時間(時間/週)
重回帰分析 (multiple regression analysis)
被説明変数\(y\)に対して、2つ以上の説明変数\(x\)を用いて回帰する
\[ \begin{equation} y_i = \alpha + \beta_1 x_{1i} + \beta_2 x_{2i} + \cdots + \beta_k x_{ki} + u_i \end{equation} \]
Call:
lm(formula = con_consump ~ con_income + dum_female, data = df)
Residuals:
Min 1Q Median 3Q Max
-9.1449 -1.7381 -0.3008 1.5157 23.6288
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.31608 0.44738 0.707 0.480
con_income 0.60551 0.04006 15.115 <2e-16 ***
dum_female 0.14061 0.43845 0.321 0.749
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.672 on 280 degrees of freedom
(14 observations deleted due to missingness)
Multiple R-squared: 0.4505, Adjusted R-squared: 0.4466
F-statistic: 114.8 on 2 and 280 DF, p-value: < 2.2e-16
講義課題(1):回帰分析をしてください
講義課題(2):回帰分析の結果をWordにまとめてください