Se pretende estimar los gastos en alimentación de una familia (en soles) en base a la información que proporcionan las variables regresoras ingresos mensuales (en soles) y número de miembros de la familia. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se encuentran en el archivo PC1_RLM_ALIMENTACION.csv
[2 ptos] Lea los datos y presente el modelo de regresión estimado. Interprete los coeficientes de regresión. En caso no sea posible, indique el porqué
dato1=read.csv("PC1_RLM_ALIMENTACION.csv",sep=";")
library(broom)
colnames(dato1)
## [1] "Gasto" "Ingreso" "Miembros"
lm(Gasto ~ ., data = dato1) -> modelo
modelo |> summary()
##
## Call:
## lm(formula = Gasto ~ ., data = dato1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -78.332 -26.878 -6.974 35.460 77.461
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -73.97306 79.56525 -0.930 0.37084
## Ingreso 0.13113 0.01381 9.494 6.25e-07 ***
## Miembros 61.67628 15.10108 4.084 0.00151 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared: 0.8867, Adjusted R-squared: 0.8678
## F-statistic: 46.95 on 2 and 12 DF, p-value: 2.116e-06
\(\beta_0=-73.97306:\)Esta interpretación no es posible dado que carece de sentido porque el gasto no puede ser negativo, a pesar de no contar con miembros o ingresos.
\(\beta_1=0.13113:\) Por cada sol adicional de ingreso mensual, el gasto estimado se incrementa en 61.67628 soles, manteniendo los demás atributos en valores constantes.
\(\beta_2=61.67628\) Por cada miembro adicional en la familia, el gasto estimado se incrementa en 0.13113 soles, manteniendo los demás atributos en valores constantes.
[3 ptos] Presente el procedimiento para la prueba de hipótesis global, el cual debe incluir el planteamiento de la hipótesis, nivel de significancia, cuadro de ANVA, decisión estadística y conclusión.
\(H_0\) : \(\beta_1\) = \(\beta_2\) = 0
\(H_1\) : Al menos un \(\beta_j \neq\) 0
modelo |> summary()
##
## Call:
## lm(formula = Gasto ~ ., data = dato1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -78.332 -26.878 -6.974 35.460 77.461
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -73.97306 79.56525 -0.930 0.37084
## Ingreso 0.13113 0.01381 9.494 6.25e-07 ***
## Miembros 61.67628 15.10108 4.084 0.00151 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared: 0.8867, Adjusted R-squared: 0.8678
## F-statistic: 46.95 on 2 and 12 DF, p-value: 2.116e-06
#Niveles de significacia:
# 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
lm(Gasto ~ cbind(Ingreso,Miembros), data = dato1) -> modelo1
modelo1 |> aov() |> summary()
## Df Sum Sq Mean Sq F value Pr(>F)
## cbind(Ingreso, Miembros) 2 240013 120007 46.95 2.12e-06 ***
## Residuals 12 30670 2556
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Incluyendo nuevamente los niveles de significancia
Fcrit = qf(0.9,2,12)
Entonces el Fcal > Fcrit
Por ello no cae en la zona de rechazo.
Decision: Se mantiene la \(H_o\).
Ninguna de las variables tiene influencia lineas sobre la variable respuesta.
[3 ptos] ¿Se puede afirmar que por cada miembro adicional que tiene una familia, el gasto medio se incrementa en más de 60 soles?
\(H_o: \beta_2 \leq 60\)
\(H_1: \beta_2 > 60\)
\(\alpha = 0.05\)
lm(Gasto ~ Ingreso+Miembros, data = dato1) -> modeloB
modeloB |> summary()
##
## Call:
## lm(formula = Gasto ~ Ingreso + Miembros, data = dato1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -78.332 -26.878 -6.974 35.460 77.461
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -73.97306 79.56525 -0.930 0.37084
## Ingreso 0.13113 0.01381 9.494 6.25e-07 ***
## Miembros 61.67628 15.10108 4.084 0.00151 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared: 0.8867, Adjusted R-squared: 0.8678
## F-statistic: 46.95 on 2 and 12 DF, p-value: 2.116e-06
tcal = (61.67628-60)/15.10108
tcal
## [1] 0.111004
tcrit=qt(0.95,12)
tcrit
## [1] 1.782288
Entonces tcrit > tcal.
Por ello, cae en la zona del “No rechazo”.
Se concluye que no se puede afirmar que por cada miembro adicional que tiene una familia el gasto incrementa en 60 soles.