Se pretende estimar los gastos en alimentación de una familia (en soles) en base a la información que proporcionan las variables regresoras ingresos mensuales (en soles) y número de miembros de la familia. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se encuentran en el archivo PC1_RLM_ALIMENTACION.csv

[2 ptos] Lea los datos y presente el modelo de regresión estimado. Interprete los coeficientes de regresión. En caso no sea posible, indique el porqué

dato1=read.csv("PC1_RLM_ALIMENTACION.csv",sep=";")

library(broom)
colnames(dato1)
## [1] "Gasto"    "Ingreso"  "Miembros"
lm(Gasto ~ ., data = dato1) -> modelo
modelo |> summary()
## 
## Call:
## lm(formula = Gasto ~ ., data = dato1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -78.332 -26.878  -6.974  35.460  77.461 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -73.97306   79.56525  -0.930  0.37084    
## Ingreso       0.13113    0.01381   9.494 6.25e-07 ***
## Miembros     61.67628   15.10108   4.084  0.00151 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared:  0.8867, Adjusted R-squared:  0.8678 
## F-statistic: 46.95 on 2 and 12 DF,  p-value: 2.116e-06

INTERPRETACIÓN:

\(\beta_0=-73.97306:\)Esta interpretación no es posible dado que carece de sentido porque el gasto no puede ser negativo, a pesar de no contar con miembros o ingresos.

\(\beta_1=0.13113:\) Por cada sol adicional de ingreso mensual, el gasto estimado se incrementa en 61.67628 soles, manteniendo los demás atributos en valores constantes.

\(\beta_2=61.67628\) Por cada miembro adicional en la familia, el gasto estimado se incrementa en 0.13113 soles, manteniendo los demás atributos en valores constantes.

[3 ptos] Presente el procedimiento para la prueba de hipótesis global, el cual debe incluir el planteamiento de la hipótesis, nivel de significancia, cuadro de ANVA, decisión estadística y conclusión.

Panteamiento de la hipotesis

\(H_0\) : \(\beta_1\) = \(\beta_2\) = 0

\(H_1\) : Al menos un \(\beta_j \neq\) 0

Nivel de significancia

modelo |> summary()
## 
## Call:
## lm(formula = Gasto ~ ., data = dato1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -78.332 -26.878  -6.974  35.460  77.461 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -73.97306   79.56525  -0.930  0.37084    
## Ingreso       0.13113    0.01381   9.494 6.25e-07 ***
## Miembros     61.67628   15.10108   4.084  0.00151 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared:  0.8867, Adjusted R-squared:  0.8678 
## F-statistic: 46.95 on 2 and 12 DF,  p-value: 2.116e-06
#Niveles de significacia:  
# 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Cuadro de Anva

lm(Gasto ~ cbind(Ingreso,Miembros), data = dato1) -> modelo1
modelo1 |> aov() |> summary()
##                          Df Sum Sq Mean Sq F value   Pr(>F)    
## cbind(Ingreso, Miembros)  2 240013  120007   46.95 2.12e-06 ***
## Residuals                12  30670    2556                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Incluyendo nuevamente los niveles de significancia

Decision estadistica

Fcrit = qf(0.9,2,12)

Entonces el Fcal > Fcrit

Por ello no cae en la zona de rechazo.

Decision: Se mantiene la \(H_o\).

Conclusion

Ninguna de las variables tiene influencia lineas sobre la variable respuesta.

[3 ptos] ¿Se puede afirmar que por cada miembro adicional que tiene una familia, el gasto medio se incrementa en más de 60 soles?

\(H_o: \beta_2 \leq 60\)

\(H_1: \beta_2 > 60\)

\(\alpha = 0.05\)

lm(Gasto ~ Ingreso+Miembros, data = dato1) -> modeloB
modeloB |> summary()
## 
## Call:
## lm(formula = Gasto ~ Ingreso + Miembros, data = dato1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -78.332 -26.878  -6.974  35.460  77.461 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -73.97306   79.56525  -0.930  0.37084    
## Ingreso       0.13113    0.01381   9.494 6.25e-07 ***
## Miembros     61.67628   15.10108   4.084  0.00151 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 50.56 on 12 degrees of freedom
## Multiple R-squared:  0.8867, Adjusted R-squared:  0.8678 
## F-statistic: 46.95 on 2 and 12 DF,  p-value: 2.116e-06
tcal = (61.67628-60)/15.10108
tcal
## [1] 0.111004
tcrit=qt(0.95,12)
tcrit
## [1] 1.782288

Entonces tcrit > tcal.

Por ello, cae en la zona del “No rechazo”.

Se concluye que no se puede afirmar que por cada miembro adicional que tiene una familia el gasto incrementa en 60 soles.