¿De que trata el trabajo?

Por medio de la regresion lineal multiple explicada la anterior clase se hizo este trabajo, usando de base un dataframe con regiones de Peru donde se analizara la relacion entre el producto bruto interno real (variable 1), el Producto Interno Bruto per capita (variable 2) y el gasto real por hogar mensual (variable 5). Esto con el objetivo de encontrar el PIB Real total.

Ejecucion del trabajo

##  num [1:24] 2833 17632 2628 23656 5332 ...
##  - attr(*, "label")= chr "Producto Bruto Interno real"
##  - attr(*, "format.spss")= chr "F28.2"
##  - attr(*, "display_width")= int 12
##  num [1:24] 6704 15350 5728 18378 7742 ...
##  - attr(*, "label")= chr "Producto Bruto Interno real per cápita"
##  - attr(*, "format.spss")= chr "F18.2"
##  - attr(*, "display_width")= int 14
##  num [1:24] 1112 1430 898 1572 927 ...
##  - attr(*, "label")= chr "Gasto real por hogar mensual"
##  - attr(*, "format.spss")= chr "F19.2"
##  - attr(*, "display_width")= int 14

Estos son los 2 vectores a usar, extraidas del dataframe COMPETITIVIDAD, extraida directamente del github del video mostrado el anterior jueves.

Se uso la funcion str() para ver el contenido de cada uno de los vectores, teniendo cada una 24 valores y corresponden con lo que se planea hacer.

## 
##  Pearson's product-moment correlation
## 
## data:  var1 and var5
## t = 3.6449, df = 22, p-value = 0.001428
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2793505 0.8152126
## sample estimates:
##       cor 
## 0.6136011

Por medio de la funcion cor.test nos damos cuenta que existe una relacion lineal ya que el P-Value es menor a 0.05 siendo 0.001428, rechazando la hipotesis nula y ademas el coeficiente al ser 0.6136011 significa que al aumentar el consumo de los hogares osea consumo privado, por naturaleza del PIB Real, este tambien aumenta ya que este aumento de gastos en la casa representa un aumento en la economia del pais.

Este grafico representa la relacion anteriormente mencionada,aunque no sea tan clara la relacion de manera visual, el comando cor.test ayuda a demostrar que si existe.

## 
## Call:
## lm(formula = var1 ~ var2 + var5)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -54917 -15676  -4998  16605 122993 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept) -7.753e+04  2.753e+04  -2.817  0.01033 * 
## var2        -4.646e-01  8.895e-01  -0.522  0.60695   
## var5         7.395e+01  2.142e+01   3.452  0.00239 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 34890 on 21 degrees of freedom
## Multiple R-squared:  0.3845, Adjusted R-squared:  0.3259 
## F-statistic: 6.559 on 2 and 21 DF,  p-value: 0.006122

Como se puede ver en los comandos de arriba, en el F-statistic y P-value al ser menor que 0.05 siendo 0.006122 indica que el modelo es totalmente valido por lo que es funcional.

El R cuadrado ajustado indica que al ser 0.3259 implica que el modelo explica el 32% de la variable de gasto real por hogar, un valor muy reducido y no tan confiable.

En la parte de coeficientes se ve como la variable de Producto Interno Bruto per capita es mayor a 0.05 por lo tanto esta entraria en conflicto con la validez del modelo, por lo tanto no aportaria.

##   (Intercept)          var2          var5 
## -77534.084340     -0.464571     73.949222
## [1] "PBI Real Total = −77534.08 − 0.46 (PBI real percapita) + 73.95 (Gasto real por hogar mensual)"

Lo visto arriba es el uso de los coeficientes para crear una ecuacion con la cual calcular el PBI total real donde es necesario un valor de PBI real percapita y otro de Gasto real por hogar mensual para terminar de darle forma al modelo, pese a que la validez del modelo sea cuestionable.

Ahora si queremos determinar el PBI Real Total donde el valor del PBI real percapita es de 20000 dolares y el del Gasto real por hogar mensual es de 2500 dolares tenemos un resultado que es:

## [1] -812659

Al ser un valor negativo podemos darnos cuenta de que en realidad el PIB esta decreciendo debido a que los hogares no compran lo suficiente y la economia esta decayendo, en todo caso este valor puede ser debido a la invalidez anteriormente mencionada en la regresion lineal multiple, siendo algo que no se tomaria tanto en cuenta a diferencia de otros modelos que posean valores que si cumplan con las condiciones de validez.