Exploración de los Datos

Iniciamos la exploración de la variable del SMLV por medio de indicadores y graficos:

promedio=mean(Datos$smlm)
desviacion=sd(Datos$smlm)
data.frame(promedio,desviacion)
promedio desviacion
437078.6 129182.6
require(ggplot2)
## Loading required package: ggplot2
ggplot(Datos,aes(x=smlm))+geom_boxplot(fill="red")+theme_bw()

Podemos observar que existe un promedio de salario aproximado de 437.078 con una desviación de 129.182, y esperamos que parte de la variacion se explique con la inflación

## Graficamos la relacion salario vs Inflasion

ggplot(Datos,aes(x=inflacion,y=smlm))+geom_point()+theme_bw()+geom_smooth(method = "lm")
## `geom_smooth()` using formula 'y ~ x'

cor(Datos$inflacion,Datos$smlm)
## [1] -0.7086581

Se observa una relacion lineal inversa entre en smlv y la inflacion, indicando que a mayor inflacion menor smlm. Esta relación es media ya que el coeficiente de correlacion de pearson es de -0.7

Ajuste del modelo de regresión lineal

A continuacion ajustamos un modelo para la variable smlm en funcion de la inflación : \(smlm=\beta_0+\beta_1*inflacion\)

## Ajuste del modelo
mod=lm(smlm~inflacion,data=Datos)
mod
## 
## Call:
## lm(formula = smlm ~ inflacion, data = Datos)
## 
## Coefficients:
## (Intercept)    inflacion  
##      648486       -39489

Se observa que el modelo estimado nos arroja un valor de $_0=648486 el cual no tiene interpretacion ya que no se opbserva inflacion 0. mientras que el $_1=-39.489 nos indica que por cada 1 de aumento en la inflacion se disminuye el salario en 39.489

summary(mod)
## 
## Call:
## lm(formula = smlm ~ inflacion, data = Datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -75463 -63456 -42854  17623 263207 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   648486      58947   11.00  1.4e-08 ***
## inflacion     -39489      10151   -3.89  0.00145 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 94130 on 15 degrees of freedom
## Multiple R-squared:  0.5022, Adjusted R-squared:  0.469 
## F-statistic: 15.13 on 1 and 15 DF,  p-value: 0.00145

Se observa que el coeficiente de inflacion es significativo, indicando que la inflacion es una variable importante para explicar el valor de smlm, adicionalmente R2 nos indica que el modelo explica el 50,22% de la variacion del smlm

Predecir smlm en el modelo

## Para el siguiente año se requiere predecir el smlm si se tiene una inflacion de 3.5. se presenta un excenario pesimista y optimista para la predicion con un intervalo de confianza del 90%

predict(mod,list(inflacion=3.5),interval = "confidence",level = 0.9)
##        fit      lwr      upr
## 1 510273.3 458408.8 562137.8

Los resultados nos muestran que el valor medio estimado para el smlm del siguiente año seria de 510.273, en un escenario pesimista seria de 458.408 y el optimista seria de 562.137