library(readxl)
caso <- read_excel("~/Maestria Javeriana/Metodos y Simulacion estadistica/final/caso.xlsx")
View(caso)
attach(caso)
summary(caso)
## mes desempleo homicidios
## Min. : 1.00 Min. :10.06 Min. : 51.61
## 1st Qu.:10.75 1st Qu.:11.19 1st Qu.: 80.72
## Median :20.50 Median :11.99 Median :121.38
## Mean :20.50 Mean :11.98 Mean :134.61
## 3rd Qu.:30.25 3rd Qu.:12.65 3rd Qu.:176.94
## Max. :40.00 Max. :14.02 Max. :327.05
plot(desempleo, homicidios,pch=17)
#### Se puede evidenciar una relación directa entre los homicidios y desempleo, pero no podemos observar una relacion lineal entre ellos
cor(desempleo,homicidios)
## [1] 0.9608183
mod=lm(homicidios~desempleo)
summary(mod)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod)
#### siendo la relación no tan lineal es evidente que se podria realizar un ajuste de tipo exponencial como lo muestra su grafico, siendo que en el gráfico de normalidad, algunos datos se salen de la pendiente . La transformación sobre la variable dependiente para utilizar el algoritmo y volver estimar el modelo y lograr la normalidad de los datos
mod=lm(log(homicidios)~desempleo)
summary(mod)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
predict(mod,new = list(desempleo=11))
## 1
## 4.319804
exp(predict(mod,new = list(desempleo=11)))
## 1
## 75.17389