#A.Construya un diagrama de dispersión. Comente este grÔfico

library(readxl)
caso <- read_excel("~/Unidad 3/caso.xlsx")
View(caso)

attach(caso)
plot(desempleo,homicidios,pch=16)

se evidencia que la realacion es directamente relacional entre variable desempleo y Homicidios

#B. Halle el coeficiente de correlación, interprete y determine si es significativo

cor(desempleo,homicidios)
## [1] 0.9608183

se evidencia un coeficiente de correlación cercano a 1 lo que indica que la relación entre el desempleo y la tasa de homicidios es fuerte

#C. Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo

mod = lm(homicidios~desempleo)
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

se puede identificar que por cada incremento de un 1% se esta incrementando se obtiene 63 casos de homicidios por cada 100 mil habitantes.

el coeficiente de correlación es de gran significancia.

adicionalmente el R2 del modelo logra explicar en un 92% a la variable homicidios.

#D.Valide los supuestos del modelo

par(mfrow=c(2,2))
plot(mod)

se identifica que el supuesto de aleatoriedad de los errores no se esta cumpliendo, por lo tanto se aplica la siguiente tranformación

mod = lm(log(homicidios)~desempleo)
summary(mod)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod)

se observa que mejora la aleatoriedad de los residuales e incluso la normalidad . es impor tante destacar que el R2 logra del modelo logra explicar en un 99% a la variable homicidios.

#E. Estime la tasa de homicidios para la eventualidad en la que el gobierno logre disminuir el desempleo a un nivel de 11%.

exp(predict(mod, newdata = list(desempleo=11)))
##        1 
## 75.17389

si el desempleo se lograra disminuir se espera que los homicicios sean de 75 por cada 100 mil habitantes