###1. Construya el diagrama de dispersión y comente este gráfico Posible hipótesis: a mayor desempleo se espera que la violencia sea más alta - relación directa o positiva.

library(readxl)
Desemp_Violencia <- read_excel("~/Desemp_Violencia.xlsx", 
    sheet = "Hoja 1")
View(Desemp_Violencia)


attach(Desemp_Violencia)
Desemp_Violencia$Desempleo
##  [1] 10.06 10.32 10.33 10.66 10.86 10.86 10.88 10.91 11.05 11.14 11.20 11.35
## [13] 11.42 11.64 11.78 11.78 11.83 11.88 11.98 11.98 12.00 12.09 12.10 12.18
## [25] 12.23 12.50 12.51 12.53 12.64 12.64 12.70 12.80 12.80 13.01 13.02 13.06
## [37] 13.16 13.58 13.62 14.02
Desemp_Violencia$Homicidios
##  [1]  52.37  52.85  51.61  66.65  69.39  72.67  74.37  71.73  70.72  81.20
## [11]  79.26  89.28  97.84 100.37 104.37 103.29 115.19 110.99 118.09 115.47
## [21] 128.10 127.48 124.67 136.36 137.65 157.08 157.02 152.87 165.23 179.12
## [31] 176.31 178.82 185.64 199.46 207.17 202.03 215.11 265.30 267.35 327.05
plot(Desempleo, Homicidios,pch=17)

##La relación directa entre homicidio y desempleo no se evidencia lineal entre las veriables, algunos puntos

###2.Halle el coeficiente de correlación (coeficiente pearson), interprete y determine el significado

cor(Desempleo,Homicidios)
## [1] 0.9611879

##el coeficiente de correlación muestra un valor cercano a uno, 0.96 es un valor de relación fuerte lo que indica que el desempleo es una variable que tiene fuerte asociación con los homicidios, si se disminuye el desempleo se espera que la violencia disminuya en la comunidad

###3. Estime el correspondiente modelo de regresión lineal simple e interprete la pendiente del modelo

mod=lm(Homicidios~Desempleo)
summary(mod)
## 
## Call:
## lm(formula = Homicidios ~ Desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.378 -11.982  -4.636   5.979  62.093 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -629.23      35.68  -17.63   <2e-16 ***
## Desempleo      63.78       2.97   21.48   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18 on 38 degrees of freedom
## Multiple R-squared:  0.9239, Adjusted R-squared:  0.9219 
## F-statistic: 461.2 on 1 and 38 DF,  p-value: < 2.2e-16

##Coeficiente beta que acompaña a desempleo, indica el aumento en la tasa de homicidios por cada unidad. Al aumentar el 1% de desempleo, la tasa de homicidio sería de 63.751 por cada 100 mil habitantes adicionales. El error de significacia indica una fuerte relación entre las variables porque el valor de p es cercano a 0. El valor R cuadrado logra explicar el ajuste del modelo en un 92%

###4. Valide los supuestos del modelo

par(mfrow=c(2,2))
plot(mod)

##el gráfico residual muestra que la relación no necesariamente es lineal y requiere un ajuste, es una relación creciente de tipo exponencial. En el gráfico de normalidad, algunos datos se salen de la recta del gráfico

##Transformación sobre la variable respuesta para utilizar algoritmo y volver a estimar el modelo para lograr normalidad en los datos

mod=lm(log(Homicidios)~Desempleo)
summary(mod)
## 
## Call:
## lm(formula = log(Homicidios) ~ Desempleo)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.085593 -0.022911 -0.000099  0.023819  0.095225 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.026788   0.075482  -13.60  3.5e-16 ***
## Desempleo    0.486073   0.006282   77.38  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03807 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9935 
## F-statistic:  5987 on 1 and 38 DF,  p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod)

##Mejora aleatoriedad y normalidad de los datos

###5. Estime la tasa de homicidio para la eventualidad en la que el gobierno logre disminuir el desempleo a un nivel de 11%

predict(mod,newdata = list(Desempleo=11))
##        1 
## 4.320017

##el valor 4.320017 está en valor logaritmico y se debe transformar

exp(predict(mod,newdata = list(Desempleo=11)))
##        1 
## 75.18994

##Si el desempleo se disminuye un 1% en la ciudad se espera que el homicidio sea de 75.18994 por cada 100 mil habitantes