1. Construya el diagrama de dispersión y comente este gráfico Posible hipótesis: a mayor desempleo se espera que la violencia sea más alta - relación directa o positiva.

library(readxl)
caso <- read_excel("~/Maestria Javeriana/Metodos y Simulacion estadistica/final/caso.xlsx")
View(caso)
attach(caso)
summary(caso)
##       mes          desempleo       homicidios    
##  Min.   : 1.00   Min.   :10.06   Min.   : 51.61  
##  1st Qu.:10.75   1st Qu.:11.19   1st Qu.: 80.72  
##  Median :20.50   Median :11.99   Median :121.38  
##  Mean   :20.50   Mean   :11.98   Mean   :134.61  
##  3rd Qu.:30.25   3rd Qu.:12.65   3rd Qu.:176.94  
##  Max.   :40.00   Max.   :14.02   Max.   :327.05
plot(desempleo, homicidios,pch=17)

#### Se puede evidenciar una relación directa entre los homicidios y desempleo, pero no podemos observar una relacion lineal entre ellos

2 Halle el coeficiente de correlación (coeficiente pearson), interprete y determine el significado

cor(desempleo,homicidios)
## [1] 0.9608183

el coeficiente de correlacion de 0.9608183 , nos dice que es un valor de relacion fuerte, siendo que estas variables estan bastante asociadas, en otras palabras, si el desempleo aumente se espera que los homicidios tambien lo hagan

3 Estime el correspondiente modelo de regresión lineal simple e interprete la pendiente del modelo

mod=lm(homicidios~desempleo)
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

El coeficiente anterior indica que al aumentar en 1 unidad el desempleo, la tasa de homicidios cambiara en 63.751. Donde el error de significancia indica una fuerte relación entre las variables porque el valor p es cercano a 0. el valor R² logra explicar un ajuste del 92.32%

4 Valide los supuestos del modelo

par(mfrow=c(2,2))
plot(mod)

#### siendo la relación no tan lineal es evidente que se podria realizar un ajuste de tipo exponencial como lo muestra su grafico, siendo que en el gráfico de normalidad, algunos datos se salen de la pendiente . La transformación sobre la variable dependiente para utilizar el algoritmo y volver estimar el modelo y lograr la normalidad de los datos

mod=lm(log(homicidios)~desempleo)
summary(mod)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

5. Estime la tasa de homicidio para la eventualidad en la que el gobierno logre disminuir el desempleo a un nivel de 11%

predict(mod,new = list(desempleo=11))
##        1 
## 4.319804

siendo el anteriro la constante a transformar de 4.320017

exp(predict(mod,new = list(desempleo=11)))
##        1 
## 75.17389

Por tanto, si el desempleo se disminuye un una unidad en la ciudad se espera que el homicidio sea de 75.18994