Nuestra hipotesis es que a mayor desempleo mas homicidios

a) Gráfico

library(readxl)
caso <- read_excel("d:/ambiente/escritorio/Metodos Estadisticos/Modulo 3/caso.xlsx")
attach(caso) # para acceder a las columnas de datos sin tener que preceder del nombre del dataframe

#Homicidios tasa de homicidios por cada 100.000 habitantes
#desempleo porcentaje de desempleo
plot(desempleo, homicidios)

En la anterior grafica se puede observar un incremento de los himicidios cuando aumenta el desempleo.

  1. Coeficiente de correlación
#Calculando que tan fuerte es la relación entre homicidios y desempleo.
cor(desempleo, homicidios)
## [1] 0.9608183

##Análisis

el grado de relación lineal entre el par de variables cuantitativas homicidios y desempleo es positiva fuerte, al tener un valor superior a 0,8. Lo que significa que los datos tienen a disponerse de forma lineal, a medida que aumenta el desempleo aumenta los homicidios.

Las variables de homicidio y desempleo se correlacionan en un 96.08%, lo que significan que correlacionan positivamente en un alto porcentaje, pues está muy proximo al 100%.

  1. Regresión lineal
#con la función lm obtenemos el modelo lineal con el menor error cuadratico
mod = lm(homicidios~desempleo)
mod
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Coefficients:
## (Intercept)    desempleo  
##     -628.94        63.75
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

Análisis Lo que se logra con el modelo de regresión lineal realizado es que existe evidencia estadistica de que el homocidio y el desempleo están significativamente asociados, dado el valor P de 0,ahora con los parametros del modelo lineal podemos decir que un aumento en un 1% en el porcentaje de desempleo los homicidios aumentarían en aproximadamente 63 casos por cada 100.000 habitantes.

Asimismo, se evidencia que el modelo explica los homicidios en un 92%.

Análisis Al realizar el cambio del modelo a logaritmico se evidencia un aumento en el r2 del 99.37%, lo que significa que el modelo mejoró su explicación.

  1. Supuestos
par(mfrow=c(2,2))
plot(mod)

Como se observa en el grafico Residuals vs Fitted, no existe una aleatoriedad de los errores, por lo tanto el modelo se podria mejorar realisando un ajuste, por ejemplo aplicando el logaritmo a los datos predecidos

mod1 = lm(log(homicidios)~desempleo)
summary(mod1)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

Mejora considerablemente el error cuadratico del modelo.

Respuesta con el modelo ajustado

par(mfrow=c(2,2))
plot(mod1)

  1. Predicción
#resultado con ajuste del logaritmo
predict(mod1, newdata=list(desempleo=11))
##        1 
## 4.319804
#Resultado en la escala original homicidios por cada 100 mil habitantes.

exp(predict(mod1, newdata=list(desempleo=11)))
##        1 
## 75.17389

Si el desempleo se logra disminuir en un 11%, se esperaría que los homicidios lograrán disminuir en 75 casos por cada 100.000 habitantes.