library(readxl)
Practica <- read_excel("C:/Users/andre/Desktop/Practica.xlsx")

attach(Practica)
Practica
Año Desempleo Homicidios
1 10.06 52.37
2 10.32 52.85
3 10.33 51.61
4 10.66 66.65
5 10.86 69.39
6 10.86 72.67
7 10.88 74.37
8 10.91 71.73
9 11.05 70.72
10 11.14 81.20
11 11.20 79.26
12 11.35 89.28
13 11.42 97.84
14 11.64 100.37
15 11.78 104.37
16 11.78 103.29
17 11.83 115.19
18 11.88 110.99
19 11.98 118.09
20 11.98 115.47
21 12.00 128.10
22 12.09 127.48
23 12.10 124.67
24 12.18 136.36
25 12.23 137.65
26 12.50 157.08
27 12.51 157.02
28 12.53 152.87
29 12.64 165.23
30 12.64 179.12
31 12.70 176.31
32 12.80 178.82
33 12.80 182.64
34 13.01 199.46
35 13.02 207.17
36 13.06 202.03
37 13.16 215.11
38 13.56 265.30
39 13.62 267.35
40 14.02 327.05

A. Diagrama de dispersión

plot(Desempleo,Homicidios,pch=1,xlab="Tasa de desempleo (%)",ylab="Tasa de Homicidios x 100.000 hab")

Se observa en el gráfico de Dispersión un comportamiento exponencial, es decir, hay una relación creciente y exponencial entre la tasa de desempleo y la tasa de homicidios.

B. Coeficiente de correlación

cor(Desempleo,Homicidios)
## [1] 0.9608183

Se evidencia un coeficiente de correlación positivo, por lo que se confirma que efectivamente las variables se encuentran positivamente relacionadas: A mayor tasa de desempleo, mayor será la tasa de homicios.

C.1. Modelo de Regresión

mod=lm((Homicidios)~Desempleo)
summary(mod)
## 
## Call:
## lm(formula = (Homicidios) ~ Desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## Desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

El modelo de regresión, en este momento sin ajustar, permite conocer los valores de \(B_0 = -628.94\) y \(B_1 = 63.75\), es decir, que por cada unidad porcentual que aumente la tasa de desempleo, la tasa de homicidios aumentará en 63.75 por cada 100.000 habitantes.

D.1. Validación de Supuestos

par(mfrow=c(2,2))
plot(mod)

Al realizar la validación de supuesta, se logra percibir que existe una tendencia parabólica entre los valores redisuales y los valores ajustados, además, en el gráfico Q-Q de normalidad se observan varios puntos alejados de la línea de tendencia lineal, razón por la cual se evidencia la necesidad de ajustar el modelo exponencial a un modelo lineal.

C.2. Modelo de Regresión Ajustado

modajustado=lm(log(Homicidios)~Desempleo)
summary(modajustado)
## 
## Call:
## lm(formula = log(Homicidios) ~ Desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## Desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

Se realiza la transformación del modelo empleando el Logaritmo Natural de la variable Homicidios, y se emplea este argumento y el desempleo para aplicar nuevamente el modelo de regresión; aquí, el valor del \(B_0\) es de -1.027556 y el de \(B_1\) es 0.486124

D.2. Validación de Supuestos

par(mfrow=c(2,2))
plot(modajustado)

par(mfrow=c(2,4))
plot(mod)
plot(modajustado)

Al realizar la validación de supuestos, es posible verificar que los valores residuales con respecto a los ajustados ya no siguen ningún tipo de tendencia y son completamente aleatorios; igualmente, el gráfico Q-Q de normalidad deja en evidencia un mayor ajuste a la recta de tendencia, por lo cual, el modelo se ajusta más a la realidad.

E. Estimación

exp(predict(modajustado,newdata=list(Desempleo=11)))
##        1 
## 75.17389

Se estima que, si se logra reducir la tasa de desempleo a un 11%, la tasa de homicidios por cada 100.000 sería 75.17.