library(readxl)
caso <- read_excel("D:/GUIANCARLO_2022/MAESTRIA CIENCIA DE DATOS/Metodos y Simulacion Estadistica/unidad 3_Modelación_Estadistica/Trabajo_1/caso.xlsx")
View(caso)

Punto a

Construya el diagrama de dispersión.

attach(caso)
plot(desempleo,homicidios, pch = 16)

En esta gráfica se puede observar el diagrama de dispersión, el cual corresponde a una relación lineal positiva (directa o creciente), esto se puede validar en la anterior gráfica.

Punto b.

Hallar el coeficiente de correlación, interprete y determine si es significativo.

cor(desempleo,homicidios)
## [1] 0.9608183

La asociación es muy fuerte, luego la tasa de desempleo está asociada con la tasa de homicidios, es decir a mayor desempleo mayor es la tasa de homicidios, de esta manera es necesario crear proyectos que active el empleo y de esta manera disminuir la tasa de homicidios, esta decisión la podría emplear un tomador de decisiones que pertenezca a una entidad territorial

Punto c

Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo.

mod=lm(homicidios~desempleo)
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

De acuerdo a los resultados del modelo se puede indicar que por cada aumento del 1% de desempleo en la comunidad el efecto sería de 63 casos aproximadamente de homicidio por cada 100 mil habitantes adicionales, de igual manera el valor de coeficiente de pr indica que se presenta un aumento significativo. Por otra parte, se puede observar el coeficiente r cuadrado el cual indica que este modelo logra explicar un 92% de la violencia que como producto tiene los homicidios generados a raíz del desempleo que se presenta en la región.

Punto d

Valide los supuestos del modelo.

par (mfrow=c(2,2))
plot(mod)

Al simular la función se logran generar una serie de gráficos, aqui se puede destacar lo siguiente:

  1. El primer grafico muestra la relación entre los residuales vs los valores ajustados, se logra observar un comportamiento, por la forma que tiene este no brinda una buena información que permita tomar decisiones, dado que su comportamiento no es lineal, es más bien una relación exponencial.
  2. En el segundo gráfico se puede observar una aproximación a una relación lineal, sin embargo, muchos de los puntos cercanos a 2 sobre el eje x muestran puntos dispersos sobre el eje y.

Luego se hace necesario realizar unos ajustes a la función para determinar si mejora el comportamiento de la función. De esta manera se hace una transformación mediante un algoritmo sobre la variable respuesta.

modelo=lm(log(homicidios)~desempleo)
summary(modelo)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

Al realizar el cambio de LOG sobre la variable respuesta se puede indicar que por cada aumento del 1% de desempleo en la comunidad el efecto sería de 48 casos aproximadamente de homicidio por cada 100 mil habitantes adicionales, de igual manera el valor de coeficiente de pr indica que se presenta un aumento significativo. Por otra parte, se puede observar el coeficiente r cuadrado el cual indica que este modelo logra explicar un 99% de la violencia que como producto tiene los homicidios generados a raíz del desempleo que se presenta en la región. Luego mejoran los valores.

Punto d

Valide los supuestos del modelo.

par (mfrow = c(2,2))
plot(modelo)

Al simular la función se logran generar una serie de gráficos, aqui se puede destacar lo siguiente:

  1. El primer grafico muestra la relación entre los residuales vs los valores ajustados, se logra observar un mejor comportamiento en relación al análisis anterior, ahora tenemos un valor aproximado lineal, a diferencia del otro que tenía un comportamiento exponencial.
  2. En el segundo grafico se puede observar una aproximación a una relación lineal, en esta oportunidad los valores cercanos a 2 sobre el eje x ya no muestran puntos dispersos sobre el eje y.

Punto e

Estime la tasa de homicidios para la eventualidad en la que el Gobierno logre disminuir el desempleo a un nivel del 11%. ###

exp(predict (modelo,newdata = list (desempleo=11)))
##        1 
## 75.17389

De esta manera se puede indicar que si el desempleo se lograr disminuir en un 11% se esperaría que la tasa de homicidios fuera de 75 casos por cada 100 mil habitantes.