1. Importación de la base de datos
library(readxl)
Actividad_Caso <- read_excel("~/OneDrive - PUJ Cali/PUJ Msc/Semestre I/Métodos y simulación estadística 2022 - B/Unidad 3/Actividad Caso/Actividad Caso.xlsx")
  1. Se realiza el analisis bivariado
attach(Actividad_Caso) # Atajo para llamar las variables
plot(desempleo,homicidios,pch=18)

  1. Coeficiente de Correlación
cor(desempleo,homicidios,use = "complete.obs") # Se utiliza use para que no tenga en cuenta los datos faltantes
## [1] 0.9608183
  1. Regresión Lineal /Estimar el modelo de regresión

Variable de respuesta Homicidios en función de desempleo si hay mas covariables se utiliza el simbolo (+)

modelo=lm(homicidios~desempleo) 
summary(modelo)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16
  1. Validación de supuestos del modelo
par(mfrow=c(2,2))
plot(modelo)

  1. Se utiliza el paso de la trasnformación sobre la variable de respuesta
modelo=lm(log(homicidios)~desempleo) 
summary(modelo)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(modelo)

  1. Predict
predict(modelo,newdata = list(desempleo=11))
##        1 
## 4.319804
# Destrasnformaciòn del logaritmo
exp(predict(modelo,newdata = list(desempleo=11)))
##        1 
## 75.17389