library(readxl)
YDRAY_caso <- read_excel("C:/Users/lalal_000/Documents/BIOLOGIA JAVERIANA/5to/BIO-ESTADISTICA/YDRAY-caso.xlsx")

##PUNTO A

library(ggplot2)
ggplot(YDRAY_caso, aes(x = desempleo, y = homicidios)) +
  geom_point(colour = 5) + ggtitle("Figura 1. Diagrama de dispersión entre los homicidios y el desempleo")

En este grafico se puede observar una relacion poco lineal (creciente) entre la variable de homicidios y la variable de desempleo, por esto se puede concluir que el desemplo seria una causal que aumenta el caso de homicidios.

##PUNTO B

y=YDRAY_caso$homicidios
x=YDRAY_caso$desempleo
cor(x,y)
## [1] 0.9608183

Segun el coeficiente de correlacion, se puede concluir que es inversamente proporcional pues cada que aumenta la variable de desempleo, aumentan los casos de homicidios.

##PUNTO C

mod=lm(y~x)
summary(mod)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## x             63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

##INTERPRETACION

##PUNTO D

par(mfrow=c(2,2))
plot(mod)

En los siguientes graficos se puede observar que existe una relacion cercana del desempleo con el homicidio, pues aunque los puntos de dispercion no se encuentren siempre sobre la linea, se encuentra cerca a esta. Para ver mejor esta cercania se aplica:

mod1=lm(log(y)~x)
summary(mod1)
## 
## Call:
## lm(formula = log(y) ~ x)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## x            0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod1)

En estas nuevas graficas se representan de una mejor presentacion los graficos con distribucion normal y con valores residuales.

##PUNTO E

exp(predict(mod1,newdata = list(x=11)))
##        1 
## 75.17389

Con este valor se puede concluir que si el desempleo disminuye en un 11%, la tasa de homicidio que se espera es de aproximadamente 75/10.000.