Regresion lineal simple de datos de los riesgos ambientales

Cargar paquetes

library(readxl)

Buscar ruta del archivo

file.choose()
## [1] "C:\\Users\\aloap\\Documents\\PYE1213\\U1A8.1"

Cargar excel

riesgos <- "C:\\Users\\aloap\\Documents\\PYE1213\\emergencias_ambientales2.xls"

Cargar datos

caso_ideal <- read_excel(riesgos)

names(caso_ideal)
## [1] "DERRAME"   "EXPLOSION"

Visualizar

head(caso_ideal)
## # A tibble: 6 x 2
##   DERRAME EXPLOSION
##     <dbl>     <dbl>
## 1      16         2
## 2     112        15
## 3      13         1
## 4      20         1
## 5      36        56
## 6      28        20

Analisis de correlacion

  • Matriz de diagramas de dispersion
pairs(caso_ideal)

A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de coeficientes de correlacion

cor(caso_ideal)
##             DERRAME EXPLOSION
## DERRAME   1.0000000 0.3432888
## EXPLOSION 0.3432888 1.0000000

*Con esto observamos que a medida de que el derrame es mayor la probabilidad de la explosion aumenta, aumenta la explosion con un indice de 34% Esto explicado con un coeficiente de correlacion de: 0.3432888

Recta de minimos cuadrados

regresion <- lm(DERRAME ~ EXPLOSION, data=caso_ideal)
summary(regresion)
## 
## Call:
## lm(formula = DERRAME ~ EXPLOSION, data = caso_ideal)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -363.75  -92.44  -75.18  -45.25 1369.99 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)   80.972     71.936   1.126   0.2693  
## EXPLOSION      5.106      2.551   2.002   0.0544 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 303.2 on 30 degrees of freedom
## Multiple R-squared:  0.1178, Adjusted R-squared:  0.08844 
## F-statistic: 4.008 on 1 and 30 DF,  p-value: 0.05441

Con base alo estimado en el analisis de regresion lineal, obtenemos la ecuacion de la recta de minimos cuadrados

\[y = 80.972 + 5.106 x \] ### Grafica de la recta de minimos cuadrados

plot (caso_ideal$EXPLOSION, caso_ideal$DERRAME, xlab="DERRAME",ylab="EXPLOSION")
abline(regresion)

Modelacion (calculo) de predicciones

nuevas.EXPLOSION <- data.frame(EXPLOSION=seq(20,60))
predict(regresion,nuevas.EXPLOSION)
##        1        2        3        4        5        6        7        8 
## 183.0948 188.2010 193.3071 198.4133 203.5194 208.6256 213.7317 218.8379 
##        9       10       11       12       13       14       15       16 
## 223.9440 229.0502 234.1563 239.2625 244.3686 249.4748 254.5809 259.6871 
##       17       18       19       20       21       22       23       24 
## 264.7932 269.8994 275.0055 280.1117 285.2179 290.3240 295.4302 300.5363 
##       25       26       27       28       29       30       31       32 
## 305.6425 310.7486 315.8548 320.9609 326.0671 331.1732 336.2794 341.3855 
##       33       34       35       36       37       38       39       40 
## 346.4917 351.5978 356.7040 361.8101 366.9163 372.0224 377.1286 382.2347 
##       41 
## 387.3409

Intervalo de confianza

confint(regresion)
##                  2.5 %    97.5 %
## (Intercept) -65.941867 227.88539
## EXPLOSION    -0.102904  10.31521

# En conclusion las probabilidades y la estadistica nos dice que entre mas derrames mas propensos son las la explosiones y los incendios, las predicciones nos dice que en el rango de 20, 60 podrian variar otras posibilidades de incendio.