Importar datos
Aquí estamos obteniendo los de dasastres Químicos dentro del país de México.
library(readr)
emergencias <- read_csv("emergencias_ambientales.csv",col_types = cols (ESTADO = col_number(), 'DERRAME'= col_number(), 'EXPLOSION'= col_number(), 'FUGA'=col_number(), 'INCENDIO'=col_number(), 'OTRO'=col_number()))## Warning: 32 parsing failures.
## row col expected actual file
## 1 ESTADO a number AGUASCALIENTES 'emergencias_ambientales.csv'
## 2 ESTADO a number BAJA CALIFORNIA 'emergencias_ambientales.csv'
## 3 ESTADO a number BAJA CALIFORNIA SUR 'emergencias_ambientales.csv'
## 4 ESTADO a number CAMPECHE 'emergencias_ambientales.csv'
## 5 ESTADO a number CHIAPAS 'emergencias_ambientales.csv'
## ... ...... ........ ................... .............................
## See problems(...) for more details.
## [1] "ESTADO" "DERRAME" "EXPLOSION" "FUGA" "INCENDIO" "OTRO"
Visualizar
## # A tibble: 6 x 6
## ESTADO DERRAME EXPLOSION FUGA INCENDIO OTRO
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 NA 16 2 3 6 0
## 2 NA 112 15 28 33 3
## 3 NA 13 1 1 2 0
## 4 NA 20 1 6 6 0
## 5 NA 36 56 134 56 5
## 6 NA 28 20 27 19 0
Análisis de coordinación
Matriz de diagramas de dispersión
A continuación se hará una cuantificacion del grado de relacion lineal, por medio de de la matriz de coeficientes de correlacion
## ESTADO DERRAME EXPLOSION FUGA INCENDIO OTRO
## ESTADO 1 NA NA NA NA NA
## DERRAME NA 1.0000000 0.3432888 0.3478502 0.6141667 0.1620682
## EXPLOSION NA 0.3432888 1.0000000 0.7260479 0.7630884 0.1926737
## FUGA NA 0.3478502 0.7260479 1.0000000 0.7671670 0.5914732
## INCENDIO NA 0.6141667 0.7630884 0.7671670 1.0000000 0.3301841
## OTRO NA 0.1620682 0.1926737 0.5914732 0.3301841 1.0000000
Existe una relación entre las fugas de gases con los incendios que han ocurrido, como se puede apreciar la relación entre estas dos es de 76%. Coeficiente de correlación de: 0.7260479
##
## Call:
## lm(formula = FUGA ~ INCENDIO, data = emergencias)
##
## Residuals:
## Min 1Q Median 3Q Max
## -22.451 -6.581 -2.940 0.948 69.992
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.7728 4.9431 0.359 0.722
## INCENDIO 1.1113 0.1697 6.551 3.02e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.37 on 30 degrees of freedom
## Multiple R-squared: 0.5885, Adjusted R-squared: 0.5748
## F-statistic: 42.91 on 1 and 30 DF, p-value: 3.025e-07
Con base a lo estimado en el análisis de regresión lineal, obtenemos la ecuación de la recta de mínimos cuadrados:
\[y= 1.7728 + 1.1113x\]
Modelación (Cálculo) de predicciones
## 1 2 3 4 5 6 7
## 1.772780 2.884119 3.995458 5.106796 6.218135 7.329473 8.440812
## 8 9 10 11 12 13 14
## 9.552151 10.663489 11.774828 12.886166 13.997505 15.108843 16.220182
## 15 16 17 18 19 20 21
## 17.331521 18.442859 19.554198 20.665536 21.776875 22.888214 23.999552
## 22 23 24 25 26 27 28
## 25.110891 26.222229 27.333568 28.444907 29.556245 30.667584 31.778922
## 29 30 31 32 33 34 35
## 32.890261 34.001599 35.112938 36.224277 37.335615 38.446954 39.558292
## 36 37 38 39 40 41 42
## 40.669631 41.780970 42.892308 44.003647 45.114985 46.226324 47.337662
## 43 44 45 46 47 48 49
## 48.449001 49.560340 50.671678 51.783017 52.894355 54.005694 55.117033
## 50 51 52 53 54 55 56
## 56.228371 57.339710 58.451048 59.562387 60.673725 61.785064 62.896403
## 57 58 59 60 61 62 63
## 64.007741 65.119080 66.230418 67.341757 68.453096 69.564434 70.675773
## 64 65 66 67 68 69 70
## 71.787111 72.898450 74.009788 75.121127 76.232466 77.343804 78.455143
## 71 72 73 74 75 76 77
## 79.566481 80.677820 81.789159 82.900497 84.011836 85.123174 86.234513
## 78 79 80 81 82 83 84
## 87.345851 88.457190 89.568529 90.679867 91.791206 92.902544 94.013883
## 85 86 87 88 89 90 91
## 95.125222 96.236560 97.347899 98.459237 99.570576 100.681915 101.793253
## 92 93 94 95 96 97 98
## 102.904592 104.015930 105.127269 106.238607 107.349946 108.461285 109.572623
## 99 100 101 102 103 104 105
## 110.683962 111.795300 112.906639 114.017978 115.129316 116.240655 117.351993
## 106 107 108 109 110 111 112
## 118.463332 119.574670 120.686009 121.797348 122.908686 124.020025 125.131363
## 113 114 115 116 117 118 119
## 126.242702 127.354041 128.465379 129.576718 130.688056 131.799395 132.910733
## 120 121
## 134.022072 135.133411
Intervalo de confianza
los datos proceden de un modelo de regresión simple:
\[y_i = \beta_0 + \beta_1 x_i + \epsilon_i, \ \ \ \ i=1,\ldots,n,\]
Los errores aleatorios ϵi son independientes con distribución normal 0 y varianza σ2
Los errores típicos de los stimadores de los parámetros $ _0 y _1 $ se encuentran en la columna std error serían de manera correspondiente: 4.9431 y 0.1697
Cálculo de nivel de confianza
## 2.5 % 97.5 %
## (Intercept) -8.3224545 11.868015
## INCENDIO 0.7648646 1.457813
El intervalo de confianza es del 97.5% para los datos
Ahora veamos uno intervalo de confianza para el 90% de los datos
## 5 % 95 %
## (Intercept) -6.6170147 10.162576
## INCENDIO 0.8233963 1.399281
nuevas.incendios <-data.frame(INCENDIO=seq(0,120))
plot(emergencias$FUGA, emergencias$INCENDIO, xlab="Fugas", ylab="Incendios")
abline(regresion)
# Intervalos de confianza de la respuesta media
# ic es una matriz con tres columnas:
#La primera es la predicción, y las otras son los extremos del intervalo
ic <- predict(regresion,nuevas.incendios, interval = "confidence")
lines(nuevas.incendios$INCENDIO, ic[, 2], lty=2)
lines(nuevas.incendios$INCENDIO, ic[, 3], lty=2)
#Intervalos de predicción
ic <- predict(regresion,nuevas.incendios, interval = "prediction")
lines(nuevas.incendios$INCENDIO, ic[, 2], lty=2, col = "blue")
lines(nuevas.incendios$INCENDIO, ic[, 3], lty=2, col = "green")Conclusión
Los datos nos mostraron que la liberación de gases o la fuga de estos, provocan que hayan demasiados incendios de cualquier tipo, por lo tanto si esto se disminuye, la probabilidad de que los incendios sean menos frecuentes también serán menores por lo tanto, hay que tratar de evitar cualquier caso de fuga y repararse lo más pronto posible.