Aplicar los métodos estadísticos multivariantes en el análisis de datos.
El taller consiste en realizar un informe aplicando métodos multivariantes, el conjunto de datos utilizado en el primer taller fue FOREST FIRES.
Paso_1: Importar librerias necesarias, se instala la libreria
corrplot.
library(corrplot)
## corrplot 0.94 loaded
Paso_2: Cargar los datos en R leyendo una URL desde internet y se renombra las variables.
data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv", header = TRUE)
names(data) <- c('Eje_X','Eje_Y','Month','Day','Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')
Paso_3: Se realiza el modelo de correlación para todas las variables cuantitativas de la data extraida y de esta manera poder seleccionar 4 variables con mayor correlación.
data_all_cuantitativas <- na.omit(data[, c('Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')])
corrplot.mixed(cor(data_all_cuantitativas),
lower = "number",
upper = "circle",
tl.col = "black")
De acuerdo con los datos que se visualizan en el gráfico se seleccionan las siguientes variables.
Correlación Fuerte 0.50: Temp (Temperatura) con la variable DC (Código de sequía).
Correlación Fuerte 0.47: Temp (Temperatura) con la variable DMC (Código de Humedad Duff).
Correlación Fuerte 0.43: Temp (Temperatura) con la variable FFMC (Código de humedad fina del combustible).
Correlación Débil 0.10: Temp (Temperatura) con la variable Area. => Aunque la variable es débil se la escoge para que el modelo la descarte.
plot(data_all_cuantitativas,col=c("red"))
Paso_4: Realizamos un nuevo Modelo de Correlación, creamos el daframe ‘data_correlacion’ con las variables seleccionadas :
# Se crea la variable 'data_correlacion' con las variables seleccionadas.
data_correlacion <- na.omit(data[, c('Temp','Dc','Dmc','Ffmc','Area')])
corrplot.mixed(cor(data_correlacion),
lower = "number",
upper = "circle",
tl.col = "black")
plot(data_correlacion,col=c("red"))
Se crea la variable ‘modelo’ usando el dataset ‘data_correlacion’, se define las variables independientes y dependiente.
Variable Dependiente ‘y’: Temp. Modelo de regresión para predecir temperatura usando las variables independientes.
Variables Independientes ‘x’: Dc, Dmc, Ffmc, Area
y=x1+x2+x3+x4
y=0.50+0.47+0.43+0.10
y=1,50
X=as.matrix(cbind("ones"=c(1:1),data_correlacion[,2:5]))
X
## ones Dc Dmc Ffmc Area
## 1 1 94.3 26.2 86.2 0.00
## 2 1 669.1 35.4 90.6 0.00
## 3 1 686.9 43.7 90.6 0.00
## 4 1 77.5 33.3 91.7 0.00
## 5 1 102.2 51.3 89.3 0.00
## 6 1 488.0 85.3 92.3 0.00
## 7 1 495.6 88.9 92.3 0.00
## 8 1 608.2 145.4 91.5 0.00
## 9 1 692.6 129.5 91.0 0.00
## 10 1 698.6 88.0 92.5 0.00
## 11 1 698.6 88.0 92.5 0.00
## 12 1 713.0 73.2 92.8 0.00
## 13 1 665.3 70.8 63.5 0.00
## 14 1 686.5 126.5 90.9 0.00
## 15 1 699.6 133.3 92.9 0.00
## 16 1 713.9 141.2 93.3 0.00
## 17 1 80.8 35.8 91.7 0.00
## 18 1 664.2 32.8 84.9 0.00
## 19 1 70.8 27.9 89.2 0.00
## 20 1 97.1 27.4 86.3 0.00
## 21 1 692.6 129.5 91.0 0.00
## 22 1 724.3 78.5 91.8 0.00
## 23 1 200.0 96.3 94.3 0.00
## 24 1 537.4 110.9 90.2 0.00
## 25 1 594.2 139.4 93.5 0.00
## 26 1 601.4 142.4 91.4 0.00
## 27 1 668.0 117.9 92.4 0.00
## 28 1 686.5 126.5 90.9 0.00
## 29 1 721.4 145.4 93.4 0.00
## 30 1 728.6 149.3 93.5 0.00
## 31 1 692.3 85.1 94.3 0.00
## 32 1 709.9 91.8 88.6 0.00
## 33 1 706.8 69.7 88.6 0.00
## 34 1 718.3 75.6 91.7 0.00
## 35 1 724.3 78.5 91.8 0.00
## 36 1 730.2 80.7 90.3 0.00
## 37 1 669.1 35.4 90.6 0.00
## 38 1 682.6 41.5 90.0 0.00
## 39 1 686.9 43.7 90.6 0.00
## 40 1 67.6 25.7 88.1 0.00
## 41 1 366.7 60.6 79.5 0.00
## 42 1 624.2 96.9 90.2 0.00
## 43 1 647.1 108.3 94.8 0.00
## 44 1 698.6 88.0 92.5 0.00
## 45 1 735.7 82.9 90.1 0.00
## 46 1 692.3 85.1 94.3 0.00
## 47 1 686.5 126.5 90.9 0.00
## 48 1 442.9 62.3 94.2 0.00
## 49 1 64.7 23.9 87.2 0.00
## 50 1 103.8 52.2 87.6 0.00
## 51 1 706.4 137.0 92.9 0.00
## 52 1 631.2 99.6 90.2 0.00
## 53 1 654.1 111.2 92.1 0.00
## 54 1 654.1 111.2 92.1 0.00
## 55 1 661.3 114.3 91.7 0.00
## 56 1 706.4 137.0 92.9 0.00
## 57 1 730.2 80.7 90.3 0.00
## 58 1 691.8 46.5 92.6 0.00
## 59 1 34.0 9.3 84.0 0.00
## 60 1 43.0 13.2 86.6 0.00
## 61 1 102.2 51.3 89.3 0.00
## 62 1 102.2 51.3 89.3 0.00
## 63 1 466.6 75.3 93.0 0.00
## 64 1 631.2 99.6 90.2 0.00
## 65 1 638.8 103.2 91.1 0.00
## 66 1 661.3 114.3 91.7 0.00
## 67 1 668.0 117.9 92.4 0.00
## 68 1 668.0 117.9 92.4 0.00
## 69 1 668.0 117.9 92.4 0.00
## 70 1 77.5 33.3 91.7 0.00
## 71 1 97.8 48.3 91.2 0.00
## 72 1 692.3 85.1 94.3 0.00
## 73 1 77.5 33.3 91.7 0.00
## 74 1 614.5 147.3 88.8 0.00
## 75 1 713.9 141.2 93.3 0.00
## 76 1 26.6 6.8 84.2 0.00
## 77 1 43.0 13.2 86.6 0.00
## 78 1 103.8 52.2 87.6 0.00
## 79 1 529.8 108.0 90.1 0.00
## 80 1 561.6 121.2 91.0 0.00
## 81 1 601.4 142.4 91.4 0.00
## 82 1 631.2 99.6 90.2 0.00
## 83 1 647.1 108.3 94.8 0.00
## 84 1 654.1 111.2 92.1 0.00
## 85 1 661.3 114.3 91.7 0.00
## 86 1 706.4 137.0 92.9 0.00
## 87 1 706.4 137.0 92.9 0.00
## 88 1 706.4 137.0 92.9 0.00
## 89 1 728.6 149.3 93.5 0.00
## 90 1 80.8 35.8 91.7 0.00
## 91 1 624.2 96.9 90.2 0.00
## 92 1 80.8 35.8 91.7 0.00
## 93 1 488.0 85.3 92.3 0.00
## 94 1 601.4 142.4 91.4 0.00
## 95 1 638.8 103.2 91.1 0.00
## 96 1 704.4 90.0 89.7 0.00
## 97 1 30.2 8.0 83.9 0.00
## 98 1 15.5 2.4 69.0 0.00
## 99 1 601.4 142.4 91.4 0.00
## 100 1 601.4 142.4 91.4 0.00
## 101 1 601.4 142.4 91.4 0.00
## 102 1 614.5 147.3 88.8 0.00
## 103 1 647.1 108.3 94.8 0.00
## 104 1 674.4 121.1 92.5 0.00
## 105 1 9.3 3.7 82.1 0.00
## 106 1 57.3 19.5 85.9 0.00
## 107 1 74.3 30.7 91.4 0.00
## 108 1 631.2 99.6 90.2 0.00
## 109 1 698.6 88.0 92.5 0.00
## 110 1 709.9 91.8 88.6 0.00
## 111 1 57.3 19.5 85.9 0.00
## 112 1 77.5 33.3 91.7 0.00
## 113 1 704.4 90.0 89.7 0.00
## 114 1 724.3 78.5 91.8 0.00
## 115 1 67.6 25.7 88.1 0.00
## 116 1 67.6 25.7 88.1 0.00
## 117 1 80.8 35.8 91.7 0.00
## 118 1 80.8 35.8 91.7 0.00
## 119 1 86.6 39.7 90.1 0.00
## 120 1 466.6 75.3 93.0 0.00
## 121 1 608.2 145.4 91.5 0.00
## 122 1 608.2 145.4 91.5 0.00
## 123 1 680.7 124.1 92.4 0.00
## 124 1 671.9 73.4 84.4 0.00
## 125 1 692.3 85.1 94.3 0.00
## 126 1 691.8 46.5 92.6 0.00
## 127 1 103.8 52.2 87.6 0.00
## 128 1 728.6 149.3 93.5 0.00
## 129 1 673.8 37.9 91.4 0.00
## 130 1 691.8 46.5 92.6 0.00
## 131 1 87.2 21.5 68.2 0.00
## 132 1 64.7 23.9 87.2 0.00
## 133 1 102.2 51.3 89.3 0.00
## 134 1 685.2 80.9 93.7 0.00
## 135 1 67.6 25.7 88.1 0.00
## 136 1 594.2 139.4 93.5 0.00
## 137 1 680.7 124.1 92.4 0.00
## 138 1 686.5 126.5 90.9 0.00
## 139 1 313.4 48.3 85.8 0.36
## 140 1 692.6 129.5 91.0 0.43
## 141 1 686.5 126.5 90.9 0.47
## 142 1 513.3 99.9 95.5 0.55
## 143 1 529.8 108.0 90.1 0.61
## 144 1 296.3 51.3 90.0 0.71
## 145 1 513.3 99.9 95.5 0.77
## 146 1 578.8 131.7 95.2 0.90
## 147 1 86.6 39.7 90.1 0.95
## 148 1 671.9 73.4 84.4 0.96
## 149 1 647.1 108.3 94.8 1.07
## 150 1 685.2 80.9 93.7 1.12
## 151 1 433.3 56.4 92.5 1.19
## 152 1 355.2 68.6 90.1 1.36
## 153 1 424.1 51.2 90.1 1.43
## 154 1 692.3 85.1 94.3 1.46
## 155 1 721.4 145.4 93.4 1.46
## 156 1 647.1 108.3 94.8 1.56
## 157 1 721.4 145.4 93.4 1.61
## 158 1 654.1 111.2 92.1 1.63
## 159 1 654.1 111.2 92.1 1.64
## 160 1 668.0 117.9 92.4 1.69
## 161 1 86.6 39.7 90.1 1.75
## 162 1 578.8 131.7 95.2 1.90
## 163 1 100.4 50.1 90.6 1.94
## 164 1 674.4 121.1 92.5 1.95
## 165 1 704.4 90.0 89.7 2.01
## 166 1 55.0 18.2 84.9 2.14
## 167 1 654.1 111.2 92.1 2.29
## 168 1 570.5 127.1 96.0 2.51
## 169 1 97.8 48.3 91.2 2.53
## 170 1 578.8 131.7 95.2 2.55
## 171 1 699.6 133.3 92.9 2.57
## 172 1 609.6 90.4 85.6 2.69
## 173 1 601.4 142.4 91.4 2.74
## 174 1 686.5 126.5 90.9 3.07
## 175 1 624.2 96.9 90.2 3.50
## 176 1 624.2 96.9 90.2 4.53
## 177 1 55.2 9.1 81.5 4.61
## 178 1 631.2 99.6 90.2 4.69
## 179 1 735.7 82.9 90.1 4.88
## 180 1 614.5 147.3 88.8 5.23
## 181 1 680.7 124.1 92.4 5.33
## 182 1 664.2 32.8 84.9 5.44
## 183 1 48.3 15.6 86.8 6.38
## 184 1 696.1 48.5 91.7 6.83
## 185 1 586.7 135.7 93.9 6.96
## 186 1 692.6 129.5 91.0 7.04
## 187 1 102.2 51.3 89.3 7.19
## 188 1 686.5 126.5 90.9 7.30
## 189 1 89.4 41.9 90.8 7.40
## 190 1 92.4 44.0 90.7 8.24
## 191 1 97.8 48.3 91.2 8.31
## 192 1 578.8 131.7 95.2 8.68
## 193 1 647.1 108.3 94.8 8.71
## 194 1 699.6 133.3 92.9 9.41
## 195 1 647.1 108.3 94.8 10.01
## 196 1 586.7 135.7 93.9 10.02
## 197 1 55.2 9.1 81.5 10.93
## 198 1 706.4 137.0 92.9 11.06
## 199 1 692.6 129.5 91.0 11.24
## 200 1 665.3 70.8 63.5 11.32
## 201 1 692.6 129.5 91.0 11.53
## 202 1 83.7 37.6 90.1 12.10
## 203 1 32.1 8.7 83.9 13.05
## 204 1 673.8 37.9 91.4 13.70
## 205 1 100.4 50.1 90.6 13.99
## 206 1 706.4 137.0 92.9 14.57
## 207 1 594.2 139.4 93.5 15.45
## 208 1 692.6 129.5 91.0 17.20
## 209 1 668.0 117.9 92.4 19.23
## 210 1 685.2 80.9 93.7 23.41
## 211 1 686.9 43.7 90.6 24.23
## 212 1 594.2 139.4 93.5 26.00
## 213 1 692.3 85.1 94.3 26.13
## 214 1 103.8 52.2 87.6 27.35
## 215 1 80.8 35.8 91.7 28.66
## 216 1 80.8 35.8 91.7 28.66
## 217 1 680.7 124.1 92.4 29.48
## 218 1 709.9 91.8 88.6 30.32
## 219 1 699.6 133.3 92.9 31.72
## 220 1 86.6 39.7 90.1 31.86
## 221 1 631.2 99.6 90.2 32.07
## 222 1 713.9 141.2 93.3 35.88
## 223 1 103.8 52.2 87.6 36.85
## 224 1 309.9 150.3 88.3 37.02
## 225 1 735.7 82.9 90.1 37.71
## 226 1 728.6 149.3 93.5 48.55
## 227 1 696.1 48.5 91.7 49.37
## 228 1 480.8 81.8 92.2 58.30
## 229 1 728.6 149.3 93.5 64.10
## 230 1 480.8 81.8 92.2 71.30
## 231 1 699.6 133.3 92.9 88.49
## 232 1 728.6 149.3 93.5 95.18
## 233 1 692.6 129.5 91.0 103.39
## 234 1 671.9 73.4 84.4 105.66
## 235 1 674.4 121.1 92.5 154.88
## 236 1 601.4 142.4 91.4 196.48
## 237 1 674.4 121.1 92.5 200.94
## 238 1 692.6 129.5 91.0 212.88
## 239 1 674.4 121.1 92.5 1090.84
## 240 1 7.9 3.0 81.9 0.00
## 241 1 43.5 17.2 88.0 0.00
## 242 1 85.3 23.3 83.0 0.00
## 243 1 589.9 122.3 94.2 10.13
## 244 1 700.7 175.1 91.8 0.00
## 245 1 700.7 175.1 91.8 2.87
## 246 1 700.7 175.1 91.8 0.76
## 247 1 700.7 175.1 91.8 0.09
## 248 1 503.6 91.6 92.2 0.75
## 249 1 666.7 157.3 93.1 0.00
## 250 1 666.7 157.3 93.1 2.47
## 251 1 666.7 157.3 93.1 0.68
## 252 1 666.7 157.3 93.1 0.24
## 253 1 666.7 157.3 93.1 0.21
## 254 1 565.5 109.2 91.9 1.52
## 255 1 621.7 138.1 91.6 10.34
## 256 1 694.8 77.0 87.5 0.00
## 257 1 581.1 117.2 94.2 8.02
## 258 1 581.1 117.2 94.2 0.68
## 259 1 692.3 170.9 91.8 0.00
## 260 1 692.3 170.9 91.8 1.38
## 261 1 542.0 97.9 93.6 8.85
## 262 1 573.0 112.4 91.6 3.30
## 263 1 573.0 112.4 91.6 4.25
## 264 1 629.1 141.1 91.1 1.56
## 265 1 684.4 167.6 94.3 6.54
## 266 1 550.3 102.2 93.7 0.79
## 267 1 607.1 131.7 94.3 0.17
## 268 1 658.2 152.6 92.1 0.00
## 269 1 658.2 152.6 92.1 0.00
## 270 1 658.2 152.6 92.1 4.40
## 271 1 658.2 152.6 92.1 0.52
## 272 1 658.2 152.6 92.1 9.27
## 273 1 658.2 152.6 92.1 3.09
## 274 1 353.5 27.2 84.4 8.98
## 275 1 354.6 27.8 84.0 11.19
## 276 1 352.0 26.4 84.6 5.38
## 277 1 349.7 25.4 85.4 17.85
## 278 1 349.7 25.4 85.4 10.73
## 279 1 349.7 25.4 85.4 22.03
## 280 1 349.7 25.4 85.4 9.77
## 281 1 352.6 26.7 84.7 9.27
## 282 1 349.7 25.4 85.4 24.77
## 283 1 353.5 27.5 84.9 0.00
## 284 1 18.7 6.6 86.9 1.10
## 285 1 15.8 4.9 85.2 24.24
## 286 1 411.8 169.7 93.9 0.00
## 287 1 437.7 183.1 91.2 0.00
## 288 1 474.9 104.2 91.6 0.00
## 289 1 474.9 104.2 91.6 0.00
## 290 1 474.9 104.2 91.6 0.00
## 291 1 474.9 104.2 91.6 0.00
## 292 1 474.9 104.2 91.6 8.00
## 293 1 466.3 100.2 91.6 2.64
## 294 1 430.8 180.4 93.1 86.45
## 295 1 440.9 88.8 92.3 6.57
## 296 1 430.8 180.4 93.1 0.00
## 297 1 290.8 89.5 90.4 0.90
## 298 1 290.8 89.5 90.4 0.00
## 299 1 377.2 147.8 91.2 0.00
## 300 1 233.8 71.0 53.4 0.00
## 301 1 298.1 93.3 90.4 0.00
## 302 1 298.1 93.3 90.4 3.52
## 303 1 232.1 94.1 91.1 0.00
## 304 1 232.1 94.1 91.1 0.00
## 305 1 113.8 28.0 85.1 0.00
## 306 1 714.3 84.1 89.6 0.00
## 307 1 714.3 84.1 89.6 0.41
## 308 1 714.3 84.1 89.6 5.18
## 309 1 758.1 105.8 92.4 0.00
## 310 1 758.1 105.8 92.4 0.00
## 311 1 758.1 105.8 92.4 0.00
## 312 1 758.1 105.8 92.4 14.29
## 313 1 706.6 46.2 50.4 0.00
## 314 1 777.1 115.4 92.6 0.00
## 315 1 777.1 115.4 92.6 1.58
## 316 1 817.5 134.7 91.2 0.00
## 317 1 739.4 96.2 92.4 0.00
## 318 1 739.4 96.2 92.4 3.78
## 319 1 783.5 119.0 92.8 0.00
## 320 1 783.5 119.0 92.8 4.41
## 321 1 783.5 119.0 92.8 34.36
## 322 1 783.5 119.0 92.8 7.21
## 323 1 783.5 119.0 92.8 1.01
## 324 1 822.8 136.9 90.7 2.18
## 325 1 726.9 53.3 88.1 4.42
## 326 1 751.5 102.3 92.2 0.00
## 327 1 751.5 102.3 92.2 0.00
## 328 1 751.5 102.3 92.2 0.00
## 329 1 751.5 102.3 92.2 0.00
## 330 1 751.5 102.3 92.2 3.33
## 331 1 751.5 102.3 92.2 6.58
## 332 1 795.3 124.4 91.2 15.64
## 333 1 795.3 124.4 91.2 11.22
## 334 1 721.1 87.7 92.1 2.13
## 335 1 764.0 108.4 91.6 0.00
## 336 1 764.0 108.4 91.6 0.00
## 337 1 764.0 108.4 91.6 0.00
## 338 1 764.0 108.4 91.6 56.04
## 339 1 764.0 108.4 91.6 7.48
## 340 1 764.0 108.4 91.6 1.47
## 341 1 764.0 108.4 91.6 3.93
## 342 1 770.3 111.7 91.9 0.00
## 343 1 807.1 130.1 91.5 0.00
## 344 1 807.1 130.1 91.5 2.18
## 345 1 807.1 130.1 91.5 6.10
## 346 1 807.1 130.1 91.5 5.83
## 347 1 807.1 130.1 91.5 28.19
## 348 1 745.3 99.0 92.1 0.00
## 349 1 745.3 99.0 92.1 0.00
## 350 1 745.3 99.0 92.1 1.64
## 351 1 745.3 99.0 92.1 3.71
## 352 1 745.3 99.0 92.1 7.31
## 353 1 745.3 99.0 92.1 2.03
## 354 1 745.3 99.0 92.1 1.72
## 355 1 745.3 99.0 92.1 5.97
## 356 1 745.3 99.0 92.1 13.06
## 357 1 745.3 99.0 92.1 1.26
## 358 1 789.7 122.0 92.5 0.00
## 359 1 789.7 122.0 92.5 0.00
## 360 1 789.7 122.0 92.5 8.12
## 361 1 789.7 122.0 92.5 1.09
## 362 1 789.7 122.0 92.5 3.94
## 363 1 732.3 55.2 88.2 0.52
## 364 1 770.3 111.7 91.9 2.93
## 365 1 770.3 111.7 91.9 5.65
## 366 1 770.3 111.7 91.9 20.03
## 367 1 812.1 132.3 91.1 1.75
## 368 1 812.1 132.3 91.1 0.00
## 369 1 744.4 94.3 91.2 12.64
## 370 1 825.1 276.3 91.0 0.00
## 371 1 825.1 276.3 91.0 11.06
## 372 1 520.5 133.6 91.9 0.00
## 373 1 664.5 203.2 92.0 0.00
## 374 1 698.6 222.4 94.8 0.00
## 375 1 855.3 290.0 90.3 18.30
## 376 1 744.4 94.3 91.2 39.35
## 377 1 672.6 207.0 92.1 0.00
## 378 1 715.1 231.1 93.7 174.63
## 379 1 30.6 18.9 90.9 0.00
## 380 1 171.4 1.1 18.7 0.00
## 381 1 458.8 101.3 93.7 7.73
## 382 1 643.0 194.1 90.7 16.33
## 383 1 690.0 217.7 95.2 5.86
## 384 1 753.8 248.4 91.6 42.87
## 385 1 819.1 273.8 91.6 12.18
## 386 1 613.0 181.3 91.6 16.00
## 387 1 750.5 96.7 90.5 24.59
## 388 1 30.6 18.9 90.9 0.00
## 389 1 706.7 227.0 94.8 28.74
## 390 1 706.7 227.0 94.8 0.00
## 391 1 58.3 9.5 84.7 9.96
## 392 1 738.1 91.3 91.1 30.18
## 393 1 825.1 276.3 91.0 70.76
## 394 1 25.6 15.0 93.4 0.00
## 395 1 46.7 4.6 84.1 0.00
## 396 1 56.9 9.0 85.0 51.78
## 397 1 750.5 96.7 90.5 3.64
## 398 1 613.0 181.3 91.6 3.63
## 399 1 715.1 231.1 93.7 0.00
## 400 1 297.7 49.5 93.3 0.00
## 401 1 297.7 49.5 93.3 8.16
## 402 1 731.7 88.2 91.1 4.95
## 403 1 706.7 227.0 94.8 0.00
## 404 1 643.0 194.1 90.7 0.00
## 405 1 725.1 84.8 87.9 6.04
## 406 1 680.9 212.1 94.6 0.00
## 407 1 860.6 291.3 87.1 3.95
## 408 1 55.0 8.2 84.7 0.00
## 409 1 855.3 290.0 90.3 7.80
## 410 1 450.2 96.2 92.3 0.00
## 411 1 52.8 7.3 84.1 0.00
## 412 1 43.6 3.2 84.6 4.62
## 413 1 442.1 92.1 92.3 1.63
## 414 1 715.1 231.1 93.7 0.00
## 415 1 723.1 235.1 93.6 0.00
## 416 1 698.6 222.4 94.8 746.28
## 417 1 575.8 164.1 92.7 7.02
## 418 1 28.3 17.3 93.4 0.00
## 419 1 664.5 203.2 92.0 2.44
## 420 1 613.0 181.3 91.6 3.05
## 421 1 635.9 191.4 91.7 185.76
## 422 1 690.0 217.7 95.2 0.00
## 423 1 795.9 263.1 88.9 6.30
## 424 1 744.4 94.3 91.2 0.72
## 425 1 715.1 231.1 93.7 4.96
## 426 1 753.8 248.4 91.6 0.00
## 427 1 753.8 248.4 91.6 0.00
## 428 1 672.6 207.0 92.1 2.35
## 429 1 698.6 222.4 94.8 0.00
## 430 1 613.0 181.3 91.6 3.20
## 431 1 849.3 287.2 89.7 0.00
## 432 1 605.3 178.0 92.1 6.36
## 433 1 698.6 222.4 94.8 0.00
## 434 1 723.1 235.1 93.6 15.34
## 435 1 811.2 269.8 90.6 0.00
## 436 1 376.6 84.7 90.8 0.00
## 437 1 672.6 207.0 92.1 0.54
## 438 1 768.4 253.6 89.4 0.00
## 439 1 715.1 231.1 93.7 6.43
## 440 1 738.1 91.3 91.1 0.33
## 441 1 855.3 290.0 90.3 0.00
## 442 1 672.6 207.0 92.1 1.23
## 443 1 41.6 24.9 87.9 3.35
## 444 1 368.3 80.9 90.7 0.00
## 445 1 855.3 290.0 90.3 9.96
## 446 1 100.7 47.9 94.0 0.00
## 447 1 664.5 203.2 92.0 0.00
## 448 1 28.3 17.3 93.4 0.00
## 449 1 844.0 284.9 89.7 0.00
## 450 1 613.0 181.3 91.6 0.00
## 451 1 690.0 217.7 95.2 6.43
## 452 1 649.9 196.8 90.5 9.71
## 453 1 730.6 238.2 91.5 0.00
## 454 1 803.3 266.2 89.4 0.00
## 455 1 753.8 248.4 91.6 0.00
## 456 1 567.2 160.0 94.6 0.00
## 457 1 753.8 248.4 91.6 0.00
## 458 1 635.9 191.4 91.7 82.75
## 459 1 715.1 231.1 93.7 3.32
## 460 1 819.1 273.8 91.6 1.94
## 461 1 715.1 231.1 93.7 0.00
## 462 1 715.1 231.1 93.7 0.00
## 463 1 825.1 276.3 91.0 3.71
## 464 1 16.2 4.4 75.1 5.39
## 465 1 16.2 4.4 75.1 2.14
## 466 1 15.3 3.6 79.5 6.84
## 467 1 36.9 15.1 87.2 3.18
## 468 1 41.1 18.5 90.2 5.55
## 469 1 43.5 20.6 91.3 6.61
## 470 1 25.6 14.6 91.0 61.13
## 471 1 25.6 14.6 91.0 0.00
## 472 1 73.7 25.4 89.6 38.48
## 473 1 229.0 96.2 88.2 1.94
## 474 1 252.6 61.1 90.5 70.32
## 475 1 316.7 103.8 93.0 10.08
## 476 1 350.2 121.7 93.7 3.19
## 477 1 395.0 85.3 93.5 1.76
## 478 1 423.4 101.3 93.7 7.36
## 479 1 423.4 101.3 93.7 2.21
## 480 1 431.6 103.9 89.2 278.53
## 481 1 560.0 114.4 93.2 2.75
## 482 1 560.0 114.4 93.2 0.00
## 483 1 587.1 130.3 94.9 1.29
## 484 1 587.1 130.3 94.9 0.00
## 485 1 587.1 130.3 94.9 26.43
## 486 1 596.3 135.5 95.0 2.07
## 487 1 605.8 141.3 95.1 2.00
## 488 1 605.8 141.3 95.1 16.40
## 489 1 605.8 141.3 95.1 46.70
## 490 1 605.8 141.3 95.1 0.00
## 491 1 605.8 141.3 95.1 0.00
## 492 1 624.1 152.0 95.8 0.00
## 493 1 633.6 158.0 95.9 0.00
## 494 1 633.6 158.0 95.9 43.32
## 495 1 643.0 164.0 96.0 8.59
## 496 1 661.8 175.5 96.2 0.00
## 497 1 661.8 175.5 96.2 2.77
## 498 1 671.2 181.1 96.1 14.68
## 499 1 671.2 181.1 96.1 40.54
## 500 1 671.2 181.1 96.1 10.82
## 501 1 671.2 181.1 96.1 0.00
## 502 1 671.2 181.1 96.1 0.00
## 503 1 671.2 181.1 96.1 0.00
## 504 1 689.1 139.4 94.5 1.95
## 505 1 689.1 139.4 94.5 49.59
## 506 1 744.4 163.2 91.0 5.80
## 507 1 752.6 166.9 91.0 0.00
## 508 1 752.6 166.9 91.0 0.00
## 509 1 752.6 166.9 91.0 0.00
## 510 1 752.6 166.9 91.0 2.17
## 511 1 752.6 166.9 91.0 0.43
## 512 1 665.6 56.7 81.6 0.00
## 513 1 665.6 56.7 81.6 6.44
## 514 1 665.6 56.7 81.6 54.29
## 515 1 665.6 56.7 81.6 11.16
## 516 1 614.7 146.0 94.4 0.00
## 517 1 106.7 3.0 79.5 0.00
A=t(X)%*%X
A#Matriz de COV
## ones Dc Dmc Ffmc Area
## ones 517.00 283285 57321.0 46863.3 6642.05
## Dc 283285.00 186976201 37001137.7 25911813.5 4041823.70
## Dmc 57321.00 37001138 8471920.6 5265644.3 889977.48
## Ffmc 46863.30 25911813 5265644.3 4263632.2 609341.26
## Area 6642.05 4041824 889977.5 609341.3 2176196.98
InvA=solve(A)
InvA
## ones Dc Dmc Ffmc Area
## ones 5.718194e-01 3.769606e-06 1.515401e-04 -6.495819e-03 4.601541e-06
## Dc 3.769606e-06 5.953828e-08 -1.501556e-07 -2.178741e-07 3.279119e-10
## Dmc 1.515401e-04 -1.501556e-07 9.343413e-07 -1.902275e-06 -3.310471e-08
## Ffmc -6.495819e-03 -2.178741e-07 -1.902275e-06 7.531764e-05 -8.041649e-08
## Area 4.601541e-06 3.279119e-10 -3.310471e-08 -8.041649e-08 4.809190e-07
tXy=t(X)%*%as.matrix(data_correlacion[,1])
tXy
## [,1]
## ones 9765.7
## Dc 5719829.9
## Dmc 1172859.8
## Ffmc 892346.1
## Area 144124.3
InvA%*%tXy
## [,1]
## ones -12.341505913
## Dc 0.006878423
## Dmc 0.014622951
## Ffmc 0.284288893
## Area 0.005538455
FUNCIÓN LINEAL DEL MODELO: Ecuación matemática que describe la relación entre las variables independientes ‘Dc’,‘Dmc’,‘Ffmc’,‘Area’ y la variable dependiente ‘Temp’. La relación se asume lineal, lo que significa que los cambios en las variables independientes afectan la variable dependiente de manera proporcional.
modelo=lm(data_correlacion$Temp~data_correlacion$Dc+data_correlacion$Dmc+data_correlacion$Ffmc+data_correlacion$Area)
modelo
##
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc +
## data_correlacion$Ffmc + data_correlacion$Area)
##
## Coefficients:
## (Intercept) data_correlacion$Dc data_correlacion$Dmc
## -12.341506 0.006878 0.014623
## data_correlacion$Ffmc data_correlacion$Area
## 0.284289 0.005538
F-statistic: 67.16 on 4 and 512 DF. => significancia global del modelo.
p-value: < 2.2e-16 => significancia estadística de cada uno de los predictores (variables independientes Dc, Dmc, Ffmc, Area) del modelo.
Se rechaza Ho. En el modelo existen 3 Bi diferentes a 0.
(Intercept) 0.000591
data_correlacion$Dc 4.41e-09
data_correlacion$Dmc 0.001437
data_correlacion$Ffmc 1.20e-11
data_correlacion$Area 0.091309 => Se excluye la variable ‘Area’ porque es mayor a la significancia 0.025
Multiple R-squared (R2): 0.3441 => Variabilidad de la variable dependiente a partir de las variables independientes
Ajusted R-squared (R2 ajustado): 0.339 => versión ajustada del Multiple R-squared
summary(modelo)
##
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc +
## data_correlacion$Ffmc + data_correlacion$Area)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.4091 -2.9314 0.0189 3.0714 12.3724
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.341506 3.569892 -3.457 0.000591 ***
## data_correlacion$Dc 0.006878 0.001152 5.971 4.41e-09 ***
## data_correlacion$Dmc 0.014623 0.004563 3.204 0.001437 **
## data_correlacion$Ffmc 0.284289 0.040971 6.939 1.20e-11 ***
## data_correlacion$Area 0.005538 0.003274 1.692 0.091309 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.721 on 512 degrees of freedom
## Multiple R-squared: 0.3441, Adjusted R-squared: 0.339
## F-statistic: 67.16 on 4 and 512 DF, p-value: < 2.2e-16
Para este segundo modelo se creo la variable ‘modelo2’.
El p-valor de la variable Area es mayor a 0.025, por lo tanto no es relevante su relación con la variable ‘Temp - Temperatura’ y se procede a excluirla del segundo modelo.
modelo2=lm(data_correlacion$Temp~data_correlacion$Dc+data_correlacion$Dmc+data_correlacion$Ffmc)
modelo2
##
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc +
## data_correlacion$Ffmc)
##
## Coefficients:
## (Intercept) data_correlacion$Dc data_correlacion$Dmc
## -12.394499 0.006875 0.015004
## data_correlacion$Ffmc
## 0.285215
F-statistic: 88.27 on 3 and 513 DF. => significancia global del modelo.
p-value: < 2.2e-16 => significancia estadística de cada uno de los predictores (variables independientes Dc, Dmc, Ffmc) del modelo.
Las tres variables independientes del modelo son diferentes a 0.
(Intercept) 0.000573
data_correlacion$Dc 4.77e-09
data_correlacion$Dmc 0.001085
data_correlacion$Ffmc 1.12e-11
Multiple R-squared (R2): 0.3405 => Variabilidad de la variable dependiente a partir de las variables independientes => 34.05 %
Ajusted R-squared (R2 ajustado): 0.3366 => versión ajustada del Multiple R-squared => 33.66 %
summary(modelo2)
##
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc +
## data_correlacion$Ffmc)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.3496 -2.9654 0.0344 3.0438 12.4364
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.394499 3.576226 -3.466 0.000573 ***
## data_correlacion$Dc 0.006875 0.001154 5.957 4.77e-09 ***
## data_correlacion$Dmc 0.015004 0.004566 3.286 0.001085 **
## data_correlacion$Ffmc 0.285215 0.041041 6.949 1.12e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.729 on 513 degrees of freedom
## Multiple R-squared: 0.3405, Adjusted R-squared: 0.3366
## F-statistic: 88.27 on 3 and 513 DF, p-value: < 2.2e-16
En el primer modelo se usaron las variables independientes ‘Dc,Dmc,Ffmc,Area’, se evidencio que la variable Area su p-valor 0.091 es mayor a 0.025, por lo tanto no es relevante su relación con la variable ‘Temp - Temperatura’ y se procedio a excluirla del segundo modelo.
Los coeficientes del segundo modelo son positivos y estadísticamente significativos, significa que la sequía profunda (Dc), la sequedad de los combustibles intermedios (Dmc) y la sequedad de los combustibles finos (Ffmc) están relacionados con aumentos en la temperatura.
La temperatura esta fuertemente influenciada por el estado de sequedad de los combustibles, y los índices Dc, Dmc y Ffmc proporcionan una buena estimación para predecir el comportamiento de la temperatura en un ambiente determinado.
# Como primer paso se crea el repositorio CRAN
options(repos = c(CRAN = "https://cloud.r-project.org/"))
# Se instala y se carga las librerías necesarias que se usaran en el análisis
install.packages("reshape2")
## Installing package into 'C:/Users/Ing. Jose Palma/AppData/Local/R/win-library/4.4'
## (as 'lib' is unspecified)
## package 'reshape2' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Ing. Jose Palma\AppData\Local\Temp\Rtmp46ZRhA\downloaded_packages
install.packages("factoextra")
## Installing package into 'C:/Users/Ing. Jose Palma/AppData/Local/R/win-library/4.4'
## (as 'lib' is unspecified)
## package 'factoextra' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Ing. Jose Palma\AppData\Local\Temp\Rtmp46ZRhA\downloaded_packages
library(dplyr) # Librería usada para manipulación y transformación de datos
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2) # Librería usada para creación de gráficos estadísticos
library(factoextra) # Librería usada para ACP y biplot
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(reshape2) # Librería usada para transformar datos
# Se crea el dataset mod_incendio con las variables de Incendios Forestales
mod_incendio <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv",
header = TRUE,
col.names = c('Eje_X','Eje_Y','Month',
'Day','Ffmc','Dmc','Dc',
'Isi','Temp','Rh','Wind','Rain','Area'))
# Se crea un nuevo dataset 'data_varia_cuanti' solo con las variables cuantitativas para el ACP
data_varia_cuanti <- mod_incendio[, c('Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')]
# Se crea variable 'mod_normalizado' para normalizar los datos del dataset 'data_varia_cuanti'
mod_normalizado <- scale(data_varia_cuanti)
# Se analiza el modelo normalizado con los componentes principales
acp <- prcomp(mod_normalizado, center = TRUE, scale. = TRUE)
# Coeficientes de los componentes rotation
coeficientes <- acp$rotation
coeficientes_df <- as.data.frame(coeficientes)
coeficientes_df$Variable <- rownames(coeficientes_df)
# Gráfico de coeficientes de los componentes
coeficientes_melted <- melt(coeficientes_df, id.vars = "Variable")
ggplot(coeficientes_melted, aes(x = variable, y = value, fill = Variable)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Coeficientes de las Componentes Principales - Incendios Forestales",
x = "Componente Principal",
y = "Coeficiente") +
theme_minimal() +
scale_fill_manual(values = c("Ffmc" = "brown",
"Dmc" = "green",
"Dc" = "orange",
"Isi" = "violet",
"Temp" = "red",
"Rh" = "cyan",
"Wind" = "pink",
"Rain" = "black",
"Area" = "yellow"))
varianza_explicada <- acp$sdev^2
proporcion_varianza <- varianza_explicada / sum(varianza_explicada)
ggplot(data.frame(Componente = factor(1:length(proporcion_varianza)),
Varianza = proporcion_varianza), aes(x = Componente, y = Varianza)) +
geom_bar(stat = "identity", fill = "steelblue") +
labs(title = "Varianza Explicada por Cada Componente - Incendio Forestales",
x = "Componente Principal",
y = "Proporción de la Varianza") +
theme_minimal()
fviz_pca_biplot(acp,
repel = TRUE,
col.var = "red",
col.ind = "black",
title = "Biplot de las Dos Primeras Componentes Principales")
Analizando el componente principal PC1, la flechas más largas son las de las variables Dc, Dmc, Ffmc esto indica que tienen un mayor peso o contribución a esa componente principal Temperatura. Las flechas cortas sugieren que la variable tiene poca influencia en esa componente.
Se identifica qué las variables Dc, Dmc, Ffmc, temperatura están más relacionadas entre sí y cuáles tienen una mayor influencia en la variabilidad de los datos. Las componentes principales pueden usarse para reducir la dimensionalidad del modelo, concentrando la mayor información en pocas dimensiones, lo que facilita la interpretación y predicción del comportamiento de los incendios forestales.
Las primeras componentes, PC1 (variables Dc, Dmc, Ffmc) y PC2 (variables temperatura,Isi), capturan la mayor parte de la variabilidad de los datos. En la gráfica se visualiza que PC1 explica alrededor de un 50% de la varianza lo que significa que este componentes capturan la información relevante de las variables originales.
Los componentes Dc, Dmc, Ffmc son las más relevantes para explicar el comportamiento de los incendios a partir de la variable temperatura.
En este gráfico bidimensional se visualiza la relación entre las variables originales y las observaciones. Se entiende cómo las variables temperatura, Dc, Dmc, Ffmc se relacionan entre sí y cómo afectan a las observaciones días específicos, áreas, o eventos de incendios.
Variables con flechas cercanas en dirección están correlacionadas positivamente. Las variables temperatura y Dc apuntan en la misma dirección, significa que cuando aumenta la temperatura, también tiende a aumentar el índice de sequía profunda (Dc).