Objetivo

Aplicar los métodos estadísticos multivariantes en el análisis de datos.

Descripción

El taller consiste en realizar un informe aplicando métodos multivariantes, el conjunto de datos utilizado en el primer taller fue FOREST FIRES.

Paso_1: Importar librerias necesarias, se instala la libreria corrplot.

library(corrplot)
## corrplot 0.94 loaded

Paso_2: Cargar los datos en R leyendo una URL desde internet y se renombra las variables.

data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv", header = TRUE)
names(data) <- c('Eje_X','Eje_Y','Month','Day','Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')

ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

Paso_3: Se realiza el modelo de correlación para todas las variables cuantitativas de la data extraida y de esta manera poder seleccionar 4 variables con mayor correlación.

data_all_cuantitativas <- na.omit(data[, c('Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')])

corrplot.mixed(cor(data_all_cuantitativas),
               lower = "number", 
               upper = "circle",
               tl.col = "black")

De acuerdo con los datos que se visualizan en el gráfico se seleccionan las siguientes variables.

Correlación Fuerte 0.50: Temp (Temperatura) con la variable DC (Código de sequía).

Correlación Fuerte 0.47: Temp (Temperatura) con la variable DMC (Código de Humedad Duff).

Correlación Fuerte 0.43: Temp (Temperatura) con la variable FFMC (Código de humedad fina del combustible).

Correlación Débil 0.10: Temp (Temperatura) con la variable Area. => Aunque la variable es débil se la escoge para que el modelo la descarte.

plot(data_all_cuantitativas,col=c("red"))

Paso_4: Realizamos un nuevo Modelo de Correlación, creamos el daframe ‘data_correlacion’ con las variables seleccionadas :

# Se crea la variable 'data_correlacion' con las variables seleccionadas.
data_correlacion <- na.omit(data[, c('Temp','Dc','Dmc','Ffmc','Area')])
corrplot.mixed(cor(data_correlacion),
               lower = "number", 
               upper = "circle",
               tl.col = "black")

plot(data_correlacion,col=c("red"))

1) Ecuación matemática del modelo (y=x1+x2+x3+x4)

Primer Modelo

Se crea la variable ‘modelo’ usando el dataset ‘data_correlacion’, se define las variables independientes y dependiente.

Variable Dependiente ‘y’: Temp. Modelo de regresión para predecir temperatura usando las variables independientes.

Variables Independientes ‘x’: Dc, Dmc, Ffmc, Area

y=x1+x2+x3+x4

y=0.50+0.47+0.43+0.10

y=1,50

X=as.matrix(cbind("ones"=c(1:1),data_correlacion[,2:5]))
X
##     ones    Dc   Dmc Ffmc    Area
## 1      1  94.3  26.2 86.2    0.00
## 2      1 669.1  35.4 90.6    0.00
## 3      1 686.9  43.7 90.6    0.00
## 4      1  77.5  33.3 91.7    0.00
## 5      1 102.2  51.3 89.3    0.00
## 6      1 488.0  85.3 92.3    0.00
## 7      1 495.6  88.9 92.3    0.00
## 8      1 608.2 145.4 91.5    0.00
## 9      1 692.6 129.5 91.0    0.00
## 10     1 698.6  88.0 92.5    0.00
## 11     1 698.6  88.0 92.5    0.00
## 12     1 713.0  73.2 92.8    0.00
## 13     1 665.3  70.8 63.5    0.00
## 14     1 686.5 126.5 90.9    0.00
## 15     1 699.6 133.3 92.9    0.00
## 16     1 713.9 141.2 93.3    0.00
## 17     1  80.8  35.8 91.7    0.00
## 18     1 664.2  32.8 84.9    0.00
## 19     1  70.8  27.9 89.2    0.00
## 20     1  97.1  27.4 86.3    0.00
## 21     1 692.6 129.5 91.0    0.00
## 22     1 724.3  78.5 91.8    0.00
## 23     1 200.0  96.3 94.3    0.00
## 24     1 537.4 110.9 90.2    0.00
## 25     1 594.2 139.4 93.5    0.00
## 26     1 601.4 142.4 91.4    0.00
## 27     1 668.0 117.9 92.4    0.00
## 28     1 686.5 126.5 90.9    0.00
## 29     1 721.4 145.4 93.4    0.00
## 30     1 728.6 149.3 93.5    0.00
## 31     1 692.3  85.1 94.3    0.00
## 32     1 709.9  91.8 88.6    0.00
## 33     1 706.8  69.7 88.6    0.00
## 34     1 718.3  75.6 91.7    0.00
## 35     1 724.3  78.5 91.8    0.00
## 36     1 730.2  80.7 90.3    0.00
## 37     1 669.1  35.4 90.6    0.00
## 38     1 682.6  41.5 90.0    0.00
## 39     1 686.9  43.7 90.6    0.00
## 40     1  67.6  25.7 88.1    0.00
## 41     1 366.7  60.6 79.5    0.00
## 42     1 624.2  96.9 90.2    0.00
## 43     1 647.1 108.3 94.8    0.00
## 44     1 698.6  88.0 92.5    0.00
## 45     1 735.7  82.9 90.1    0.00
## 46     1 692.3  85.1 94.3    0.00
## 47     1 686.5 126.5 90.9    0.00
## 48     1 442.9  62.3 94.2    0.00
## 49     1  64.7  23.9 87.2    0.00
## 50     1 103.8  52.2 87.6    0.00
## 51     1 706.4 137.0 92.9    0.00
## 52     1 631.2  99.6 90.2    0.00
## 53     1 654.1 111.2 92.1    0.00
## 54     1 654.1 111.2 92.1    0.00
## 55     1 661.3 114.3 91.7    0.00
## 56     1 706.4 137.0 92.9    0.00
## 57     1 730.2  80.7 90.3    0.00
## 58     1 691.8  46.5 92.6    0.00
## 59     1  34.0   9.3 84.0    0.00
## 60     1  43.0  13.2 86.6    0.00
## 61     1 102.2  51.3 89.3    0.00
## 62     1 102.2  51.3 89.3    0.00
## 63     1 466.6  75.3 93.0    0.00
## 64     1 631.2  99.6 90.2    0.00
## 65     1 638.8 103.2 91.1    0.00
## 66     1 661.3 114.3 91.7    0.00
## 67     1 668.0 117.9 92.4    0.00
## 68     1 668.0 117.9 92.4    0.00
## 69     1 668.0 117.9 92.4    0.00
## 70     1  77.5  33.3 91.7    0.00
## 71     1  97.8  48.3 91.2    0.00
## 72     1 692.3  85.1 94.3    0.00
## 73     1  77.5  33.3 91.7    0.00
## 74     1 614.5 147.3 88.8    0.00
## 75     1 713.9 141.2 93.3    0.00
## 76     1  26.6   6.8 84.2    0.00
## 77     1  43.0  13.2 86.6    0.00
## 78     1 103.8  52.2 87.6    0.00
## 79     1 529.8 108.0 90.1    0.00
## 80     1 561.6 121.2 91.0    0.00
## 81     1 601.4 142.4 91.4    0.00
## 82     1 631.2  99.6 90.2    0.00
## 83     1 647.1 108.3 94.8    0.00
## 84     1 654.1 111.2 92.1    0.00
## 85     1 661.3 114.3 91.7    0.00
## 86     1 706.4 137.0 92.9    0.00
## 87     1 706.4 137.0 92.9    0.00
## 88     1 706.4 137.0 92.9    0.00
## 89     1 728.6 149.3 93.5    0.00
## 90     1  80.8  35.8 91.7    0.00
## 91     1 624.2  96.9 90.2    0.00
## 92     1  80.8  35.8 91.7    0.00
## 93     1 488.0  85.3 92.3    0.00
## 94     1 601.4 142.4 91.4    0.00
## 95     1 638.8 103.2 91.1    0.00
## 96     1 704.4  90.0 89.7    0.00
## 97     1  30.2   8.0 83.9    0.00
## 98     1  15.5   2.4 69.0    0.00
## 99     1 601.4 142.4 91.4    0.00
## 100    1 601.4 142.4 91.4    0.00
## 101    1 601.4 142.4 91.4    0.00
## 102    1 614.5 147.3 88.8    0.00
## 103    1 647.1 108.3 94.8    0.00
## 104    1 674.4 121.1 92.5    0.00
## 105    1   9.3   3.7 82.1    0.00
## 106    1  57.3  19.5 85.9    0.00
## 107    1  74.3  30.7 91.4    0.00
## 108    1 631.2  99.6 90.2    0.00
## 109    1 698.6  88.0 92.5    0.00
## 110    1 709.9  91.8 88.6    0.00
## 111    1  57.3  19.5 85.9    0.00
## 112    1  77.5  33.3 91.7    0.00
## 113    1 704.4  90.0 89.7    0.00
## 114    1 724.3  78.5 91.8    0.00
## 115    1  67.6  25.7 88.1    0.00
## 116    1  67.6  25.7 88.1    0.00
## 117    1  80.8  35.8 91.7    0.00
## 118    1  80.8  35.8 91.7    0.00
## 119    1  86.6  39.7 90.1    0.00
## 120    1 466.6  75.3 93.0    0.00
## 121    1 608.2 145.4 91.5    0.00
## 122    1 608.2 145.4 91.5    0.00
## 123    1 680.7 124.1 92.4    0.00
## 124    1 671.9  73.4 84.4    0.00
## 125    1 692.3  85.1 94.3    0.00
## 126    1 691.8  46.5 92.6    0.00
## 127    1 103.8  52.2 87.6    0.00
## 128    1 728.6 149.3 93.5    0.00
## 129    1 673.8  37.9 91.4    0.00
## 130    1 691.8  46.5 92.6    0.00
## 131    1  87.2  21.5 68.2    0.00
## 132    1  64.7  23.9 87.2    0.00
## 133    1 102.2  51.3 89.3    0.00
## 134    1 685.2  80.9 93.7    0.00
## 135    1  67.6  25.7 88.1    0.00
## 136    1 594.2 139.4 93.5    0.00
## 137    1 680.7 124.1 92.4    0.00
## 138    1 686.5 126.5 90.9    0.00
## 139    1 313.4  48.3 85.8    0.36
## 140    1 692.6 129.5 91.0    0.43
## 141    1 686.5 126.5 90.9    0.47
## 142    1 513.3  99.9 95.5    0.55
## 143    1 529.8 108.0 90.1    0.61
## 144    1 296.3  51.3 90.0    0.71
## 145    1 513.3  99.9 95.5    0.77
## 146    1 578.8 131.7 95.2    0.90
## 147    1  86.6  39.7 90.1    0.95
## 148    1 671.9  73.4 84.4    0.96
## 149    1 647.1 108.3 94.8    1.07
## 150    1 685.2  80.9 93.7    1.12
## 151    1 433.3  56.4 92.5    1.19
## 152    1 355.2  68.6 90.1    1.36
## 153    1 424.1  51.2 90.1    1.43
## 154    1 692.3  85.1 94.3    1.46
## 155    1 721.4 145.4 93.4    1.46
## 156    1 647.1 108.3 94.8    1.56
## 157    1 721.4 145.4 93.4    1.61
## 158    1 654.1 111.2 92.1    1.63
## 159    1 654.1 111.2 92.1    1.64
## 160    1 668.0 117.9 92.4    1.69
## 161    1  86.6  39.7 90.1    1.75
## 162    1 578.8 131.7 95.2    1.90
## 163    1 100.4  50.1 90.6    1.94
## 164    1 674.4 121.1 92.5    1.95
## 165    1 704.4  90.0 89.7    2.01
## 166    1  55.0  18.2 84.9    2.14
## 167    1 654.1 111.2 92.1    2.29
## 168    1 570.5 127.1 96.0    2.51
## 169    1  97.8  48.3 91.2    2.53
## 170    1 578.8 131.7 95.2    2.55
## 171    1 699.6 133.3 92.9    2.57
## 172    1 609.6  90.4 85.6    2.69
## 173    1 601.4 142.4 91.4    2.74
## 174    1 686.5 126.5 90.9    3.07
## 175    1 624.2  96.9 90.2    3.50
## 176    1 624.2  96.9 90.2    4.53
## 177    1  55.2   9.1 81.5    4.61
## 178    1 631.2  99.6 90.2    4.69
## 179    1 735.7  82.9 90.1    4.88
## 180    1 614.5 147.3 88.8    5.23
## 181    1 680.7 124.1 92.4    5.33
## 182    1 664.2  32.8 84.9    5.44
## 183    1  48.3  15.6 86.8    6.38
## 184    1 696.1  48.5 91.7    6.83
## 185    1 586.7 135.7 93.9    6.96
## 186    1 692.6 129.5 91.0    7.04
## 187    1 102.2  51.3 89.3    7.19
## 188    1 686.5 126.5 90.9    7.30
## 189    1  89.4  41.9 90.8    7.40
## 190    1  92.4  44.0 90.7    8.24
## 191    1  97.8  48.3 91.2    8.31
## 192    1 578.8 131.7 95.2    8.68
## 193    1 647.1 108.3 94.8    8.71
## 194    1 699.6 133.3 92.9    9.41
## 195    1 647.1 108.3 94.8   10.01
## 196    1 586.7 135.7 93.9   10.02
## 197    1  55.2   9.1 81.5   10.93
## 198    1 706.4 137.0 92.9   11.06
## 199    1 692.6 129.5 91.0   11.24
## 200    1 665.3  70.8 63.5   11.32
## 201    1 692.6 129.5 91.0   11.53
## 202    1  83.7  37.6 90.1   12.10
## 203    1  32.1   8.7 83.9   13.05
## 204    1 673.8  37.9 91.4   13.70
## 205    1 100.4  50.1 90.6   13.99
## 206    1 706.4 137.0 92.9   14.57
## 207    1 594.2 139.4 93.5   15.45
## 208    1 692.6 129.5 91.0   17.20
## 209    1 668.0 117.9 92.4   19.23
## 210    1 685.2  80.9 93.7   23.41
## 211    1 686.9  43.7 90.6   24.23
## 212    1 594.2 139.4 93.5   26.00
## 213    1 692.3  85.1 94.3   26.13
## 214    1 103.8  52.2 87.6   27.35
## 215    1  80.8  35.8 91.7   28.66
## 216    1  80.8  35.8 91.7   28.66
## 217    1 680.7 124.1 92.4   29.48
## 218    1 709.9  91.8 88.6   30.32
## 219    1 699.6 133.3 92.9   31.72
## 220    1  86.6  39.7 90.1   31.86
## 221    1 631.2  99.6 90.2   32.07
## 222    1 713.9 141.2 93.3   35.88
## 223    1 103.8  52.2 87.6   36.85
## 224    1 309.9 150.3 88.3   37.02
## 225    1 735.7  82.9 90.1   37.71
## 226    1 728.6 149.3 93.5   48.55
## 227    1 696.1  48.5 91.7   49.37
## 228    1 480.8  81.8 92.2   58.30
## 229    1 728.6 149.3 93.5   64.10
## 230    1 480.8  81.8 92.2   71.30
## 231    1 699.6 133.3 92.9   88.49
## 232    1 728.6 149.3 93.5   95.18
## 233    1 692.6 129.5 91.0  103.39
## 234    1 671.9  73.4 84.4  105.66
## 235    1 674.4 121.1 92.5  154.88
## 236    1 601.4 142.4 91.4  196.48
## 237    1 674.4 121.1 92.5  200.94
## 238    1 692.6 129.5 91.0  212.88
## 239    1 674.4 121.1 92.5 1090.84
## 240    1   7.9   3.0 81.9    0.00
## 241    1  43.5  17.2 88.0    0.00
## 242    1  85.3  23.3 83.0    0.00
## 243    1 589.9 122.3 94.2   10.13
## 244    1 700.7 175.1 91.8    0.00
## 245    1 700.7 175.1 91.8    2.87
## 246    1 700.7 175.1 91.8    0.76
## 247    1 700.7 175.1 91.8    0.09
## 248    1 503.6  91.6 92.2    0.75
## 249    1 666.7 157.3 93.1    0.00
## 250    1 666.7 157.3 93.1    2.47
## 251    1 666.7 157.3 93.1    0.68
## 252    1 666.7 157.3 93.1    0.24
## 253    1 666.7 157.3 93.1    0.21
## 254    1 565.5 109.2 91.9    1.52
## 255    1 621.7 138.1 91.6   10.34
## 256    1 694.8  77.0 87.5    0.00
## 257    1 581.1 117.2 94.2    8.02
## 258    1 581.1 117.2 94.2    0.68
## 259    1 692.3 170.9 91.8    0.00
## 260    1 692.3 170.9 91.8    1.38
## 261    1 542.0  97.9 93.6    8.85
## 262    1 573.0 112.4 91.6    3.30
## 263    1 573.0 112.4 91.6    4.25
## 264    1 629.1 141.1 91.1    1.56
## 265    1 684.4 167.6 94.3    6.54
## 266    1 550.3 102.2 93.7    0.79
## 267    1 607.1 131.7 94.3    0.17
## 268    1 658.2 152.6 92.1    0.00
## 269    1 658.2 152.6 92.1    0.00
## 270    1 658.2 152.6 92.1    4.40
## 271    1 658.2 152.6 92.1    0.52
## 272    1 658.2 152.6 92.1    9.27
## 273    1 658.2 152.6 92.1    3.09
## 274    1 353.5  27.2 84.4    8.98
## 275    1 354.6  27.8 84.0   11.19
## 276    1 352.0  26.4 84.6    5.38
## 277    1 349.7  25.4 85.4   17.85
## 278    1 349.7  25.4 85.4   10.73
## 279    1 349.7  25.4 85.4   22.03
## 280    1 349.7  25.4 85.4    9.77
## 281    1 352.6  26.7 84.7    9.27
## 282    1 349.7  25.4 85.4   24.77
## 283    1 353.5  27.5 84.9    0.00
## 284    1  18.7   6.6 86.9    1.10
## 285    1  15.8   4.9 85.2   24.24
## 286    1 411.8 169.7 93.9    0.00
## 287    1 437.7 183.1 91.2    0.00
## 288    1 474.9 104.2 91.6    0.00
## 289    1 474.9 104.2 91.6    0.00
## 290    1 474.9 104.2 91.6    0.00
## 291    1 474.9 104.2 91.6    0.00
## 292    1 474.9 104.2 91.6    8.00
## 293    1 466.3 100.2 91.6    2.64
## 294    1 430.8 180.4 93.1   86.45
## 295    1 440.9  88.8 92.3    6.57
## 296    1 430.8 180.4 93.1    0.00
## 297    1 290.8  89.5 90.4    0.90
## 298    1 290.8  89.5 90.4    0.00
## 299    1 377.2 147.8 91.2    0.00
## 300    1 233.8  71.0 53.4    0.00
## 301    1 298.1  93.3 90.4    0.00
## 302    1 298.1  93.3 90.4    3.52
## 303    1 232.1  94.1 91.1    0.00
## 304    1 232.1  94.1 91.1    0.00
## 305    1 113.8  28.0 85.1    0.00
## 306    1 714.3  84.1 89.6    0.00
## 307    1 714.3  84.1 89.6    0.41
## 308    1 714.3  84.1 89.6    5.18
## 309    1 758.1 105.8 92.4    0.00
## 310    1 758.1 105.8 92.4    0.00
## 311    1 758.1 105.8 92.4    0.00
## 312    1 758.1 105.8 92.4   14.29
## 313    1 706.6  46.2 50.4    0.00
## 314    1 777.1 115.4 92.6    0.00
## 315    1 777.1 115.4 92.6    1.58
## 316    1 817.5 134.7 91.2    0.00
## 317    1 739.4  96.2 92.4    0.00
## 318    1 739.4  96.2 92.4    3.78
## 319    1 783.5 119.0 92.8    0.00
## 320    1 783.5 119.0 92.8    4.41
## 321    1 783.5 119.0 92.8   34.36
## 322    1 783.5 119.0 92.8    7.21
## 323    1 783.5 119.0 92.8    1.01
## 324    1 822.8 136.9 90.7    2.18
## 325    1 726.9  53.3 88.1    4.42
## 326    1 751.5 102.3 92.2    0.00
## 327    1 751.5 102.3 92.2    0.00
## 328    1 751.5 102.3 92.2    0.00
## 329    1 751.5 102.3 92.2    0.00
## 330    1 751.5 102.3 92.2    3.33
## 331    1 751.5 102.3 92.2    6.58
## 332    1 795.3 124.4 91.2   15.64
## 333    1 795.3 124.4 91.2   11.22
## 334    1 721.1  87.7 92.1    2.13
## 335    1 764.0 108.4 91.6    0.00
## 336    1 764.0 108.4 91.6    0.00
## 337    1 764.0 108.4 91.6    0.00
## 338    1 764.0 108.4 91.6   56.04
## 339    1 764.0 108.4 91.6    7.48
## 340    1 764.0 108.4 91.6    1.47
## 341    1 764.0 108.4 91.6    3.93
## 342    1 770.3 111.7 91.9    0.00
## 343    1 807.1 130.1 91.5    0.00
## 344    1 807.1 130.1 91.5    2.18
## 345    1 807.1 130.1 91.5    6.10
## 346    1 807.1 130.1 91.5    5.83
## 347    1 807.1 130.1 91.5   28.19
## 348    1 745.3  99.0 92.1    0.00
## 349    1 745.3  99.0 92.1    0.00
## 350    1 745.3  99.0 92.1    1.64
## 351    1 745.3  99.0 92.1    3.71
## 352    1 745.3  99.0 92.1    7.31
## 353    1 745.3  99.0 92.1    2.03
## 354    1 745.3  99.0 92.1    1.72
## 355    1 745.3  99.0 92.1    5.97
## 356    1 745.3  99.0 92.1   13.06
## 357    1 745.3  99.0 92.1    1.26
## 358    1 789.7 122.0 92.5    0.00
## 359    1 789.7 122.0 92.5    0.00
## 360    1 789.7 122.0 92.5    8.12
## 361    1 789.7 122.0 92.5    1.09
## 362    1 789.7 122.0 92.5    3.94
## 363    1 732.3  55.2 88.2    0.52
## 364    1 770.3 111.7 91.9    2.93
## 365    1 770.3 111.7 91.9    5.65
## 366    1 770.3 111.7 91.9   20.03
## 367    1 812.1 132.3 91.1    1.75
## 368    1 812.1 132.3 91.1    0.00
## 369    1 744.4  94.3 91.2   12.64
## 370    1 825.1 276.3 91.0    0.00
## 371    1 825.1 276.3 91.0   11.06
## 372    1 520.5 133.6 91.9    0.00
## 373    1 664.5 203.2 92.0    0.00
## 374    1 698.6 222.4 94.8    0.00
## 375    1 855.3 290.0 90.3   18.30
## 376    1 744.4  94.3 91.2   39.35
## 377    1 672.6 207.0 92.1    0.00
## 378    1 715.1 231.1 93.7  174.63
## 379    1  30.6  18.9 90.9    0.00
## 380    1 171.4   1.1 18.7    0.00
## 381    1 458.8 101.3 93.7    7.73
## 382    1 643.0 194.1 90.7   16.33
## 383    1 690.0 217.7 95.2    5.86
## 384    1 753.8 248.4 91.6   42.87
## 385    1 819.1 273.8 91.6   12.18
## 386    1 613.0 181.3 91.6   16.00
## 387    1 750.5  96.7 90.5   24.59
## 388    1  30.6  18.9 90.9    0.00
## 389    1 706.7 227.0 94.8   28.74
## 390    1 706.7 227.0 94.8    0.00
## 391    1  58.3   9.5 84.7    9.96
## 392    1 738.1  91.3 91.1   30.18
## 393    1 825.1 276.3 91.0   70.76
## 394    1  25.6  15.0 93.4    0.00
## 395    1  46.7   4.6 84.1    0.00
## 396    1  56.9   9.0 85.0   51.78
## 397    1 750.5  96.7 90.5    3.64
## 398    1 613.0 181.3 91.6    3.63
## 399    1 715.1 231.1 93.7    0.00
## 400    1 297.7  49.5 93.3    0.00
## 401    1 297.7  49.5 93.3    8.16
## 402    1 731.7  88.2 91.1    4.95
## 403    1 706.7 227.0 94.8    0.00
## 404    1 643.0 194.1 90.7    0.00
## 405    1 725.1  84.8 87.9    6.04
## 406    1 680.9 212.1 94.6    0.00
## 407    1 860.6 291.3 87.1    3.95
## 408    1  55.0   8.2 84.7    0.00
## 409    1 855.3 290.0 90.3    7.80
## 410    1 450.2  96.2 92.3    0.00
## 411    1  52.8   7.3 84.1    0.00
## 412    1  43.6   3.2 84.6    4.62
## 413    1 442.1  92.1 92.3    1.63
## 414    1 715.1 231.1 93.7    0.00
## 415    1 723.1 235.1 93.6    0.00
## 416    1 698.6 222.4 94.8  746.28
## 417    1 575.8 164.1 92.7    7.02
## 418    1  28.3  17.3 93.4    0.00
## 419    1 664.5 203.2 92.0    2.44
## 420    1 613.0 181.3 91.6    3.05
## 421    1 635.9 191.4 91.7  185.76
## 422    1 690.0 217.7 95.2    0.00
## 423    1 795.9 263.1 88.9    6.30
## 424    1 744.4  94.3 91.2    0.72
## 425    1 715.1 231.1 93.7    4.96
## 426    1 753.8 248.4 91.6    0.00
## 427    1 753.8 248.4 91.6    0.00
## 428    1 672.6 207.0 92.1    2.35
## 429    1 698.6 222.4 94.8    0.00
## 430    1 613.0 181.3 91.6    3.20
## 431    1 849.3 287.2 89.7    0.00
## 432    1 605.3 178.0 92.1    6.36
## 433    1 698.6 222.4 94.8    0.00
## 434    1 723.1 235.1 93.6   15.34
## 435    1 811.2 269.8 90.6    0.00
## 436    1 376.6  84.7 90.8    0.00
## 437    1 672.6 207.0 92.1    0.54
## 438    1 768.4 253.6 89.4    0.00
## 439    1 715.1 231.1 93.7    6.43
## 440    1 738.1  91.3 91.1    0.33
## 441    1 855.3 290.0 90.3    0.00
## 442    1 672.6 207.0 92.1    1.23
## 443    1  41.6  24.9 87.9    3.35
## 444    1 368.3  80.9 90.7    0.00
## 445    1 855.3 290.0 90.3    9.96
## 446    1 100.7  47.9 94.0    0.00
## 447    1 664.5 203.2 92.0    0.00
## 448    1  28.3  17.3 93.4    0.00
## 449    1 844.0 284.9 89.7    0.00
## 450    1 613.0 181.3 91.6    0.00
## 451    1 690.0 217.7 95.2    6.43
## 452    1 649.9 196.8 90.5    9.71
## 453    1 730.6 238.2 91.5    0.00
## 454    1 803.3 266.2 89.4    0.00
## 455    1 753.8 248.4 91.6    0.00
## 456    1 567.2 160.0 94.6    0.00
## 457    1 753.8 248.4 91.6    0.00
## 458    1 635.9 191.4 91.7   82.75
## 459    1 715.1 231.1 93.7    3.32
## 460    1 819.1 273.8 91.6    1.94
## 461    1 715.1 231.1 93.7    0.00
## 462    1 715.1 231.1 93.7    0.00
## 463    1 825.1 276.3 91.0    3.71
## 464    1  16.2   4.4 75.1    5.39
## 465    1  16.2   4.4 75.1    2.14
## 466    1  15.3   3.6 79.5    6.84
## 467    1  36.9  15.1 87.2    3.18
## 468    1  41.1  18.5 90.2    5.55
## 469    1  43.5  20.6 91.3    6.61
## 470    1  25.6  14.6 91.0   61.13
## 471    1  25.6  14.6 91.0    0.00
## 472    1  73.7  25.4 89.6   38.48
## 473    1 229.0  96.2 88.2    1.94
## 474    1 252.6  61.1 90.5   70.32
## 475    1 316.7 103.8 93.0   10.08
## 476    1 350.2 121.7 93.7    3.19
## 477    1 395.0  85.3 93.5    1.76
## 478    1 423.4 101.3 93.7    7.36
## 479    1 423.4 101.3 93.7    2.21
## 480    1 431.6 103.9 89.2  278.53
## 481    1 560.0 114.4 93.2    2.75
## 482    1 560.0 114.4 93.2    0.00
## 483    1 587.1 130.3 94.9    1.29
## 484    1 587.1 130.3 94.9    0.00
## 485    1 587.1 130.3 94.9   26.43
## 486    1 596.3 135.5 95.0    2.07
## 487    1 605.8 141.3 95.1    2.00
## 488    1 605.8 141.3 95.1   16.40
## 489    1 605.8 141.3 95.1   46.70
## 490    1 605.8 141.3 95.1    0.00
## 491    1 605.8 141.3 95.1    0.00
## 492    1 624.1 152.0 95.8    0.00
## 493    1 633.6 158.0 95.9    0.00
## 494    1 633.6 158.0 95.9   43.32
## 495    1 643.0 164.0 96.0    8.59
## 496    1 661.8 175.5 96.2    0.00
## 497    1 661.8 175.5 96.2    2.77
## 498    1 671.2 181.1 96.1   14.68
## 499    1 671.2 181.1 96.1   40.54
## 500    1 671.2 181.1 96.1   10.82
## 501    1 671.2 181.1 96.1    0.00
## 502    1 671.2 181.1 96.1    0.00
## 503    1 671.2 181.1 96.1    0.00
## 504    1 689.1 139.4 94.5    1.95
## 505    1 689.1 139.4 94.5   49.59
## 506    1 744.4 163.2 91.0    5.80
## 507    1 752.6 166.9 91.0    0.00
## 508    1 752.6 166.9 91.0    0.00
## 509    1 752.6 166.9 91.0    0.00
## 510    1 752.6 166.9 91.0    2.17
## 511    1 752.6 166.9 91.0    0.43
## 512    1 665.6  56.7 81.6    0.00
## 513    1 665.6  56.7 81.6    6.44
## 514    1 665.6  56.7 81.6   54.29
## 515    1 665.6  56.7 81.6   11.16
## 516    1 614.7 146.0 94.4    0.00
## 517    1 106.7   3.0 79.5    0.00
A=t(X)%*%X
A#Matriz de COV
##           ones        Dc        Dmc       Ffmc       Area
## ones    517.00    283285    57321.0    46863.3    6642.05
## Dc   283285.00 186976201 37001137.7 25911813.5 4041823.70
## Dmc   57321.00  37001138  8471920.6  5265644.3  889977.48
## Ffmc  46863.30  25911813  5265644.3  4263632.2  609341.26
## Area   6642.05   4041824   889977.5   609341.3 2176196.98
InvA=solve(A)
InvA
##               ones            Dc           Dmc          Ffmc          Area
## ones  5.718194e-01  3.769606e-06  1.515401e-04 -6.495819e-03  4.601541e-06
## Dc    3.769606e-06  5.953828e-08 -1.501556e-07 -2.178741e-07  3.279119e-10
## Dmc   1.515401e-04 -1.501556e-07  9.343413e-07 -1.902275e-06 -3.310471e-08
## Ffmc -6.495819e-03 -2.178741e-07 -1.902275e-06  7.531764e-05 -8.041649e-08
## Area  4.601541e-06  3.279119e-10 -3.310471e-08 -8.041649e-08  4.809190e-07
tXy=t(X)%*%as.matrix(data_correlacion[,1])
tXy
##           [,1]
## ones    9765.7
## Dc   5719829.9
## Dmc  1172859.8
## Ffmc  892346.1
## Area  144124.3
InvA%*%tXy
##               [,1]
## ones -12.341505913
## Dc     0.006878423
## Dmc    0.014622951
## Ffmc   0.284288893
## Area   0.005538455

FUNCIÓN LINEAL DEL MODELO: Ecuación matemática que describe la relación entre las variables independientes ‘Dc’,‘Dmc’,‘Ffmc’,‘Area’ y la variable dependiente ‘Temp’. La relación se asume lineal, lo que significa que los cambios en las variables independientes afectan la variable dependiente de manera proporcional.

modelo=lm(data_correlacion$Temp~data_correlacion$Dc+data_correlacion$Dmc+data_correlacion$Ffmc+data_correlacion$Area)
modelo
## 
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc + 
##     data_correlacion$Ffmc + data_correlacion$Area)
## 
## Coefficients:
##           (Intercept)    data_correlacion$Dc   data_correlacion$Dmc  
##            -12.341506               0.006878               0.014623  
## data_correlacion$Ffmc  data_correlacion$Area  
##              0.284289               0.005538

Prueba de Hipótesis Global - Prueba F

F-statistic: 67.16 on 4 and 512 DF. => significancia global del modelo.

p-value: < 2.2e-16 => significancia estadística de cada uno de los predictores (variables independientes Dc, Dmc, Ffmc, Area) del modelo.

Se rechaza Ho. En el modelo existen 3 Bi diferentes a 0.

Prueba de Hipótesis Individuales - Prueba t

(Intercept) 0.000591

data_correlacion$Dc 4.41e-09

data_correlacion$Dmc 0.001437

data_correlacion$Ffmc 1.20e-11

data_correlacion$Area 0.091309 => Se excluye la variable ‘Area’ porque es mayor a la significancia 0.025

Coeficiente de Determinación (R2)

Multiple R-squared (R2): 0.3441 => Variabilidad de la variable dependiente a partir de las variables independientes

Ajusted R-squared (R2 ajustado): 0.339 => versión ajustada del Multiple R-squared

summary(modelo)
## 
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc + 
##     data_correlacion$Ffmc + data_correlacion$Area)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -15.4091  -2.9314   0.0189   3.0714  12.3724 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           -12.341506   3.569892  -3.457 0.000591 ***
## data_correlacion$Dc     0.006878   0.001152   5.971 4.41e-09 ***
## data_correlacion$Dmc    0.014623   0.004563   3.204 0.001437 ** 
## data_correlacion$Ffmc   0.284289   0.040971   6.939 1.20e-11 ***
## data_correlacion$Area   0.005538   0.003274   1.692 0.091309 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.721 on 512 degrees of freedom
## Multiple R-squared:  0.3441, Adjusted R-squared:  0.339 
## F-statistic: 67.16 on 4 and 512 DF,  p-value: < 2.2e-16

Segundo Modelo - Definitivo

Para este segundo modelo se creo la variable ‘modelo2’.

El p-valor de la variable Area es mayor a 0.025, por lo tanto no es relevante su relación con la variable ‘Temp - Temperatura’ y se procede a excluirla del segundo modelo.

modelo2=lm(data_correlacion$Temp~data_correlacion$Dc+data_correlacion$Dmc+data_correlacion$Ffmc)
modelo2
## 
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc + 
##     data_correlacion$Ffmc)
## 
## Coefficients:
##           (Intercept)    data_correlacion$Dc   data_correlacion$Dmc  
##            -12.394499               0.006875               0.015004  
## data_correlacion$Ffmc  
##              0.285215

Prueba de hipótesis global - Prueba F

F-statistic: 88.27 on 3 and 513 DF. => significancia global del modelo.

p-value: < 2.2e-16 => significancia estadística de cada uno de los predictores (variables independientes Dc, Dmc, Ffmc) del modelo.

Las tres variables independientes del modelo son diferentes a 0.

Prueba de hipótesis individuales - Prueba t

(Intercept) 0.000573

data_correlacion$Dc 4.77e-09

data_correlacion$Dmc 0.001085

data_correlacion$Ffmc 1.12e-11

Coeficiente de Determinación (R2)

Multiple R-squared (R2): 0.3405 => Variabilidad de la variable dependiente a partir de las variables independientes => 34.05 %

Ajusted R-squared (R2 ajustado): 0.3366 => versión ajustada del Multiple R-squared => 33.66 %

summary(modelo2)
## 
## Call:
## lm(formula = data_correlacion$Temp ~ data_correlacion$Dc + data_correlacion$Dmc + 
##     data_correlacion$Ffmc)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -15.3496  -2.9654   0.0344   3.0438  12.4364 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           -12.394499   3.576226  -3.466 0.000573 ***
## data_correlacion$Dc     0.006875   0.001154   5.957 4.77e-09 ***
## data_correlacion$Dmc    0.015004   0.004566   3.286 0.001085 ** 
## data_correlacion$Ffmc   0.285215   0.041041   6.949 1.12e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.729 on 513 degrees of freedom
## Multiple R-squared:  0.3405, Adjusted R-squared:  0.3366 
## F-statistic: 88.27 on 3 and 513 DF,  p-value: < 2.2e-16

Conclusión sobre el modelo

En el primer modelo se usaron las variables independientes ‘Dc,Dmc,Ffmc,Area’, se evidencio que la variable Area su p-valor 0.091 es mayor a 0.025, por lo tanto no es relevante su relación con la variable ‘Temp - Temperatura’ y se procedio a excluirla del segundo modelo.

Los coeficientes del segundo modelo son positivos y estadísticamente significativos, significa que la sequía profunda (Dc), la sequedad de los combustibles intermedios (Dmc) y la sequedad de los combustibles finos (Ffmc) están relacionados con aumentos en la temperatura.

La temperatura esta fuertemente influenciada por el estado de sequedad de los combustibles, y los índices Dc, Dmc y Ffmc proporcionan una buena estimación para predecir el comportamiento de la temperatura en un ambiente determinado.

Análisis de componentes principales (ACP)

# Como primer paso se crea el repositorio CRAN
options(repos = c(CRAN = "https://cloud.r-project.org/"))

# Se instala y se carga las librerías necesarias que se usaran en el análisis
install.packages("reshape2")
## Installing package into 'C:/Users/Ing. Jose Palma/AppData/Local/R/win-library/4.4'
## (as 'lib' is unspecified)
## package 'reshape2' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Ing. Jose Palma\AppData\Local\Temp\Rtmp46ZRhA\downloaded_packages
install.packages("factoextra")
## Installing package into 'C:/Users/Ing. Jose Palma/AppData/Local/R/win-library/4.4'
## (as 'lib' is unspecified)
## package 'factoextra' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\Ing. Jose Palma\AppData\Local\Temp\Rtmp46ZRhA\downloaded_packages
library(dplyr)       # Librería usada para manipulación y transformación de datos
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)     # Librería usada para creación de gráficos estadísticos
library(factoextra)  # Librería usada para ACP y biplot
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(reshape2)    # Librería usada para transformar datos

# Se crea el dataset mod_incendio con las variables de Incendios Forestales
mod_incendio <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv", 
                         header = TRUE,
                         col.names = c('Eje_X','Eje_Y','Month',
                                       'Day','Ffmc','Dmc','Dc',
                                       'Isi','Temp','Rh','Wind','Rain','Area'))


# Se crea un nuevo dataset 'data_varia_cuanti' solo con las variables cuantitativas para el ACP
data_varia_cuanti <- mod_incendio[, c('Ffmc','Dmc','Dc','Isi','Temp','Rh','Wind','Rain','Area')]

# Se crea variable 'mod_normalizado' para normalizar los datos del dataset 'data_varia_cuanti'
mod_normalizado <- scale(data_varia_cuanti)

# Se analiza el modelo normalizado con los componentes principales
acp <- prcomp(mod_normalizado, center = TRUE, scale. = TRUE)

Gráfica de los coeficientes de los componentes y variables originales

# Coeficientes de los componentes rotation
coeficientes <- acp$rotation
coeficientes_df <- as.data.frame(coeficientes)
coeficientes_df$Variable <- rownames(coeficientes_df)

# Gráfico de coeficientes de los componentes
coeficientes_melted <- melt(coeficientes_df, id.vars = "Variable")

ggplot(coeficientes_melted, aes(x = variable, y = value, fill = Variable)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Coeficientes de las Componentes Principales - Incendios Forestales",
       x = "Componente Principal",
       y = "Coeficiente") +
  theme_minimal() +
  scale_fill_manual(values = c("Ffmc" = "brown", 
                                "Dmc" = "green",
                                "Dc" = "orange",
                                "Isi" = "violet",
                                "Temp" = "red",
                                "Rh" = "cyan",
                                "Wind" = "pink",
                                "Rain" = "black",
                                "Area" = "yellow"))

Gráfico de la varianza explicada por cada componente

varianza_explicada <- acp$sdev^2
proporcion_varianza <- varianza_explicada / sum(varianza_explicada)

ggplot(data.frame(Componente = factor(1:length(proporcion_varianza)),
                  Varianza = proporcion_varianza), aes(x = Componente, y = Varianza)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "Varianza Explicada por Cada Componente - Incendio Forestales",
       x = "Componente Principal",
       y = "Proporción de la Varianza") +
  theme_minimal()

Biplot de las dos primeras componentes

fviz_pca_biplot(acp, 
                 repel = TRUE,
                 col.var = "red",
                 col.ind = "black",
                 title = "Biplot de las Dos Primeras Componentes Principales")

Conclusiones

Gráfica de los coeficientes de las componentes y variables originales

Analizando el componente principal PC1, la flechas más largas son las de las variables Dc, Dmc, Ffmc esto indica que tienen un mayor peso o contribución a esa componente principal Temperatura. Las flechas cortas sugieren que la variable tiene poca influencia en esa componente.

Se identifica qué las variables Dc, Dmc, Ffmc, temperatura están más relacionadas entre sí y cuáles tienen una mayor influencia en la variabilidad de los datos. Las componentes principales pueden usarse para reducir la dimensionalidad del modelo, concentrando la mayor información en pocas dimensiones, lo que facilita la interpretación y predicción del comportamiento de los incendios forestales.

Varianza Explicada por cada componetes

Las primeras componentes, PC1 (variables Dc, Dmc, Ffmc) y PC2 (variables temperatura,Isi), capturan la mayor parte de la variabilidad de los datos. En la gráfica se visualiza que PC1 explica alrededor de un 50% de la varianza lo que significa que este componentes capturan la información relevante de las variables originales.

Los componentes Dc, Dmc, Ffmc son las más relevantes para explicar el comportamiento de los incendios a partir de la variable temperatura.

Biplot (variables y observaciones) sobre las dos primeras componentes

En este gráfico bidimensional se visualiza la relación entre las variables originales y las observaciones. Se entiende cómo las variables temperatura, Dc, Dmc, Ffmc se relacionan entre sí y cómo afectan a las observaciones días específicos, áreas, o eventos de incendios.

Variables con flechas cercanas en dirección están correlacionadas positivamente. Las variables temperatura y Dc apuntan en la misma dirección, significa que cuando aumenta la temperatura, también tiende a aumentar el índice de sequía profunda (Dc).