1.Diagrama de barras - Estadística descriptiva univariante

¿Cuáles son los meses (o mes) (días) con mayor incendios?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(highcharter)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
# Suponiendo que tienes un data frame llamado "incendios" con las columnas "month" y "day"

# Agrupar los datos por mes y contar la frecuencia de incendios
datos_agrupados <- data %>%
  group_by(month) %>%
  summarise(conteo = n())

# Encontrar el mes con más incendios
mes_maximo <- datos_agrupados %>%
  slice_max(conteo) %>%
  pull(month)

# Crear el gráfico de barras, resaltando el mes con más incendios
hchart(datos_agrupados, "column", hcaes(x = month, y = conteo)) %>% 
  hc_title(text = paste("Mes con más incendios:", mes_maximo)) %>%
  hc_xAxis(title = list(text = "Mes")) %>%
  hc_yAxis(title = list(text = "Número de Incendios")) %>%
  hc_colors(c("gray", "red")) %>%  # Cambiar el color del mes con más incendios
  hc_plotOptions(column = list(
    colorByPoint = TRUE,
    dataLabels = list(enabled = TRUE)
  ))

Solución: Implementar (especialmente antes del mes de agosto) una gestión integral de los bosques, incluyendo quemas controladas, desbroce selectivo y creación de cortafuegos, combinada con una mayor inversión en sistemas de alerta temprana y equipos de respuesta rápida.

2.Diagrama de barras - Estadística descriptiva univariante

¿Cuál es la frecuencia de los incendios forestales en meses y días?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(dplyr)
library(highcharter)

# Suponiendo que tienes un data frame llamado "incendios" con las columnas "month" y "day"

# Agrupar los datos por mes y día, contando la frecuencia de incendios
datos_agrupados <- data %>%
  group_by(month, day) %>%
  summarise(conteo = n())
## `summarise()` has grouped output by 'month'. You can override using the
## `.groups` argument.
# Encontrar el mes con menos incendios y el día con más incendios (ejemplo)
mes_min <- datos_agrupados %>% 
  group_by(month) %>% 
  summarise(total = sum(conteo)) %>% 
  arrange(total) %>% 
  slice(1) %>% 
  pull(month)

dia_max <- datos_agrupados %>% 
  group_by(day) %>% 
  summarise(total = sum(conteo)) %>% 
  arrange(desc(total)) %>% 
  slice(1) %>% 
  pull(day)

# Crear el gráfico de barras apiladas, resaltando el mes y día
hchart(datos_agrupados, "column", hcaes(x = month, y = conteo, group = day)) %>% 
  hc_title(text = "Frecuencia de Incendios Forestales por Mes y Día") %>%
  hc_subtitle(text = paste("Menos incendios en", mes_min, ", más incendios los", dia_max)) %>%
  hc_xAxis(title = list(text = "Mes")) %>%
  hc_yAxis(title = list(text = "Número de Incendios")) %>%
  hc_legend(title = list(text = "Día de la Semana")) %>%
  hc_plotOptions(column = list(
    dataLabels = list(enabled = TRUE)
  )) %>%
  hc_xAxis(
    plotLines = list(
      list(color = 'red', width = 2, value = which(unique(datos_agrupados$month) == mes_min),
           label = list(text = paste("Menos incendios en", mes_min)))
    )
  )

Solución: Considerando la frecuencia de incendios los domingos en agosto propongo: “Refuerzo de Vigilancia y Respuesta los Domingos”. 1. Aumento de personal, 2. Mayor Presencia de Equipos y 3. Patrullas Específicas.

3.Diagrama de dispersión - Estadística descriptiva bivariante

¿Cuánto es el área quemada del bosque en el año y máximos vientos en el año?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(dplyr)
library(highcharter)

# Cargar los datos
forestfires <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

# Estadística descriptiva bivariante
summary(forestfires[, c("area", "wind")])
##       area              wind      
##  Min.   :   0.00   Min.   :0.400  
##  1st Qu.:   0.00   1st Qu.:2.700  
##  Median :   0.52   Median :4.000  
##  Mean   :  12.85   Mean   :4.018  
##  3rd Qu.:   6.57   3rd Qu.:4.900  
##  Max.   :1090.84   Max.   :9.400
cor(forestfires$area, forestfires$wind)
## [1] 0.01231728
# Diagrama de dispersión interactivo con highcharter
highchart() %>% 
  hc_add_series(data = forestfires, type = "scatter", hcaes(x = wind, y = area)) %>% 
  hc_title(text = "Relación entre Área Quemada y Velocidad Máxima del Viento") %>% 
  hc_xAxis(title = list(text = "Velocidad Máxima del Viento (km/h)")) %>% 
  hc_yAxis(title = list(text = "Área Quemada (ha)")) %>%
  hc_tooltip(valueSuffix = " ha",
             crosshairs = TRUE) %>%
  hc_colors(c("#336699", "#FF6633"))  # Personalizamos los colores

Solución: Priorizar la contención del perímetro del incendio, empleando cortafuegos naturales y artificiales, y reforzando las líneas de defensa con equipos especializados y retardantes de llama, adaptándose a la dirección y velocidad del viento para minimizar su impacto en áreas pobladas y ecosistemas sensibles.

4.Diagrama de dispersión - Estadística descriptiva bivariante

¿Cuál sería la relación entre la temperatura y humedad relativa máximas?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(readr)
library(dplyr)
library(highcharter)

# Cargar los datos
data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

# Exploración inicial de los datos
head(data)
##   X Y month day FFMC  DMC    DC  ISI temp RH wind rain area
## 1 7 5   mar fri 86.2 26.2  94.3  5.1  8.2 51  6.7  0.0    0
## 2 7 4   oct tue 90.6 35.4 669.1  6.7 18.0 33  0.9  0.0    0
## 3 7 4   oct sat 90.6 43.7 686.9  6.7 14.6 33  1.3  0.0    0
## 4 8 6   mar fri 91.7 33.3  77.5  9.0  8.3 97  4.0  0.2    0
## 5 8 6   mar sun 89.3 51.3 102.2  9.6 11.4 99  1.8  0.0    0
## 6 8 6   aug sun 92.3 85.3 488.0 14.7 22.2 29  5.4  0.0    0
summary(data)
##        X               Y          month               day           
##  Min.   :1.000   Min.   :2.0   Length:517         Length:517        
##  1st Qu.:3.000   1st Qu.:4.0   Class :character   Class :character  
##  Median :4.000   Median :4.0   Mode  :character   Mode  :character  
##  Mean   :4.669   Mean   :4.3                                        
##  3rd Qu.:7.000   3rd Qu.:5.0                                        
##  Max.   :9.000   Max.   :9.0                                        
##       FFMC            DMC              DC             ISI        
##  Min.   :18.70   Min.   :  1.1   Min.   :  7.9   Min.   : 0.000  
##  1st Qu.:90.20   1st Qu.: 68.6   1st Qu.:437.7   1st Qu.: 6.500  
##  Median :91.60   Median :108.3   Median :664.2   Median : 8.400  
##  Mean   :90.64   Mean   :110.9   Mean   :547.9   Mean   : 9.022  
##  3rd Qu.:92.90   3rd Qu.:142.4   3rd Qu.:713.9   3rd Qu.:10.800  
##  Max.   :96.20   Max.   :291.3   Max.   :860.6   Max.   :56.100  
##       temp             RH              wind            rain        
##  Min.   : 2.20   Min.   : 15.00   Min.   :0.400   Min.   :0.00000  
##  1st Qu.:15.50   1st Qu.: 33.00   1st Qu.:2.700   1st Qu.:0.00000  
##  Median :19.30   Median : 42.00   Median :4.000   Median :0.00000  
##  Mean   :18.89   Mean   : 44.29   Mean   :4.018   Mean   :0.02166  
##  3rd Qu.:22.80   3rd Qu.: 53.00   3rd Qu.:4.900   3rd Qu.:0.00000  
##  Max.   :33.30   Max.   :100.00   Max.   :9.400   Max.   :6.40000  
##       area        
##  Min.   :   0.00  
##  1st Qu.:   0.00  
##  Median :   0.52  
##  Mean   :  12.85  
##  3rd Qu.:   6.57  
##  Max.   :1090.84
# Calcular la temperatura máxima y la humedad relativa máxima
temp_max <- max(data$temp)
humedad_max <- max(data$RH)

# Crear un gráfico de dispersión usando highcharter
highchart() %>% 
  hc_add_series(data = data, type = "scatter", hcaes(x = temp, y = RH)) %>% 
  hc_title(text = "Relación entre Temperatura y Humedad Relativa") %>% 
  hc_subtitle(text = "Incendios Forestales") %>% 
  hc_xAxis(title = list(text = "Temperatura (°C)")) %>% 
  hc_yAxis(title = list(text = "Humedad Relativa (%)"))
# Mostrar los resultados
cat("La temperatura máxima en grados Celsius es:", temp_max, "\n")
## La temperatura máxima en grados Celsius es: 33.3
cat("La humedad relativa máxima es:", humedad_max, "%\n")
## La humedad relativa máxima es: 100 %

Solución: En una situación hipotética de incendio con temperatura máxima de 5.2°C y humedad relativa del 100%, la estrategia de combate se centraría principalmente en eliminar la fuente de ignición y monitorear de cerca la evolución del fuego, aprovechando las condiciones de alta humedad para controlar la propagación.

5. Gráfica de diagramas de dispersión - Estadística descriptiva multivariante

¿Cuál sería la correlación entre la temperatura, humedad relativa, velocidad de viento y lluvia máximos en el año?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(readr)
library(dplyr)
library(highcharter)
library(GGally)  # Para la matriz de diagramas de dispersión
## Cargando paquete requerido: ggplot2
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
# Cargar los datos
data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

# Encontrar los valores máximos
max_temp <- max(data$temp)
max_RH <- max(data$RH)
max_wind <- max(data$wind)
max_rain <- max(data$rain, na.rm = TRUE)

# Crear una matriz de diagramas de dispersión usando GGally
ggpairs(data[, c("temp", "RH", "wind", "rain")],
        title = "Matriz de Diagramas de Dispersión")

# Mostrar los valores máximos
cat("Temperatura máxima:", max_temp, "°C\n")
## Temperatura máxima: 33.3 °C
cat("Humedad relativa máxima:", max_RH, "%\n")
## Humedad relativa máxima: 100 %
cat("Velocidad del viento máxima:", max_wind, "km/h\n")
## Velocidad del viento máxima: 9.4 km/h
cat("Lluvia máxima:", max_rain, "mm\n")
## Lluvia máxima: 6.4 mm

Solución: Basándonos en este análisis, una estrategia práctica para prevenir y combatir incendios forestales sería implementar un sistema de alerta temprana que combine datos meteorológicos en tiempo real (temperatura, humedad, velocidad del viento y probabilidad de precipitación) con información sobre la vegetación y el historial de incendios, para identificar áreas de alto riesgo y tomar medidas preventivas y de respuesta oportunas.

6. Gráfica de correlación - Estadística descriptiva multivariante

¿Cuál sería la correlación entre la temperatura, humedad relativa, velocidad de viento y lluvia máximos en el año?

#Comando para cargar los datos en R desde internet
data=read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

library(readr)
library(dplyr)
library(highcharter)
library(corrplot)  # Para visualizar la matriz de correlación
## corrplot 0.92 loaded
# Cargar los datos
data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/forestfires.csv")

# Encontrar los valores máximos
max_temp <- max(data$temp)
max_RH <- max(data$RH)
max_wind <- max(data$wind)
max_rain <- max(data$rain, na.rm = TRUE)

# Calcular la matriz de correlación
correlation_matrix <- cor(data[, c("temp", "RH", "wind", "rain")], method = "pearson")

# Visualizar la matriz de correlación con highcharter
corrplot(correlation_matrix, method = "circle", type = "upper", order = "hclust", 
         tl.col = "black", tl.srt = 45)

# Mostrar los valores máximos
cat("Temperatura máxima:", max_temp, "°C\n")
## Temperatura máxima: 33.3 °C
cat("Humedad relativa máxima:", max_RH, "%\n")
## Humedad relativa máxima: 100 %
cat("Velocidad del viento máxima:", max_wind, "km/h\n")
## Velocidad del viento máxima: 9.4 km/h
cat("Lluvia máxima:", max_rain, "mm\n")
## Lluvia máxima: 6.4 mm

Solución: Desarrollar un sistema de alerta temprana basado en modelos predictivos que integren datos meteorológicos históricos y en tiempo real, junto con información sobre la vegetación y el uso del suelo, para identificar las áreas de mayor riesgo de incendios y tomar medidas de prevención y respuesta oportunas.