##### UNIVERSIDAD CENTRAL DEL ECUADOR #####
#### AUTOR: JHONNY CATUCUAMBA ####
### CARRERA: INGENIERÍA AMBIENTAL #####


#### VARIABLE ZONA  ####
## DATOS ###
setwd("/cloud/project")
Datos <- read.csv("Conaf_Data_Chile_2017.csv")
##estructura de los datos
str(Datos)
## 'data.frame':    5234 obs. of  30 variables:
##  $ X         : int  0 1 2 3 4 5 6 7 8 9 ...
##  $ temporada : chr  "2016-2017" "2016-2017" "2016-2017" "2016-2017" ...
##  $ codreg    : int  3 3 3 3 3 3 3 3 3 3 ...
##  $ codprov   : int  33 33 33 33 33 33 33 33 33 33 ...
##  $ codcom    : int  3301 3301 3301 3301 3304 3301 3301 3301 3304 3301 ...
##  $ ambito    : chr  "Conaf" "Conaf" "Conaf" "Conaf" ...
##  $ numero    : num  2 3 4 5 6 7 8 9 10 11 ...
##  $ nombre_inc: chr  "CALLEJÓN MARTINEZ" "PERALES" "TORINO" "LA VERBENA" ...
##  $ utm_este  : num  326931 322031 329713 335543 283796 ...
##  $ utm_norte : num  6838495 6840235 6836541 6829112 6849977 ...
##  $ inicio_c  : chr  "Camino secundario" "Camino secundario" "Orilla curso de agua" "Camino principal" ...
##  $ combus_i  : chr  "Matorral" "Matorral" "Matorral" "Pastizal" ...
##  $ causa_gene: num  2.01 2.01 2.01 1.02 4.01 2.01 2.01 4.01 4.01 4.01 ...
##  $ causa_espe: chr  "2.1.8." "2.1.8." "2.1.8." "1.2.4." ...
##  $ pino_0010 : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ pino_11_17: num  0 0 0 0 0 0 0 0 0 0 ...
##  $ pino_18   : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ eucalipto : num  0 0 0.22 0 0 0 0 0 0 0.5 ...
##  $ otras_plan: num  0 0 0 0 0 0 0.1 0 0 0 ...
##  $ total_plan: num  0 0 0.22 0 0 0 0.1 0 0 0.5 ...
##  $ arbolado  : num  0 0 0 0 0 0.5 0.13 0 0 0 ...
##  $ matorral  : num  0.2 0.1 0.05 0 4.35 ...
##  $ pastizal  : num  0 0 0 0.18 0 7.2 0 0.003 0 0.6 ...
##  $ total_veg : num  0.2 0.1 0.05 0.18 4.35 10.2 14.2 0.003 0 0.8 ...
##  $ agricola  : num  0 0 0 0 0 0 0 0 0.3 0 ...
##  $ desechos  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ total_otra: num  0 0 0 0 0 0 0 0 0.3 0 ...
##  $ sup_t_a   : num  0.2 0.1 0.27 0.18 4.35 10.2 14.3 0.003 0.3 1.3 ...
##  $ long      : num  326931 322031 329713 335543 283796 ...
##  $ lat       : num  6838495 6840235 6836541 6829112 6849977 ...
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
##Extraer una variable nominal
Zona <- Datos$inicio_c
##EDAvariable nominal
TDF_zona <- table(Zona)

tabla_zona <- as.data.frame(TDF_zona)
hi <- tabla_zona$Freq/sum(tabla_zona$Freq)
hi_porc <- hi*100
sum(hi_porc)
## [1] 100
tabla_ZONA <- data.frame(tabla_zona,hi_porc)

### Agrupación ####
tabla_ZONA$grupo <- case_when(
  grepl("camino|ruta|sendero|vía férrea", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Infraestructura vial",
  grepl("eléctrico|tendido|cable|sub-estacion", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Infraestructura eléctrica",
  grepl("bosque|faena|plantación|forestales", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Actividad forestal",
  grepl("rio|río|estero|canal|orilla curso de agua", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Zona hídrica",
  grepl("quema|ilegal|Otros|basural|vertedero|aserrin", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Quema ilegal / Basural",
  grepl("casa|refugio|cementerio|patio|viñas", tabla_ZONA$Zona, ignore.case = TRUE) ~ "Zonas habitadas",
  TRUE ~ "Sin especificar / Otros"  # Captura todo lo demás, incluyendo NA
)


tabla_resumen <- tabla_ZONA %>%
  group_by(grupo) %>%
  summarise(
    Frecuencia = sum(Freq),
    Porcentaje = sum(hi_porc)
  ) %>%
  arrange(desc(Frecuencia))


sum(tabla_resumen$Frecuencia)
## [1] 5234
sum(tabla_resumen$Porcentaje)
## [1] 100
colnames(tabla_resumen) <- c("Zona","ni","hi (%)")
print(tabla_resumen)
## # A tibble: 7 × 3
##   Zona                         ni `hi (%)`
##   <chr>                     <int>    <dbl>
## 1 Infraestructura vial       4371   83.5  
## 2 Zonas habitadas             323    6.17 
## 3 Zona hídrica                226    4.32 
## 4 Quema ilegal / Basural      113    2.16 
## 5 Actividad forestal          105    2.01 
## 6 Sin especificar / Otros      66    1.26 
## 7 Infraestructura eléctrica    30    0.573
#### Crear de fila de totales ####
totales <- c( Zona= "TOTAL",
              ni= sum(tabla_resumen$ni),
              hi= sum(hi*100))

tabla_Zona_Incendio <- rbind(tabla_resumen,totales)
tabla_Zona_Incendio
## # A tibble: 8 × 3
##   Zona                      ni    `hi (%)`         
##   <chr>                     <chr> <chr>            
## 1 Infraestructura vial      4371  83.5116545662973 
## 2 Zonas habitadas           323   6.1711883836454  
## 3 Zona hídrica              226   4.31792128391288 
## 4 Quema ilegal / Basural    113   2.15896064195644 
## 5 Actividad forestal        105   2.00611387084448 
## 6 Sin especificar / Otros   66    1.26098586167367 
## 7 Infraestructura eléctrica 30    0.573175391669851
## 8 TOTAL                     5234  100
# Diagrama de barrras local ni
par(mar = c(9, 4, 4, 2))
barplot(tabla_resumen$ni,main="Gráfica N°1: Distribución de zona del inicio del incendio forestal en Chile",
        xlab = "",
        ylab = "Cantidad",
        col = "skyblue",
        names.arg=tabla_resumen$Zona,
        cex.names = 0.8,
        las = 2)
mtext("Zona", side = 1, line = 8)

# Diagrama de barrras global ni

barplot(tabla_resumen$ni,main="Gráfica N°1: Distribución de zona del inicio del incendio",
        xlab = "",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,5234),
        names.arg=tabla_resumen$Zona,
        cex.names = 0.8,
        las = 2)
mtext("Zona", side = 1, line = 8)

# Diagrama de barrras local hi

barplot(tabla_resumen$`hi (%)`,main="Gráfica N°1: Distribución del porcentaje de la zona del inicio del incendio forestal en Chile",
        xlab = "",
        ylab = "Porcentaje %",
        col = "skyblue",
        names.arg=tabla_resumen$Zona,
        cex.names = 0.8,
        las = 2)
mtext("Zona", side = 1, line = 8)

# Diagrama de barrras global hi

barplot(tabla_resumen$`hi (%)`,main="Gráfica N°1: Distribución del porcentaje de la zona del inicio del incendio",
        xlab = "",
        ylab = "Porcentaje %",
        col = "skyblue",
        ylim = c(0,100),
        names.arg=tabla_resumen$Zona,
        cex.names = 0.8,
        las = 2)
mtext("Zona", side = 1, line = 8)

# Diagrma circular

pie (tabla_resumen$`hi (%)`,main = "Gráfica N°5: Distribución porcentual de la zona del inicio del incendio forestal en Chile",
     radius = 1,
     labels = paste0(round(tabla_resumen$`hi (%)`,2),"%"),
     col = colores <- c(rev(heat.colors(7))),
     cex=0.8,
)
par(xpd = TRUE)  # Permite que la leyenda salga del área del gráfico

legend(x = 1.5, y = 1,
       legend = tabla_resumen$Zona,
       fill = colores <- c(rev(heat.colors(7))),
       cex = 0.5,
       title = "Zona del inicio del incendio")

tabla_indicadores <- data.frame("Variable" =c("Zona de inicio del incendio"),
                                "Rango" = " Zonas de Chile",
                                "X" = " - ",
                                "Me" = " - ",
                                "Mo" = " Infraestructura víal ",
                                "V" = " - ",
                                "Sd" = " - ",
                                "Cv" = " - ",
                                "As" = " - ",
                                "K" = " - ",
                                "Valores Atipicos" = " - ")
library(knitr)
kable(tabla_indicadores, align = 'c', caption = "Conclusiones de la variable
      zona del inicio del incendio")
Conclusiones de la variable zona del inicio del incendio
Variable Rango X Me Mo V Sd Cv As K Valores.Atipicos
Zona de inicio del incendio Zonas de Chile - - Infraestructura víal - - - - - -