DPA_DESPRO

UNIVERSIDAD CENTRAL DEL ECUADOR

PROYECTO: FOCOS DE CALOR EN EL ECUADOR

AUTORES: GUERRERO MARIA GABRIELA,PUCHAICELA MONICA, ZURITA JOHANNA

FECHA: 14/05/2025

# importar datos
datos <- read.csv("maate_focosdecalor_bdd_2021diciembre.csv",
                  header = T, sep = ",", dec = ".")

#Estructura de los datos 
str(datos)
## 'data.frame':    22476 obs. of  17 variables:
##  $ MES_REPORT: int  11 11 8 6 5 6 11 9 3 3 ...
##  $ DIA_REPORT: int  20 20 6 10 28 10 20 29 22 22 ...
##  $ DPA_DESPRO: chr  "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" ...
##  $ DPA_DESCAN: chr  "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" ...
##  $ DPA_DESPAR: chr  "CHITO" "CHITO" "PUCAPAMBA" "PUCAPAMBA" ...
##  $ TXT_1     : chr  "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" ...
##  $ LATITUDE  : chr  "-4,981720000000000" "-4,969160000000000" "-4,958520000000000" "-4,957820000000000" ...
##  $ LONGITUDE : chr  "-79,041280000000000" "-79,049490000000006" "-79,118430000000004" "-79,111859999999993" ...
##  $ BRIGHTNESS: chr  "354,759999999999990" "342,009999999999990" "331,860000000000010" "331,399999999999980" ...
##  $ SCAN      : chr  "0,510000000000000" "0,510000000000000" "0,150000000000000" "0,540000000000000" ...
##  $ TRACK     : chr  "0,490000000000000" "0,490000000000000" "0,380000000000000" "0,420000000000000" ...
##  $ SATELLITE : chr  "1" "1" "1" "1" ...
##  $ CONFIDENCE: chr  "n" "n" "n" "n" ...
##  $ VERSION   : chr  "2.0NRT" "2.0NRT" "2.0NRT" "2.0NRT" ...
##  $ BRIGHT_T31: chr  "299,420000000000020" "298,149999999999980" "299,160000000000030" "296,800000000000010" ...
##  $ FRP       : chr  "12,100000000000000" "6,870000000000000" "3,770000000000000" "5,500000000000000" ...
##  $ DAYNIGHT  : chr  "D" "D" "D" "D" ...
#Extraer la variable nominal
DPA_DESPRO <- datos$ DPA_DESPRO


#EDA variable nominal
#Tabla de Distribucion de Frecuencia
TDFDPA_DESPRO <- table(DPA_DESPRO)
TDFDPA_DESPRO
## DPA_DESPRO
##                          AZUAY                        BOLIVAR 
##                            118                             64 
##                         CARCHI                     CHIMBORAZO 
##                             59                             69 
##                       COTOPAXI                         EL ORO 
##                            131                            455 
##                     ESMERALDAS                          FALSO 
##                            212                             81 
##                         GUAYAS                       IMBABURA 
##                           5561                            211 
##                           LOJA                       LOS RIOS 
##                           2027                           3373 
##                         MANABI                MORONA SANTIAGO 
##                           4665                           2517 
##                           NAPO                       ORELLANA 
##                            275                            622 
##                        PASTAZA                      PICHINCHA 
##                             66                             88 
##                    SANTA ELENA SANTO DOMINGO DE LOS TSACHILAS 
##                            390                             28 
##                      SUCUMBIOS                     TUNGURAHUA 
##                           1323                             34 
##               ZAMORA CHINCHIPE 
##                            107
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")


hi <- TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)
hi <- hi*100
sum(hi)
## [1] 100
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
TDFfinalDPA_DESPRO <- subset(TDFfinalDPA_DESPRO, variable != "Total")
ni <- TDFfinalDPA_DESPRO$ni
sum(ni)
## [1] 22476
variable <- TDFfinalDPA_DESPRO$variable

total_ni <- sum(ni)
total_hi <- sum(hi)
TDFfinalDPA_DESPRO <- TDFfinalDPA_DESPRO[TDFfinalDPA_DESPRO$variable != "Total", ]
TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni"       "hi"
TDFDPA_DESPRO <- table(DPA_DESPRO)

# Convertimos a data frame
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
total_ni <- sum(TDFfinalDPA_DESPRO$ni)
total_ni
## [1] 22476
total_hi <- sum(TDFfinalDPA_DESPRO$hi)
total_hi
## [1] 100
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni"       "hi"
TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)

TDFfinalDPA_DESPRO 
##                          variable    ni          hi
## 1                           AZUAY   118   0.5250044
## 2                         BOLIVAR    64   0.2847482
## 3                          CARCHI    59   0.2625022
## 4                      CHIMBORAZO    69   0.3069941
## 5                        COTOPAXI   131   0.5828439
## 6                          EL ORO   455   2.0243816
## 7                      ESMERALDAS   212   0.9432283
## 8                           FALSO    81   0.3603844
## 9                          GUAYAS  5561  24.7419470
## 10                       IMBABURA   211   0.9387791
## 11                           LOJA  2027   9.0185086
## 12                       LOS RIOS  3373  15.0071187
## 13                         MANABI  4665  20.7554725
## 14                MORONA SANTIAGO  2517  11.1986119
## 15                           NAPO   275   1.2235273
## 16                       ORELLANA   622   2.7673963
## 17                        PASTAZA    66   0.2936466
## 18                      PICHINCHA    88   0.3915287
## 19                    SANTA ELENA   390   1.7351842
## 20 SANTO DOMINGO DE LOS TSACHILAS    28   0.1245773
## 21                      SUCUMBIOS  1323   5.8862787
## 22                     TUNGURAHUA    34   0.1512725
## 23               ZAMORA CHINCHIPE   107   0.4760634
## 24                          Total 22476 100.0000000
library(gt)
library(stringi)

if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}
## Codificación UTF-8 correcta
TDFfinalDPA_DESPRO <- as.data.frame(TDFfinalDPA_DESPRO)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}
## Codificación UTF-8 correcta
library(gt)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8")
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFfinalDPA_DESPRO %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("*Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador
variable ni hi
AZUAY 118 0.5250044
BOLIVAR 64 0.2847482
CARCHI 59 0.2625022
CHIMBORAZO 69 0.3069941
COTOPAXI 131 0.5828439
EL ORO 455 2.0243816
ESMERALDAS 212 0.9432283
FALSO 81 0.3603844
GUAYAS 5561 24.7419470
IMBABURA 211 0.9387791
LOJA 2027 9.0185086
LOS RIOS 3373 15.0071187
MANABI 4665 20.7554725
MORONA SANTIAGO 2517 11.1986119
NAPO 275 1.2235273
ORELLANA 622 2.7673963
PASTAZA 66 0.2936466
PICHINCHA 88 0.3915287
SANTA ELENA 390 1.7351842
SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773
SUCUMBIOS 1323 5.8862787
TUNGURAHUA 34 0.1512725
ZAMORA CHINCHIPE 107 0.4760634
Total 22476 100.0000000
Autor: Grupo 3
library(gt)


#Tabla No.1
#Distribuccion de provincias extendido 
TDFfinalDPA_DESPRO<- subset(TDFfinalDPA_DESPRO, variable != "Total")

#GDF 1

TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
barplot(
  height = TDFfinalDPA_DESPRO$ni,
  names.arg = TDFfinalDPA_DESPRO$variable,
  main = "Gráfica N°1.1: Distribución de Frecuencias de Provincias",
  xlab = "",
  ylab = "Cantidad",
  col = heat.colors(length(TDFfinalDPA_DESPRO$ni)),
  las = 2,
  cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

# DIAGRAMA DE BARRAS (GLOBAL)

colores <- c("yellow", "orange", "red")

barplot(TDFfinalDPA_DESPRO$ni,
        main = "Gráfica N°1.2: Distribución de Frecuencias (Global) de
Provincias",
        xlab = "",
        ylab = "Cantidad",
        
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 22500),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

# DIAGRAMA DE BARRAS (Porcentaje)

barplot(TDFfinalDPA_DESPRO$hi,
        main = "Grafica N°1.3: Distribución de frecuencias (porcentaje) de
Provincias",
        xlab = "",
        ylab = "Porcentaje (%)",
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 30),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

#Crear agrupacion 1

if(!"ni" %in% colnames(TDFfinalDPA_DESPRO)) stop("No existe la columna 'ni' en TDFfinalDPA_DESPRO")
TDFfinalDPA_DESPRO$Grupo <- NA

for(i in 1:nrow(TDFfinalDPA_DESPRO)) {
  if(TDFfinalDPA_DESPRO$ni[i] < 2000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Occidental"
  } else if(TDFfinalDPA_DESPRO$ni[i] >= 2000 && TDFfinalDPA_DESPRO$ni[i] <= 5000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Central Andina"
  } else {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Amazónica"
  }
}
print(TDFfinalDPA_DESPRO)
##                          variable   ni         hi               Grupo
## 1                           AZUAY  118  0.5250044     Zona Occidental
## 2                         BOLIVAR   64  0.2847482     Zona Occidental
## 3                          CARCHI   59  0.2625022     Zona Occidental
## 4                      CHIMBORAZO   69  0.3069941     Zona Occidental
## 5                        COTOPAXI  131  0.5828439     Zona Occidental
## 6                          EL ORO  455  2.0243816     Zona Occidental
## 7                      ESMERALDAS  212  0.9432283     Zona Occidental
## 8                           FALSO   81  0.3603844     Zona Occidental
## 9                          GUAYAS 5561 24.7419470      Zona Amazónica
## 10                       IMBABURA  211  0.9387791     Zona Occidental
## 11                           LOJA 2027  9.0185086 Zona Central Andina
## 12                       LOS RIOS 3373 15.0071187 Zona Central Andina
## 13                         MANABI 4665 20.7554725 Zona Central Andina
## 14                MORONA SANTIAGO 2517 11.1986119 Zona Central Andina
## 15                           NAPO  275  1.2235273     Zona Occidental
## 16                       ORELLANA  622  2.7673963     Zona Occidental
## 17                        PASTAZA   66  0.2936466     Zona Occidental
## 18                      PICHINCHA   88  0.3915287     Zona Occidental
## 19                    SANTA ELENA  390  1.7351842     Zona Occidental
## 20 SANTO DOMINGO DE LOS TSACHILAS   28  0.1245773     Zona Occidental
## 21                      SUCUMBIOS 1323  5.8862787     Zona Occidental
## 22                     TUNGURAHUA   34  0.1512725     Zona Occidental
## 23               ZAMORA CHINCHIPE  107  0.4760634     Zona Occidental
Grupo <- table(TDFfinalDPA_DESPRO$Grupo)
conteo_grupos <- table(TDFfinalDPA_DESPRO$Grupo)


# Gráfico de barras

barplot(
  conteo_grupos,
  main = "Gráfica N°1.4: Agrupación por frecuencia",
  xlab = "Agrupación de Provincias",
  ylab = "Cantidad",
  col = colores
)

# Frecuencias relativas (porcentaje)
hi_grupo <- prop.table(Grupo) * 100

# Diagrama circular 

colores <- rev(heat.colors(length(hi_grupo)))
pie(hi_grupo,
    main = "Gráfica N°1.5: Distribución de Frecuencia de provincias",
    col = colores)


legend("bottomright",
       legend = names(hi_grupo),
       title = "Leyenda",
       fill = colores,
       cex = 0.8,         # tamaño del texto (más grande)
       border = "black")

#INDICADORES
moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

# Aplicar moda a DPA_DESPRO
moda_DPA <- moda(datos$DPA_DESPRO)
print(moda_DPA)
## [1] "GUAYAS"