UNIVERSIDAD CENTRAL DEL ECUADOR

PROYECTO: FOCOS DE CALOR EN EL ECUADOR

AUTORES: GUERRERO MARIA GABRIELA, PUCHAICELA MONICA, ZURITA JOHANNA

FECHA: 14/05/2025

# Configuración
knitr::opts_chunk$set(echo = TRUE)

# importar datos
setwd("/cloud/project")
datos <- read.csv("Focos de Calor 2021.csv",
                  header = T, sep = ",", dec = ".")
datos <- read.csv("Focos de Calor 2021.csv",
                  header = TRUE, sep = ",", dec = ".", fileEncoding = "latin1")

#Estructura de los datos 
str(datos)
## 'data.frame':    22476 obs. of  12 variables:
##  $ ACQ_DATE  : chr  "20/11/2021" "20/11/2021" "06/08/2021" "10/06/2021" ...
##  $ DPA_DESPRO: chr  "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" ...
##  $ DPA_DESCAN: chr  "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" ...
##  $ DPA_DESPAR: chr  "CHITO" "CHITO" "PUCAPAMBA" "PUCAPAMBA" ...
##  $ LATITUDE  : num  -4.98e+15 -4.97e+15 -4.96e+15 -4.96e+15 -4.96e+15 ...
##  $ LONGITUDE : num  -7.90e+16 -7.90e+16 -7.91e+16 -7.91e+16 -7.92e+16 ...
##  $ BRIGHTNESS: num  3.55e+17 3.42e+17 3.32e+17 3.31e+17 3.28e+17 ...
##  $ SCAN      : num  5.1e+14 5.1e+14 1.5e+14 5.4e+14 5.0e+14 ...
##  $ TRACK     : num  4.9e+14 4.9e+14 3.8e+14 4.2e+14 4.9e+14 ...
##  $ INSTRUMENT: chr  "VIIRS" "VIIRS" "VIIRS" "VIIRS" ...
##  $ VERSION   : chr  "2.0NRT" "2.0NRT" "2.0NRT" "2.0NRT" ...
##  $ FRP       : num  1.21e+16 6.87e+15 3.77e+15 5.50e+15 2.90e+15 ...
#Extraer la variable nominal
DPA_DESPRO <- datos$ DPA_DESPRO


#EDA variable nominal
#Tabla de Distribucion de Frecuencia
TDFDPA_DESPRO <- table(DPA_DESPRO)
TDFDPA_DESPRO
## DPA_DESPRO
##                          AZUAY                        BOLIVAR 
##                            118                             64 
##                          CAÑAR                         CARCHI 
##                             81                             59 
##                     CHIMBORAZO                       COTOPAXI 
##                             69                            131 
##                         EL ORO                     ESMERALDAS 
##                            455                            212 
##                         GUAYAS                       IMBABURA 
##                           5561                            211 
##                           LOJA                       LOS RIOS 
##                           2027                           3373 
##                         MANABI                MORONA SANTIAGO 
##                           4665                           2517 
##                           NAPO                       ORELLANA 
##                            275                            622 
##                        PASTAZA                      PICHINCHA 
##                             66                             88 
##                    SANTA ELENA SANTO DOMINGO DE LOS TSACHILAS 
##                            390                             28 
##                      SUCUMBIOS                     TUNGURAHUA 
##                           1323                             34 
##               ZAMORA CHINCHIPE 
##                            107
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")

TDFfinalDPA_DESPRO$ni
##  [1]  118   64   81   59   69  131  455  212 5561  211 2027 3373 4665 2517  275
## [16]  622   66   88  390   28 1323   34  107
sum(TDFfinalDPA_DESPRO$ni)
## [1] 22476
hi <- TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)
hi <- hi*100
sum(hi)
## [1] 100
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
TDFfinalDPA_DESPRO <- subset(TDFfinalDPA_DESPRO, variable != "Total")
ni <- TDFfinalDPA_DESPRO$ni
sum(ni)
## [1] 22476
variable <- TDFfinalDPA_DESPRO$variable

total_ni <- sum(ni)
total_hi <- sum(hi)
TDFfinalDPA_DESPRO <- TDFfinalDPA_DESPRO[TDFfinalDPA_DESPRO$variable != "Total", ]
TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni"       "hi"
TDFDPA_DESPRO <- table(DPA_DESPRO)

# Convertimos a data frame
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
total_ni <- sum(TDFfinalDPA_DESPRO$ni)
total_ni
## [1] 22476
total_hi <- sum(TDFfinalDPA_DESPRO$hi)
total_hi
## [1] 100
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni"       "hi"
TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)

TDFfinalDPA_DESPRO 
##                          variable    ni          hi
## 1                           AZUAY   118   0.5250044
## 2                         BOLIVAR    64   0.2847482
## 3                           CAÑAR    81   0.3603844
## 4                          CARCHI    59   0.2625022
## 5                      CHIMBORAZO    69   0.3069941
## 6                        COTOPAXI   131   0.5828439
## 7                          EL ORO   455   2.0243816
## 8                      ESMERALDAS   212   0.9432283
## 9                          GUAYAS  5561  24.7419470
## 10                       IMBABURA   211   0.9387791
## 11                           LOJA  2027   9.0185086
## 12                       LOS RIOS  3373  15.0071187
## 13                         MANABI  4665  20.7554725
## 14                MORONA SANTIAGO  2517  11.1986119
## 15                           NAPO   275   1.2235273
## 16                       ORELLANA   622   2.7673963
## 17                        PASTAZA    66   0.2936466
## 18                      PICHINCHA    88   0.3915287
## 19                    SANTA ELENA   390   1.7351842
## 20 SANTO DOMINGO DE LOS TSACHILAS    28   0.1245773
## 21                      SUCUMBIOS  1323   5.8862787
## 22                     TUNGURAHUA    34   0.1512725
## 23               ZAMORA CHINCHIPE   107   0.4760634
## 24                          Total 22476 100.0000000
install.packages("gt")
library(gt)
install.packages("stringi")
library(stringi)

if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}

TDFfinalDPA_DESPRO <- as.data.frame(TDFfinalDPA_DESPRO)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}
library(gt)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8")
library(dplyr)
install.packages("gt")

TDFfinalDPA_DESPRO %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1.1*"),
    subtitle = md("**Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1.1
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador
variable ni hi
AZUAY 118 0.5250044
BOLIVAR 64 0.2847482
CAÑAR 81 0.3603844
CARCHI 59 0.2625022
CHIMBORAZO 69 0.3069941
COTOPAXI 131 0.5828439
EL ORO 455 2.0243816
ESMERALDAS 212 0.9432283
GUAYAS 5561 24.7419470
IMBABURA 211 0.9387791
LOJA 2027 9.0185086
LOS RIOS 3373 15.0071187
MANABI 4665 20.7554725
MORONA SANTIAGO 2517 11.1986119
NAPO 275 1.2235273
ORELLANA 622 2.7673963
PASTAZA 66 0.2936466
PICHINCHA 88 0.3915287
SANTA ELENA 390 1.7351842
SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773
SUCUMBIOS 1323 5.8862787
TUNGURAHUA 34 0.1512725
ZAMORA CHINCHIPE 107 0.4760634
Total 22476 100.0000000
Autor: Grupo 3
#Tabla No.1
#Distribuccion de provincias extendido 

#GDF 1

TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
barplot(
  height = TDFfinalDPA_DESPRO$ni,
  names.arg = TDFfinalDPA_DESPRO$variable,
  main = "Gráfica No. 1.1: Distribución de Provincias",
  xlab = "",
  ylab = "Cantidad",
  col = heat.colors(length(TDFfinalDPA_DESPRO$ni)),
  las = 2,
  cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

# DIAGRAMA DE BARRAS (GLOBAL)

colores <- c("yellow", "orange", "red")

barplot(TDFfinalDPA_DESPRO$ni,
        main = "Gráfica 1.2: Distribución de frecuencias (Global) de
Provincias",
        xlab = "",
        ylab = "Cantidad",
        
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 22500),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

# DIAGRAMA DE BARRAS (Porcentaje)

barplot(TDFfinalDPA_DESPRO$hi,
        main = "Grafica No 1.3: Distribución de frecuencias (porcentaje) de
Provincias",
        xlab = "",
        ylab = "Porcentaje (%)",
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 30),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1) 

#Crear agrupacion 1

if(!"ni" %in% colnames(TDFfinalDPA_DESPRO)) stop("No existe la columna 'ni' en TDFfinalDPA_DESPRO")
TDFfinalDPA_DESPRO$Grupo <- NA

for(i in 1:nrow(TDFfinalDPA_DESPRO)) {
  if(TDFfinalDPA_DESPRO$ni[i] < 2000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Costa"
  } else if(TDFfinalDPA_DESPRO$ni[i] >= 2000 && TDFfinalDPA_DESPRO$ni[i] <= 5000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Sierra"
  } else {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Amazónia"
  }
}
print(TDFfinalDPA_DESPRO)
##                          variable    ni          hi    Grupo
## 1                           AZUAY   118   0.5250044    Costa
## 2                         BOLIVAR    64   0.2847482    Costa
## 3              CAÃ\u0083Â\u0091AR    81   0.3603844    Costa
## 4                          CARCHI    59   0.2625022    Costa
## 5                      CHIMBORAZO    69   0.3069941    Costa
## 6                        COTOPAXI   131   0.5828439    Costa
## 7                          EL ORO   455   2.0243816    Costa
## 8                      ESMERALDAS   212   0.9432283    Costa
## 9                          GUAYAS  5561  24.7419470 Amazónia
## 10                       IMBABURA   211   0.9387791    Costa
## 11                           LOJA  2027   9.0185086   Sierra
## 12                       LOS RIOS  3373  15.0071187   Sierra
## 13                         MANABI  4665  20.7554725   Sierra
## 14                MORONA SANTIAGO  2517  11.1986119   Sierra
## 15                           NAPO   275   1.2235273    Costa
## 16                       ORELLANA   622   2.7673963    Costa
## 17                        PASTAZA    66   0.2936466    Costa
## 18                      PICHINCHA    88   0.3915287    Costa
## 19                    SANTA ELENA   390   1.7351842    Costa
## 20 SANTO DOMINGO DE LOS TSACHILAS    28   0.1245773    Costa
## 21                      SUCUMBIOS  1323   5.8862787    Costa
## 22                     TUNGURAHUA    34   0.1512725    Costa
## 23               ZAMORA CHINCHIPE   107   0.4760634    Costa
## 24                          Total 22476 100.0000000 Amazónia
Grupo <- table(TDFfinalDPA_DESPRO$Grupo)
conteo_grupos <- table(TDFfinalDPA_DESPRO$Grupo)


# Gráfico de barras

barplot(
  conteo_grupos,
  main = "Gráfica No 1.4: Agrupación por frecuencia",
  xlab = "Agrupación de Provincias",
  ylab = "Cantidad",
  col = colores
)

# Frecuencias relativas (porcentaje)
hi_grupo <- prop.table(Grupo) * 100

# Diagrama circular 

colores <- rev(heat.colors(length(hi_grupo)))
porcentajes <- round(hi_grupo, 1)
etiquetas <- paste(names(hi_grupo), ": ", porcentajes, "%", sep = "")

# Diagrama circular con etiquetas
pie(hi_grupo,
    labels = etiquetas,    # agregamos las etiquetas con porcentaje
    main = "Gráfica No. 1.5: Distribución de Frecuencia de provincias",
    col = colores)

# Leyenda opcional (si quieres conservarla):
legend("bottomright",
       legend = etiquetas,
       title = "Leyenda",
       fill = colores,
       cex = 0.8,
       border = "black")

#INDICADORES
moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

# Aplicar moda a DPA_DESPRO
moda_DPA <- moda(datos$DPA_DESPRO)
print(moda_DPA)
## [1] "GUAYAS"