Nomb_provincia

DPA_DESPRO

UNIVERSIDAD CENTRAL DEL ECUADOR

PROYECTO: FOCOS DE CALOR EN EL ECUADOR

AUTORES: GUERRERO MARIA GABRIELA,PUCHAICELA MONICA, ZURITA JOHANNA

FECHA: 14/05/2025

# importar datos
datos <- read.csv("maate_focosdecalor_bdd_2021diciembre.csv",
                  header = T, sep = ",", dec = ".")

#Estructura de los datos 
str(datos)

## 'data.frame':    22476 obs. of  17 variables:
##  $ MES_REPORT: int  11 11 8 6 5 6 11 9 3 3 ...
##  $ DIA_REPORT: int  20 20 6 10 28 10 20 29 22 22 ...
##  $ DPA_DESPRO: chr  "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" ...
##  $ DPA_DESCAN: chr  "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" ...
##  $ DPA_DESPAR: chr  "CHITO" "CHITO" "PUCAPAMBA" "PUCAPAMBA" ...
##  $ TXT_1     : chr  "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" ...
##  $ LATITUDE  : chr  "-4,981720000000000" "-4,969160000000000" "-4,958520000000000" "-4,957820000000000" ...
##  $ LONGITUDE : chr  "-79,041280000000000" "-79,049490000000006" "-79,118430000000004" "-79,111859999999993" ...
##  $ BRIGHTNESS: chr  "354,759999999999990" "342,009999999999990" "331,860000000000010" "331,399999999999980" ...
##  $ SCAN      : chr  "0,510000000000000" "0,510000000000000" "0,150000000000000" "0,540000000000000" ...
##  $ TRACK     : chr  "0,490000000000000" "0,490000000000000" "0,380000000000000" "0,420000000000000" ...
##  $ SATELLITE : chr  "1" "1" "1" "1" ...
##  $ CONFIDENCE: chr  "n" "n" "n" "n" ...
##  $ VERSION   : chr  "2.0NRT" "2.0NRT" "2.0NRT" "2.0NRT" ...
##  $ BRIGHT_T31: chr  "299,420000000000020" "298,149999999999980" "299,160000000000030" "296,800000000000010" ...
##  $ FRP       : chr  "12,100000000000000" "6,870000000000000" "3,770000000000000" "5,500000000000000" ...
##  $ DAYNIGHT  : chr  "D" "D" "D" "D" ...

#Extraer la variable nominal
DPA_DESPRO <- datos$ DPA_DESPRO


#EDA variable nominal
#Tabla de Distribucion de Frecuencia
TDFDPA_DESPRO <- table(DPA_DESPRO)
TDFDPA_DESPRO

## DPA_DESPRO
##                          AZUAY                        BOLIVAR 
##                            118                             64 
##                         CARCHI                     CHIMBORAZO 
##                             59                             69 
##                       COTOPAXI                         EL ORO 
##                            131                            455 
##                     ESMERALDAS                          FALSO 
##                            212                             81 
##                         GUAYAS                       IMBABURA 
##                           5561                            211 
##                           LOJA                       LOS RIOS 
##                           2027                           3373 
##                         MANABI                MORONA SANTIAGO 
##                           4665                           2517 
##                           NAPO                       ORELLANA 
##                            275                            622 
##                        PASTAZA                      PICHINCHA 
##                             66                             88 
##                    SANTA ELENA SANTO DOMINGO DE LOS TSACHILAS 
##                            390                             28 
##                      SUCUMBIOS                     TUNGURAHUA 
##                           1323                             34 
##               ZAMORA CHINCHIPE 
##                            107

TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")


hi <- TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)
hi <- hi*100
sum(hi)

## [1] 100

TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
TDFfinalDPA_DESPRO <- subset(TDFfinalDPA_DESPRO, variable != "Total")
ni <- TDFfinalDPA_DESPRO$ni
sum(ni)

## [1] 22476

variable <- TDFfinalDPA_DESPRO$variable

total_ni <- sum(ni)
total_hi <- sum(hi)
TDFfinalDPA_DESPRO <- TDFfinalDPA_DESPRO[TDFfinalDPA_DESPRO$variable != "Total", ]
TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
names(TDFfinalDPA_DESPRO)

## [1] "variable" "ni"       "hi"

TDFDPA_DESPRO <- table(DPA_DESPRO)

# Convertimos a data frame
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
total_ni <- sum(TDFfinalDPA_DESPRO$ni)
total_ni

## [1] 22476

total_hi <- sum(TDFfinalDPA_DESPRO$hi)
total_hi

## [1] 100

names(TDFfinalDPA_DESPRO)

## [1] "variable" "ni"       "hi"

TDFfinalDPA_DESPRO <- rbind(
  TDFfinalDPA_DESPRO,
  data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)

TDFfinalDPA_DESPRO

##                          variable    ni          hi
## 1                           AZUAY   118   0.5250044
## 2                         BOLIVAR    64   0.2847482
## 3                          CARCHI    59   0.2625022
## 4                      CHIMBORAZO    69   0.3069941
## 5                        COTOPAXI   131   0.5828439
## 6                          EL ORO   455   2.0243816
## 7                      ESMERALDAS   212   0.9432283
## 8                           FALSO    81   0.3603844
## 9                          GUAYAS  5561  24.7419470
## 10                       IMBABURA   211   0.9387791
## 11                           LOJA  2027   9.0185086
## 12                       LOS RIOS  3373  15.0071187
## 13                         MANABI  4665  20.7554725
## 14                MORONA SANTIAGO  2517  11.1986119
## 15                           NAPO   275   1.2235273
## 16                       ORELLANA   622   2.7673963
## 17                        PASTAZA    66   0.2936466
## 18                      PICHINCHA    88   0.3915287
## 19                    SANTA ELENA   390   1.7351842
## 20 SANTO DOMINGO DE LOS TSACHILAS    28   0.1245773
## 21                      SUCUMBIOS  1323   5.8862787
## 22                     TUNGURAHUA    34   0.1512725
## 23               ZAMORA CHINCHIPE   107   0.4760634
## 24                          Total 22476 100.0000000

library(gt)
library(stringi)

if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}

## Codificación UTF-8 correcta

TDFfinalDPA_DESPRO <- as.data.frame(TDFfinalDPA_DESPRO)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
  warning("Quedan cadenas con problemas de codificación")
} else {
  message("Codificación UTF-8 correcta")
}

## Codificación UTF-8 correcta

library(gt)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8")
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

TDFfinalDPA_DESPRO %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("*Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )

variable	ni	hi
Tabla Nro. 1
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador
AZUAY	118	0.5250044
BOLIVAR	64	0.2847482
CARCHI	59	0.2625022
CHIMBORAZO	69	0.3069941
COTOPAXI	131	0.5828439
EL ORO	455	2.0243816
ESMERALDAS	212	0.9432283
FALSO	81	0.3603844
GUAYAS	5561	24.7419470
IMBABURA	211	0.9387791
LOJA	2027	9.0185086
LOS RIOS	3373	15.0071187
MANABI	4665	20.7554725
MORONA SANTIAGO	2517	11.1986119
NAPO	275	1.2235273
ORELLANA	622	2.7673963
PASTAZA	66	0.2936466
PICHINCHA	88	0.3915287
SANTA ELENA	390	1.7351842
SANTO DOMINGO DE LOS TSACHILAS	28	0.1245773
SUCUMBIOS	1323	5.8862787
TUNGURAHUA	34	0.1512725
ZAMORA CHINCHIPE	107	0.4760634
Total	22476	100.0000000
Autor: Grupo 3

library(gt)


#Tabla No.1
#Distribuccion de provincias extendido 
TDFfinalDPA_DESPRO<- subset(TDFfinalDPA_DESPRO, variable != "Total")

#GDF 1

TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
barplot(
  height = TDFfinalDPA_DESPRO$ni,
  names.arg = TDFfinalDPA_DESPRO$variable,
  main = "Gráfica N°1.1: Distribución de Frecuencias de Provincias",
  xlab = "",
  ylab = "Cantidad",
  col = heat.colors(length(TDFfinalDPA_DESPRO$ni)),
  las = 2,
  cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

# DIAGRAMA DE BARRAS (GLOBAL)

colores <- c("yellow", "orange", "red")

barplot(TDFfinalDPA_DESPRO$ni,
        main = "Gráfica N°1.2: Distribución de Frecuencias (Global) de
Provincias",
        xlab = "",
        ylab = "Cantidad",
        
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 22500),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

# DIAGRAMA DE BARRAS (Porcentaje)

barplot(TDFfinalDPA_DESPRO$hi,
        main = "Grafica N°1.3: Distribución de frecuencias (porcentaje) de
Provincias",
        xlab = "",
        ylab = "Porcentaje (%)",
        col = colores,
        names.arg = TDFfinalDPA_DESPRO$variable,
        ylim = c(0, 30),
        las = 2,
        cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

#Crear agrupacion 1

if(!"ni" %in% colnames(TDFfinalDPA_DESPRO)) stop("No existe la columna 'ni' en TDFfinalDPA_DESPRO")
TDFfinalDPA_DESPRO$Grupo <- NA

for(i in 1:nrow(TDFfinalDPA_DESPRO)) {
  if(TDFfinalDPA_DESPRO$ni[i] < 2000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Occidental"
  } else if(TDFfinalDPA_DESPRO$ni[i] >= 2000 && TDFfinalDPA_DESPRO$ni[i] <= 5000) {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Central Andina"
  } else {
    TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Amazónica"
  }
}
print(TDFfinalDPA_DESPRO)

##                          variable   ni         hi               Grupo
## 1                           AZUAY  118  0.5250044     Zona Occidental
## 2                         BOLIVAR   64  0.2847482     Zona Occidental
## 3                          CARCHI   59  0.2625022     Zona Occidental
## 4                      CHIMBORAZO   69  0.3069941     Zona Occidental
## 5                        COTOPAXI  131  0.5828439     Zona Occidental
## 6                          EL ORO  455  2.0243816     Zona Occidental
## 7                      ESMERALDAS  212  0.9432283     Zona Occidental
## 8                           FALSO   81  0.3603844     Zona Occidental
## 9                          GUAYAS 5561 24.7419470      Zona Amazónica
## 10                       IMBABURA  211  0.9387791     Zona Occidental
## 11                           LOJA 2027  9.0185086 Zona Central Andina
## 12                       LOS RIOS 3373 15.0071187 Zona Central Andina
## 13                         MANABI 4665 20.7554725 Zona Central Andina
## 14                MORONA SANTIAGO 2517 11.1986119 Zona Central Andina
## 15                           NAPO  275  1.2235273     Zona Occidental
## 16                       ORELLANA  622  2.7673963     Zona Occidental
## 17                        PASTAZA   66  0.2936466     Zona Occidental
## 18                      PICHINCHA   88  0.3915287     Zona Occidental
## 19                    SANTA ELENA  390  1.7351842     Zona Occidental
## 20 SANTO DOMINGO DE LOS TSACHILAS   28  0.1245773     Zona Occidental
## 21                      SUCUMBIOS 1323  5.8862787     Zona Occidental
## 22                     TUNGURAHUA   34  0.1512725     Zona Occidental
## 23               ZAMORA CHINCHIPE  107  0.4760634     Zona Occidental

Grupo <- table(TDFfinalDPA_DESPRO$Grupo)
conteo_grupos <- table(TDFfinalDPA_DESPRO$Grupo)


# Gráfico de barras

barplot(
  conteo_grupos,
  main = "Gráfica N°1.4: Agrupación por frecuencia",
  xlab = "Agrupación de Provincias",
  ylab = "Cantidad",
  col = colores
)

# Frecuencias relativas (porcentaje)
hi_grupo <- prop.table(Grupo) * 100

# Diagrama circular 

colores <- rev(heat.colors(length(hi_grupo)))
pie(hi_grupo,
    main = "Gráfica N°1.5: Distribución de Frecuencia de provincias",
    col = colores)


legend("bottomright",
       legend = names(hi_grupo),
       title = "Leyenda",
       fill = colores,
       cex = 0.8,         # tamaño del texto (más grande)
       border = "black")

#INDICADORES
moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

# Aplicar moda a DPA_DESPRO
moda_DPA <- moda(datos$DPA_DESPRO)
print(moda_DPA)

## [1] "GUAYAS"

Nomb_provincia

Monica Puchaicela

2025-06-03

DPA_DESPRO