FECHA: 14/05/2025
# Configuración
knitr::opts_chunk$set(echo = TRUE)
# importar datos
setwd("/cloud/project")
datos <- read.csv("Focos de Calor 2021.csv",
header = T, sep = ",", dec = ".")
datos <- read.csv("Focos de Calor 2021.csv",
header = TRUE, sep = ",", dec = ".", fileEncoding = "latin1")
#Estructura de los datos
str(datos)
## 'data.frame': 22476 obs. of 12 variables:
## $ ACQ_DATE : chr "20/11/2021" "20/11/2021" "06/08/2021" "10/06/2021" ...
## $ DPA_DESPRO: chr "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" ...
## $ DPA_DESCAN: chr "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" ...
## $ DPA_DESPAR: chr "CHITO" "CHITO" "PUCAPAMBA" "PUCAPAMBA" ...
## $ LATITUDE : num -4.98e+15 -4.97e+15 -4.96e+15 -4.96e+15 -4.96e+15 ...
## $ LONGITUDE : num -7.90e+16 -7.90e+16 -7.91e+16 -7.91e+16 -7.92e+16 ...
## $ BRIGHTNESS: num 3.55e+17 3.42e+17 3.32e+17 3.31e+17 3.28e+17 ...
## $ SCAN : num 5.1e+14 5.1e+14 1.5e+14 5.4e+14 5.0e+14 ...
## $ TRACK : num 4.9e+14 4.9e+14 3.8e+14 4.2e+14 4.9e+14 ...
## $ INSTRUMENT: chr "VIIRS" "VIIRS" "VIIRS" "VIIRS" ...
## $ VERSION : chr "2.0NRT" "2.0NRT" "2.0NRT" "2.0NRT" ...
## $ FRP : num 1.21e+16 6.87e+15 3.77e+15 5.50e+15 2.90e+15 ...
#Extraer la variable nominal
DPA_DESPRO <- datos$ DPA_DESPRO
#EDA variable nominal
#Tabla de Distribucion de Frecuencia
TDFDPA_DESPRO <- table(DPA_DESPRO)
TDFDPA_DESPRO
## DPA_DESPRO
## AZUAY BOLIVAR
## 118 64
## CAÑAR CARCHI
## 81 59
## CHIMBORAZO COTOPAXI
## 69 131
## EL ORO ESMERALDAS
## 455 212
## GUAYAS IMBABURA
## 5561 211
## LOJA LOS RIOS
## 2027 3373
## MANABI MORONA SANTIAGO
## 4665 2517
## NAPO ORELLANA
## 275 622
## PASTAZA PICHINCHA
## 66 88
## SANTA ELENA SANTO DOMINGO DE LOS TSACHILAS
## 390 28
## SUCUMBIOS TUNGURAHUA
## 1323 34
## ZAMORA CHINCHIPE
## 107
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$ni
## [1] 118 64 81 59 69 131 455 212 5561 211 2027 3373 4665 2517 275
## [16] 622 66 88 390 28 1323 34 107
sum(TDFfinalDPA_DESPRO$ni)
## [1] 22476
hi <- TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)
hi <- hi*100
sum(hi)
## [1] 100
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
TDFfinalDPA_DESPRO <- subset(TDFfinalDPA_DESPRO, variable != "Total")
ni <- TDFfinalDPA_DESPRO$ni
sum(ni)
## [1] 22476
variable <- TDFfinalDPA_DESPRO$variable
total_ni <- sum(ni)
total_hi <- sum(hi)
TDFfinalDPA_DESPRO <- TDFfinalDPA_DESPRO[TDFfinalDPA_DESPRO$variable != "Total", ]
TDFfinalDPA_DESPRO <- rbind(
TDFfinalDPA_DESPRO,
data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni" "hi"
TDFDPA_DESPRO <- table(DPA_DESPRO)
# Convertimos a data frame
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
total_ni <- sum(TDFfinalDPA_DESPRO$ni)
total_ni
## [1] 22476
total_hi <- sum(TDFfinalDPA_DESPRO$hi)
total_hi
## [1] 100
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni" "hi"
TDFfinalDPA_DESPRO <- rbind(
TDFfinalDPA_DESPRO,
data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
TDFfinalDPA_DESPRO
## variable ni hi
## 1 AZUAY 118 0.5250044
## 2 BOLIVAR 64 0.2847482
## 3 CAÑAR 81 0.3603844
## 4 CARCHI 59 0.2625022
## 5 CHIMBORAZO 69 0.3069941
## 6 COTOPAXI 131 0.5828439
## 7 EL ORO 455 2.0243816
## 8 ESMERALDAS 212 0.9432283
## 9 GUAYAS 5561 24.7419470
## 10 IMBABURA 211 0.9387791
## 11 LOJA 2027 9.0185086
## 12 LOS RIOS 3373 15.0071187
## 13 MANABI 4665 20.7554725
## 14 MORONA SANTIAGO 2517 11.1986119
## 15 NAPO 275 1.2235273
## 16 ORELLANA 622 2.7673963
## 17 PASTAZA 66 0.2936466
## 18 PICHINCHA 88 0.3915287
## 19 SANTA ELENA 390 1.7351842
## 20 SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773
## 21 SUCUMBIOS 1323 5.8862787
## 22 TUNGURAHUA 34 0.1512725
## 23 ZAMORA CHINCHIPE 107 0.4760634
## 24 Total 22476 100.0000000
install.packages("gt")
library(gt)
install.packages("stringi")
library(stringi)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
warning("Quedan cadenas con problemas de codificación")
} else {
message("Codificación UTF-8 correcta")
}
TDFfinalDPA_DESPRO <- as.data.frame(TDFfinalDPA_DESPRO)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
warning("Quedan cadenas con problemas de codificación")
} else {
message("Codificación UTF-8 correcta")
}
library(gt)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8")
library(dplyr)
install.packages("gt")
TDFfinalDPA_DESPRO %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 1.1*"),
subtitle = md("**Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
Tabla Nro. 1.1 |
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador |
variable |
ni |
hi |
AZUAY |
118 |
0.5250044 |
BOLIVAR |
64 |
0.2847482 |
CAÑAR |
81 |
0.3603844 |
CARCHI |
59 |
0.2625022 |
CHIMBORAZO |
69 |
0.3069941 |
COTOPAXI |
131 |
0.5828439 |
EL ORO |
455 |
2.0243816 |
ESMERALDAS |
212 |
0.9432283 |
GUAYAS |
5561 |
24.7419470 |
IMBABURA |
211 |
0.9387791 |
LOJA |
2027 |
9.0185086 |
LOS RIOS |
3373 |
15.0071187 |
MANABI |
4665 |
20.7554725 |
MORONA SANTIAGO |
2517 |
11.1986119 |
NAPO |
275 |
1.2235273 |
ORELLANA |
622 |
2.7673963 |
PASTAZA |
66 |
0.2936466 |
PICHINCHA |
88 |
0.3915287 |
SANTA ELENA |
390 |
1.7351842 |
SANTO DOMINGO DE LOS TSACHILAS |
28 |
0.1245773 |
SUCUMBIOS |
1323 |
5.8862787 |
TUNGURAHUA |
34 |
0.1512725 |
ZAMORA CHINCHIPE |
107 |
0.4760634 |
Total |
22476 |
100.0000000 |
Autor: Grupo 3 |
#Tabla No.1
#Distribuccion de provincias extendido
#GDF 1
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
barplot(
height = TDFfinalDPA_DESPRO$ni,
names.arg = TDFfinalDPA_DESPRO$variable,
main = "Gráfica No. 1.1: Distribución de Provincias",
xlab = "",
ylab = "Cantidad",
col = heat.colors(length(TDFfinalDPA_DESPRO$ni)),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

# DIAGRAMA DE BARRAS (GLOBAL)
colores <- c("yellow", "orange", "red")
barplot(TDFfinalDPA_DESPRO$ni,
main = "Gráfica 1.2: Distribución de frecuencias (Global) de
Provincias",
xlab = "",
ylab = "Cantidad",
col = colores,
names.arg = TDFfinalDPA_DESPRO$variable,
ylim = c(0, 22500),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

# DIAGRAMA DE BARRAS (Porcentaje)
barplot(TDFfinalDPA_DESPRO$hi,
main = "Grafica No 1.3: Distribución de frecuencias (porcentaje) de
Provincias",
xlab = "",
ylab = "Porcentaje (%)",
col = colores,
names.arg = TDFfinalDPA_DESPRO$variable,
ylim = c(0, 30),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)

#Crear agrupacion 1
if(!"ni" %in% colnames(TDFfinalDPA_DESPRO)) stop("No existe la columna 'ni' en TDFfinalDPA_DESPRO")
TDFfinalDPA_DESPRO$Grupo <- NA
for(i in 1:nrow(TDFfinalDPA_DESPRO)) {
if(TDFfinalDPA_DESPRO$ni[i] < 2000) {
TDFfinalDPA_DESPRO$Grupo[i] <- "Costa"
} else if(TDFfinalDPA_DESPRO$ni[i] >= 2000 && TDFfinalDPA_DESPRO$ni[i] <= 5000) {
TDFfinalDPA_DESPRO$Grupo[i] <- "Sierra"
} else {
TDFfinalDPA_DESPRO$Grupo[i] <- "Amazónia"
}
}
print(TDFfinalDPA_DESPRO)
## variable ni hi Grupo
## 1 AZUAY 118 0.5250044 Costa
## 2 BOLIVAR 64 0.2847482 Costa
## 3 CAÃ\u0083Â\u0091AR 81 0.3603844 Costa
## 4 CARCHI 59 0.2625022 Costa
## 5 CHIMBORAZO 69 0.3069941 Costa
## 6 COTOPAXI 131 0.5828439 Costa
## 7 EL ORO 455 2.0243816 Costa
## 8 ESMERALDAS 212 0.9432283 Costa
## 9 GUAYAS 5561 24.7419470 Amazónia
## 10 IMBABURA 211 0.9387791 Costa
## 11 LOJA 2027 9.0185086 Sierra
## 12 LOS RIOS 3373 15.0071187 Sierra
## 13 MANABI 4665 20.7554725 Sierra
## 14 MORONA SANTIAGO 2517 11.1986119 Sierra
## 15 NAPO 275 1.2235273 Costa
## 16 ORELLANA 622 2.7673963 Costa
## 17 PASTAZA 66 0.2936466 Costa
## 18 PICHINCHA 88 0.3915287 Costa
## 19 SANTA ELENA 390 1.7351842 Costa
## 20 SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773 Costa
## 21 SUCUMBIOS 1323 5.8862787 Costa
## 22 TUNGURAHUA 34 0.1512725 Costa
## 23 ZAMORA CHINCHIPE 107 0.4760634 Costa
## 24 Total 22476 100.0000000 Amazónia
Grupo <- table(TDFfinalDPA_DESPRO$Grupo)
conteo_grupos <- table(TDFfinalDPA_DESPRO$Grupo)
# Gráfico de barras
barplot(
conteo_grupos,
main = "Gráfica No 1.4: Agrupación por frecuencia",
xlab = "Agrupación de Provincias",
ylab = "Cantidad",
col = colores
)

# Frecuencias relativas (porcentaje)
hi_grupo <- prop.table(Grupo) * 100
# Diagrama circular
colores <- rev(heat.colors(length(hi_grupo)))
porcentajes <- round(hi_grupo, 1)
etiquetas <- paste(names(hi_grupo), ": ", porcentajes, "%", sep = "")
# Diagrama circular con etiquetas
pie(hi_grupo,
labels = etiquetas, # agregamos las etiquetas con porcentaje
main = "Gráfica No. 1.5: Distribución de Frecuencia de provincias",
col = colores)
# Leyenda opcional (si quieres conservarla):
legend("bottomright",
legend = etiquetas,
title = "Leyenda",
fill = colores,
cex = 0.8,
border = "black")

#INDICADORES
moda <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
# Aplicar moda a DPA_DESPRO
moda_DPA <- moda(datos$DPA_DESPRO)
print(moda_DPA)
## [1] "GUAYAS"