UNIVERSIDAD CENTRAL DEL ECUADOR
PROYECTO: FOCOS DE CALOR EN EL ECUADOR
AUTORES: GUERRERO MARIA GABRIELA,PUCHAICELA MONICA, ZURITA JOHANNA
FECHA: 14/05/2025
# importar datos
datos <- read.csv("maate_focosdecalor_bdd_2021diciembre.csv",
header = T, sep = ",", dec = ".")
#Estructura de los datos
str(datos)
## 'data.frame': 22476 obs. of 17 variables:
## $ MES_REPORT: int 11 11 8 6 5 6 11 9 3 3 ...
## $ DIA_REPORT: int 20 20 6 10 28 10 20 29 22 22 ...
## $ DPA_DESPRO: chr "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" "ZAMORA CHINCHIPE" ...
## $ DPA_DESCAN: chr "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" "CHINCHIPE" ...
## $ DPA_DESPAR: chr "CHITO" "CHITO" "PUCAPAMBA" "PUCAPAMBA" ...
## $ TXT_1 : chr "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" "PARROQUIA RURAL" ...
## $ LATITUDE : chr "-4,981720000000000" "-4,969160000000000" "-4,958520000000000" "-4,957820000000000" ...
## $ LONGITUDE : chr "-79,041280000000000" "-79,049490000000006" "-79,118430000000004" "-79,111859999999993" ...
## $ BRIGHTNESS: chr "354,759999999999990" "342,009999999999990" "331,860000000000010" "331,399999999999980" ...
## $ SCAN : chr "0,510000000000000" "0,510000000000000" "0,150000000000000" "0,540000000000000" ...
## $ TRACK : chr "0,490000000000000" "0,490000000000000" "0,380000000000000" "0,420000000000000" ...
## $ SATELLITE : chr "1" "1" "1" "1" ...
## $ CONFIDENCE: chr "n" "n" "n" "n" ...
## $ VERSION : chr "2.0NRT" "2.0NRT" "2.0NRT" "2.0NRT" ...
## $ BRIGHT_T31: chr "299,420000000000020" "298,149999999999980" "299,160000000000030" "296,800000000000010" ...
## $ FRP : chr "12,100000000000000" "6,870000000000000" "3,770000000000000" "5,500000000000000" ...
## $ DAYNIGHT : chr "D" "D" "D" "D" ...
#Extraer la variable nominal
DPA_DESPRO <- datos$ DPA_DESPRO
#EDA variable nominal
#Tabla de Distribucion de Frecuencia
TDFDPA_DESPRO <- table(DPA_DESPRO)
TDFDPA_DESPRO
## DPA_DESPRO
## AZUAY BOLIVAR
## 118 64
## CARCHI CHIMBORAZO
## 59 69
## COTOPAXI EL ORO
## 131 455
## ESMERALDAS FALSO
## 212 81
## GUAYAS IMBABURA
## 5561 211
## LOJA LOS RIOS
## 2027 3373
## MANABI MORONA SANTIAGO
## 4665 2517
## NAPO ORELLANA
## 275 622
## PASTAZA PICHINCHA
## 66 88
## SANTA ELENA SANTO DOMINGO DE LOS TSACHILAS
## 390 28
## SUCUMBIOS TUNGURAHUA
## 1323 34
## ZAMORA CHINCHIPE
## 107
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
hi <- TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)
hi <- hi*100
sum(hi)
## [1] 100
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
TDFfinalDPA_DESPRO <- subset(TDFfinalDPA_DESPRO, variable != "Total")
ni <- TDFfinalDPA_DESPRO$ni
sum(ni)
## [1] 22476
variable <- TDFfinalDPA_DESPRO$variable
total_ni <- sum(ni)
total_hi <- sum(hi)
TDFfinalDPA_DESPRO <- TDFfinalDPA_DESPRO[TDFfinalDPA_DESPRO$variable != "Total", ]
TDFfinalDPA_DESPRO <- rbind(
TDFfinalDPA_DESPRO,
data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni" "hi"
TDFDPA_DESPRO <- table(DPA_DESPRO)
# Convertimos a data frame
TDFfinalDPA_DESPRO <- as.data.frame(TDFDPA_DESPRO)
colnames(TDFfinalDPA_DESPRO) <- c("variable", "ni")
TDFfinalDPA_DESPRO$hi <- (TDFfinalDPA_DESPRO$ni / sum(TDFfinalDPA_DESPRO$ni)) * 100
total_ni <- sum(TDFfinalDPA_DESPRO$ni)
total_ni
## [1] 22476
total_hi <- sum(TDFfinalDPA_DESPRO$hi)
total_hi
## [1] 100
names(TDFfinalDPA_DESPRO)
## [1] "variable" "ni" "hi"
TDFfinalDPA_DESPRO <- rbind(
TDFfinalDPA_DESPRO,
data.frame(variable = "Total", ni = total_ni, hi = total_hi)
)
TDFfinalDPA_DESPRO
## variable ni hi
## 1 AZUAY 118 0.5250044
## 2 BOLIVAR 64 0.2847482
## 3 CARCHI 59 0.2625022
## 4 CHIMBORAZO 69 0.3069941
## 5 COTOPAXI 131 0.5828439
## 6 EL ORO 455 2.0243816
## 7 ESMERALDAS 212 0.9432283
## 8 FALSO 81 0.3603844
## 9 GUAYAS 5561 24.7419470
## 10 IMBABURA 211 0.9387791
## 11 LOJA 2027 9.0185086
## 12 LOS RIOS 3373 15.0071187
## 13 MANABI 4665 20.7554725
## 14 MORONA SANTIAGO 2517 11.1986119
## 15 NAPO 275 1.2235273
## 16 ORELLANA 622 2.7673963
## 17 PASTAZA 66 0.2936466
## 18 PICHINCHA 88 0.3915287
## 19 SANTA ELENA 390 1.7351842
## 20 SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773
## 21 SUCUMBIOS 1323 5.8862787
## 22 TUNGURAHUA 34 0.1512725
## 23 ZAMORA CHINCHIPE 107 0.4760634
## 24 Total 22476 100.0000000
library(gt)
library(stringi)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
warning("Quedan cadenas con problemas de codificación")
} else {
message("Codificación UTF-8 correcta")
}
## Codificación UTF-8 correcta
TDFfinalDPA_DESPRO <- as.data.frame(TDFfinalDPA_DESPRO)
if(any(!stri_enc_isutf8(TDFfinalDPA_DESPRO$variable))){
warning("Quedan cadenas con problemas de codificación")
} else {
message("Codificación UTF-8 correcta")
}
## Codificación UTF-8 correcta
library(gt)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
TDFfinalDPA_DESPRO %>%
gt() %>%
tab_header(
title = md("Tabla Nro. 1"),
subtitle = md("*Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador*")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 1 | ||
| Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador | ||
| variable | ni | hi |
|---|---|---|
| AZUAY | 118 | 0.5250044 |
| BOLIVAR | 64 | 0.2847482 |
| CARCHI | 59 | 0.2625022 |
| CHIMBORAZO | 69 | 0.3069941 |
| COTOPAXI | 131 | 0.5828439 |
| EL ORO | 455 | 2.0243816 |
| ESMERALDAS | 212 | 0.9432283 |
| FALSO | 81 | 0.3603844 |
| GUAYAS | 5561 | 24.7419470 |
| IMBABURA | 211 | 0.9387791 |
| LOJA | 2027 | 9.0185086 |
| LOS RIOS | 3373 | 15.0071187 |
| MANABI | 4665 | 20.7554725 |
| MORONA SANTIAGO | 2517 | 11.1986119 |
| NAPO | 275 | 1.2235273 |
| ORELLANA | 622 | 2.7673963 |
| PASTAZA | 66 | 0.2936466 |
| PICHINCHA | 88 | 0.3915287 |
| SANTA ELENA | 390 | 1.7351842 |
| SANTO DOMINGO DE LOS TSACHILAS | 28 | 0.1245773 |
| SUCUMBIOS | 1323 | 5.8862787 |
| TUNGURAHUA | 34 | 0.1512725 |
| ZAMORA CHINCHIPE | 107 | 0.4760634 |
| Total | 22476 | 100.0000000 |
| Autor: Grupo 3 | ||
library(gt)
#Tabla No.1
#Distribuccion de provincias extendido
TDFfinalDPA_DESPRO<- subset(TDFfinalDPA_DESPRO, variable != "Total")
#GDF 1
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
barplot(
height = TDFfinalDPA_DESPRO$ni,
names.arg = TDFfinalDPA_DESPRO$variable,
main = "Gráfica N°1.1: Distribución de Frecuencias de Provincias",
xlab = "",
ylab = "Cantidad",
col = heat.colors(length(TDFfinalDPA_DESPRO$ni)),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)
# DIAGRAMA DE BARRAS (GLOBAL)
colores <- c("yellow", "orange", "red")
barplot(TDFfinalDPA_DESPRO$ni,
main = "Gráfica N°1.2: Distribución de Frecuencias (Global) de
Provincias",
xlab = "",
ylab = "Cantidad",
col = colores,
names.arg = TDFfinalDPA_DESPRO$variable,
ylim = c(0, 22500),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)
# DIAGRAMA DE BARRAS (Porcentaje)
barplot(TDFfinalDPA_DESPRO$hi,
main = "Grafica N°1.3: Distribución de frecuencias (porcentaje) de
Provincias",
xlab = "",
ylab = "Porcentaje (%)",
col = colores,
names.arg = TDFfinalDPA_DESPRO$variable,
ylim = c(0, 30),
las = 2,
cex.names = 0.7
)
mtext("Provincias", side = 1, line = 4, cex = 1)
#Crear agrupacion 1
if(!"ni" %in% colnames(TDFfinalDPA_DESPRO)) stop("No existe la columna 'ni' en TDFfinalDPA_DESPRO")
TDFfinalDPA_DESPRO$Grupo <- NA
for(i in 1:nrow(TDFfinalDPA_DESPRO)) {
if(TDFfinalDPA_DESPRO$ni[i] < 2000) {
TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Occidental"
} else if(TDFfinalDPA_DESPRO$ni[i] >= 2000 && TDFfinalDPA_DESPRO$ni[i] <= 5000) {
TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Central Andina"
} else {
TDFfinalDPA_DESPRO$Grupo[i] <- "Zona Amazónica"
}
}
print(TDFfinalDPA_DESPRO)
## variable ni hi Grupo
## 1 AZUAY 118 0.5250044 Zona Occidental
## 2 BOLIVAR 64 0.2847482 Zona Occidental
## 3 CARCHI 59 0.2625022 Zona Occidental
## 4 CHIMBORAZO 69 0.3069941 Zona Occidental
## 5 COTOPAXI 131 0.5828439 Zona Occidental
## 6 EL ORO 455 2.0243816 Zona Occidental
## 7 ESMERALDAS 212 0.9432283 Zona Occidental
## 8 FALSO 81 0.3603844 Zona Occidental
## 9 GUAYAS 5561 24.7419470 Zona Amazónica
## 10 IMBABURA 211 0.9387791 Zona Occidental
## 11 LOJA 2027 9.0185086 Zona Central Andina
## 12 LOS RIOS 3373 15.0071187 Zona Central Andina
## 13 MANABI 4665 20.7554725 Zona Central Andina
## 14 MORONA SANTIAGO 2517 11.1986119 Zona Central Andina
## 15 NAPO 275 1.2235273 Zona Occidental
## 16 ORELLANA 622 2.7673963 Zona Occidental
## 17 PASTAZA 66 0.2936466 Zona Occidental
## 18 PICHINCHA 88 0.3915287 Zona Occidental
## 19 SANTA ELENA 390 1.7351842 Zona Occidental
## 20 SANTO DOMINGO DE LOS TSACHILAS 28 0.1245773 Zona Occidental
## 21 SUCUMBIOS 1323 5.8862787 Zona Occidental
## 22 TUNGURAHUA 34 0.1512725 Zona Occidental
## 23 ZAMORA CHINCHIPE 107 0.4760634 Zona Occidental
Grupo <- table(TDFfinalDPA_DESPRO$Grupo)
conteo_grupos <- table(TDFfinalDPA_DESPRO$Grupo)
# Gráfico de barras
barplot(
conteo_grupos,
main = "Gráfica N°1.4: Agrupación por frecuencia",
xlab = "Agrupación de Provincias",
ylab = "Cantidad",
col = colores
)
# Frecuencias relativas (porcentaje)
hi_grupo <- prop.table(Grupo) * 100
# Diagrama circular
colores <- rev(heat.colors(length(hi_grupo)))
pie(hi_grupo,
main = "Gráfica N°1.5: Distribución de Frecuencia de provincias",
col = colores)
legend("bottomright",
legend = names(hi_grupo),
title = "Leyenda",
fill = colores,
cex = 0.8, # tamaño del texto (más grande)
border = "black")
#INDICADORES
moda <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
# Aplicar moda a DPA_DESPRO
moda_DPA <- moda(datos$DPA_DESPRO)
print(moda_DPA)
## [1] "GUAYAS"