revisa ā title: āprovincias EIā author: āMonica Puchaicelaā date:
ā2025-07-07ā output: html_document ā # UNIVERSIDAD CENTRAL DEL
ECUADOR
### PROYECTO: FOCOS DE CALOR EN EL ECUADOR
### AUTORES: GUERRERO MARIA GABRIELA, PUCHAICELA MONICA, ZURITA
JOHANNA
### FECHA: 14/05/2025
# Configuración
knitr::opts_chunk$set(echo = TRUE)
# Cargar librerĆas necesarias
library(dplyr)
library(gt)
library(stringi)
# Importar datos
datos <- read.csv("Focos de Calor 2021.csv", header = TRUE, sep = ",", dec = ".")
# Convertir la columna de provincias a UTF-8 para evitar problemas con caracteres especiales
datos$DPA_DESPRO <- iconv(datos$DPA_DESPRO, from = "latin1", to = "UTF-8", sub = "")
# Extraer variable nominal
DPA_DESPRO <- datos$DPA_DESPRO
# Tabla de distribución de frecuencia simple
TDFDPA_DESPRO <- as.data.frame(table(DPA_DESPRO))
colnames(TDFDPA_DESPRO) <- c("variable", "ni")
# Calcular porcentaje (frecuencia relativa)
total_ni <- sum(TDFDPA_DESPRO$ni)
TDFDPA_DESPRO$hi <- round((TDFDPA_DESPRO$ni / total_ni) * 100, 1)
# Crear agrupación por zonas según ni
TDFDPA_DESPRO$Grupo <- NA
for(i in 1:nrow(TDFDPA_DESPRO)) {
if(TDFDPA_DESPRO$ni[i] < 2000) {
TDFDPA_DESPRO$Grupo[i] <- "Costa"
} else if(TDFDPA_DESPRO$ni[i] >= 2000 && TDFDPA_DESPRO$ni[i] <= 5000) {
TDFDPA_DESPRO$Grupo[i] <- "Sierra"
} else {
TDFDPA_DESPRO$Grupo[i] <- "AmazonĆa"
}
}
# Crear tabla final como copia de la tabla original
TDFfinalDPA_DESPRO <- TDFDPA_DESPRO
# Calcular total de porcentaje hi
total_hi <- sum(TDFfinalDPA_DESPRO$hi, na.rm = TRUE)
# Agregar fila Total con la misma estructura
fila_total <- data.frame(variable = "Total", ni = total_ni, hi = total_hi, Grupo = NA, stringsAsFactors = FALSE)
TDFfinalDPA_DESPRO <- rbind(TDFfinalDPA_DESPRO, fila_total)
# Convertir columnas de texto a UTF-8 (por si acaso)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
TDFfinalDPA_DESPRO$Grupo <- iconv(TDFfinalDPA_DESPRO$Grupo, from = "latin1", to = "UTF-8", sub = "")
# Crear tabla con gt (sin print, devolver la tabla)
tabla_Provincia <- TDFfinalDPA_DESPRO %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 1.1*"),
subtitle = md("**Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
) %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(
rows = variable == "Total"
)
)
tabla_Provincia
Tabla Nro. 1.1 | |||
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador | |||
variable | ni | hi | Grupo |
---|---|---|---|
AZUAY | 118 | 0.5 | Costa |
BOLIVAR | 64 | 0.3 | Costa |
CAĆĀAR | 81 | 0.4 | Costa |
CARCHI | 59 | 0.3 | Costa |
CHIMBORAZO | 69 | 0.3 | Costa |
COTOPAXI | 131 | 0.6 | Costa |
EL ORO | 455 | 2.0 | Costa |
ESMERALDAS | 212 | 0.9 | Costa |
GUAYAS | 5561 | 24.7 | AmazonĆĀa |
IMBABURA | 211 | 0.9 | Costa |
LOJA | 2027 | 9.0 | Sierra |
LOS RIOS | 3373 | 15.0 | Sierra |
MANABI | 4665 | 20.8 | Sierra |
MORONA SANTIAGO | 2517 | 11.2 | Sierra |
NAPO | 275 | 1.2 | Costa |
ORELLANA | 622 | 2.8 | Costa |
PASTAZA | 66 | 0.3 | Costa |
PICHINCHA | 88 | 0.4 | Costa |
SANTA ELENA | 390 | 1.7 | Costa |
SANTO DOMINGO DE LOS TSACHILAS | 28 | 0.1 | Costa |
SUCUMBIOS | 1323 | 5.9 | Costa |
TUNGURAHUA | 34 | 0.2 | Costa |
ZAMORA CHINCHIPE | 107 | 0.5 | Costa |
Total | 22476 | 100.0 | NA |
Autor: Grupo 3 |
# Frecuencias relativas (%) por grupo
Grupo <- table(TDFDPA_DESPRO$Grupo)
hi_grupo <- prop.table(Grupo) * 100
df_grupos <- as.data.frame(hi_grupo)
colnames(df_grupos) <- c("zona", "porcentaje")
# Agregar columna probabilidad (decimal)
df_grupos$probabilidad <- round(df_grupos$porcentaje, 3)
df_grupos
## zona porcentaje probabilidad
## 1 AmazonĆa 4.347826 4.348
## 2 Costa 78.260870 78.261
## 3 Sierra 17.391304 17.391
# Graficar porcentaje de frecuencia por zona
colores <- rev(heat.colors(nrow(df_grupos)))
barplot(df_grupos$porcentaje,
main = "Distribución de Frecuencia de Provincias por Zona",
xlab = "Zona",
ylab = "Porcentaje (%)",
names.arg = df_grupos$zona,
col = colores,
ylim = c(0, max(df_grupos$porcentaje) + 5),
las = 1,
cex.names = 1)
# Graficar probabilidad por zona (decimal)
barplot(df_grupos$probabilidad,
main = "Distribución de Probabilidad de Provincias por Zona",
xlab = "Zona",
ylab = "Probabilidad",
names.arg = df_grupos$zona,
col = colores,
ylim = c(0, max(df_grupos$probabilidad) + 0.05),
las = 1,
cex.names = 1)
#El modelo es Poisson.
# Calcular el total de focos en todo el paĆs
total_focos <- sum(TDFDPA_DESPRO$ni, na.rm = TRUE)
# Calcular el total de focos en la Costa
total_costa <- sum(TDFDPA_DESPRO$ni[TDFDPA_DESPRO$Grupo == "Costa"], na.rm = TRUE)
# Calcular la probabilidad como porcentaje
prob_costa <- round((total_costa / total_focos) * 100, 1)
# Imprimir resultado como respuesta a la pregunta
cat("La probabilidad de que un foco de calor ocurra en la Costa es:", prob_costa, "%\n")
## La probabilidad de que un foco de calor ocurra en la Costa es: 19.3 %