revisa — title: ā€œprovincias EIā€ author: ā€œMonica Puchaicelaā€ date: ā€œ2025-07-07ā€ output: html_document — # UNIVERSIDAD CENTRAL DEL ECUADOR
### PROYECTO: FOCOS DE CALOR EN EL ECUADOR
### AUTORES: GUERRERO MARIA GABRIELA, PUCHAICELA MONICA, ZURITA JOHANNA
### FECHA: 14/05/2025

# Configuración
knitr::opts_chunk$set(echo = TRUE)
# Cargar librerĆ­as necesarias
library(dplyr)
library(gt)
library(stringi)
# Importar datos
datos <- read.csv("Focos de Calor 2021.csv", header = TRUE, sep = ",", dec = ".")

# Convertir la columna de provincias a UTF-8 para evitar problemas con caracteres especiales
datos$DPA_DESPRO <- iconv(datos$DPA_DESPRO, from = "latin1", to = "UTF-8", sub = "")

# Extraer variable nominal
DPA_DESPRO <- datos$DPA_DESPRO

# Tabla de distribución de frecuencia simple
TDFDPA_DESPRO <- as.data.frame(table(DPA_DESPRO))
colnames(TDFDPA_DESPRO) <- c("variable", "ni")

# Calcular porcentaje (frecuencia relativa)
total_ni <- sum(TDFDPA_DESPRO$ni)
TDFDPA_DESPRO$hi <- round((TDFDPA_DESPRO$ni / total_ni) * 100, 1)

# Crear agrupación por zonas según ni
TDFDPA_DESPRO$Grupo <- NA
for(i in 1:nrow(TDFDPA_DESPRO)) {
  if(TDFDPA_DESPRO$ni[i] < 2000) {
    TDFDPA_DESPRO$Grupo[i] <- "Costa"
  } else if(TDFDPA_DESPRO$ni[i] >= 2000 && TDFDPA_DESPRO$ni[i] <= 5000) {
    TDFDPA_DESPRO$Grupo[i] <- "Sierra"
  } else {
    TDFDPA_DESPRO$Grupo[i] <- "AmazonĆ­a"
  }
}

# Crear tabla final como copia de la tabla original
TDFfinalDPA_DESPRO <- TDFDPA_DESPRO

# Calcular total de porcentaje hi
total_hi <- sum(TDFfinalDPA_DESPRO$hi, na.rm = TRUE)

# Agregar fila Total con la misma estructura
fila_total <- data.frame(variable = "Total", ni = total_ni, hi = total_hi, Grupo = NA, stringsAsFactors = FALSE)

TDFfinalDPA_DESPRO <- rbind(TDFfinalDPA_DESPRO, fila_total)

# Convertir columnas de texto a UTF-8 (por si acaso)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
TDFfinalDPA_DESPRO$Grupo <- iconv(TDFfinalDPA_DESPRO$Grupo, from = "latin1", to = "UTF-8", sub = "")
# Crear tabla con gt (sin print, devolver la tabla)
tabla_Provincia <- TDFfinalDPA_DESPRO %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1.1*"),
    subtitle = md("**Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(
      rows = variable == "Total"
    )
  )

tabla_Provincia
Tabla Nro. 1.1
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador
variable ni hi Grupo
AZUAY 118 0.5 Costa
BOLIVAR 64 0.3 Costa
CAĆƒĀ‘AR 81 0.4 Costa
CARCHI 59 0.3 Costa
CHIMBORAZO 69 0.3 Costa
COTOPAXI 131 0.6 Costa
EL ORO 455 2.0 Costa
ESMERALDAS 212 0.9 Costa
GUAYAS 5561 24.7 Amazonía
IMBABURA 211 0.9 Costa
LOJA 2027 9.0 Sierra
LOS RIOS 3373 15.0 Sierra
MANABI 4665 20.8 Sierra
MORONA SANTIAGO 2517 11.2 Sierra
NAPO 275 1.2 Costa
ORELLANA 622 2.8 Costa
PASTAZA 66 0.3 Costa
PICHINCHA 88 0.4 Costa
SANTA ELENA 390 1.7 Costa
SANTO DOMINGO DE LOS TSACHILAS 28 0.1 Costa
SUCUMBIOS 1323 5.9 Costa
TUNGURAHUA 34 0.2 Costa
ZAMORA CHINCHIPE 107 0.5 Costa
Total 22476 100.0 NA
Autor: Grupo 3
# Frecuencias relativas (%) por grupo
Grupo <- table(TDFDPA_DESPRO$Grupo)
hi_grupo <- prop.table(Grupo) * 100
df_grupos <- as.data.frame(hi_grupo)
colnames(df_grupos) <- c("zona", "porcentaje")

# Agregar columna probabilidad (decimal)
df_grupos$probabilidad <- round(df_grupos$porcentaje, 3)

df_grupos
##       zona porcentaje probabilidad
## 1 AmazonĆ­a   4.347826        4.348
## 2    Costa  78.260870       78.261
## 3   Sierra  17.391304       17.391
# Graficar porcentaje de frecuencia por zona
colores <- rev(heat.colors(nrow(df_grupos)))

barplot(df_grupos$porcentaje,
        main = "Distribución de Frecuencia de Provincias por Zona",
        xlab = "Zona",
        ylab = "Porcentaje (%)",
        names.arg = df_grupos$zona,
        col = colores,
        ylim = c(0, max(df_grupos$porcentaje) + 5),
        las = 1,
        cex.names = 1)

# Graficar probabilidad por zona (decimal)
barplot(df_grupos$probabilidad,
        main = "Distribución de Probabilidad de Provincias por Zona",
        xlab = "Zona",
        ylab = "Probabilidad",
        names.arg = df_grupos$zona,
        col = colores,
        ylim = c(0, max(df_grupos$probabilidad) + 0.05),
        las = 1,
        cex.names = 1)

#El modelo es Poisson.
# Calcular el total de focos en todo el paĆ­s
total_focos <- sum(TDFDPA_DESPRO$ni, na.rm = TRUE)

# Calcular el total de focos en la Costa
total_costa <- sum(TDFDPA_DESPRO$ni[TDFDPA_DESPRO$Grupo == "Costa"], na.rm = TRUE)

# Calcular la probabilidad como porcentaje
prob_costa <- round((total_costa / total_focos) * 100, 1)
# Imprimir resultado como respuesta a la pregunta
cat("La probabilidad de que un foco de calor ocurra en la Costa es:", prob_costa, "%\n")
## La probabilidad de que un foco de calor ocurra en la Costa es: 19.3 %