Provincias.knit

revisa — title: “provincias EI” author: “Monica Puchaicela” date: “2025-07-07” output: html_document — # UNIVERSIDAD CENTRAL DEL ECUADOR
### PROYECTO: FOCOS DE CALOR EN EL ECUADOR
### AUTORES: GUERRERO MARIA GABRIELA, PUCHAICELA MONICA, ZURITA JOHANNA
### FECHA: 14/05/2025

# Configuración
knitr::opts_chunk$set(echo = TRUE)
# Cargar librerías necesarias
library(dplyr)
library(gt)
library(stringi)
# Importar datos
datos <- read.csv("Focos de Calor 2021.csv", header = TRUE, sep = ",", dec = ".")

# Convertir la columna de provincias a UTF-8 para evitar problemas con caracteres especiales
datos$DPA_DESPRO <- iconv(datos$DPA_DESPRO, from = "latin1", to = "UTF-8", sub = "")

# Extraer variable nominal
DPA_DESPRO <- datos$DPA_DESPRO

# Tabla de distribución de frecuencia simple
TDFDPA_DESPRO <- as.data.frame(table(DPA_DESPRO))
colnames(TDFDPA_DESPRO) <- c("variable", "ni")

# Calcular porcentaje (frecuencia relativa)
total_ni <- sum(TDFDPA_DESPRO$ni)
TDFDPA_DESPRO$hi <- round((TDFDPA_DESPRO$ni / total_ni) * 100, 1)

# Crear agrupación por zonas según ni
TDFDPA_DESPRO$Grupo <- NA
for(i in 1:nrow(TDFDPA_DESPRO)) {
  if(TDFDPA_DESPRO$ni[i] < 2000) {
    TDFDPA_DESPRO$Grupo[i] <- "Costa"
  } else if(TDFDPA_DESPRO$ni[i] >= 2000 && TDFDPA_DESPRO$ni[i] <= 5000) {
    TDFDPA_DESPRO$Grupo[i] <- "Sierra"
  } else {
    TDFDPA_DESPRO$Grupo[i] <- "Amazonía"
  }
}

# Crear tabla final como copia de la tabla original
TDFfinalDPA_DESPRO <- TDFDPA_DESPRO

# Calcular total de porcentaje hi
total_hi <- sum(TDFfinalDPA_DESPRO$hi, na.rm = TRUE)

# Agregar fila Total con la misma estructura
fila_total <- data.frame(variable = "Total", ni = total_ni, hi = total_hi, Grupo = NA, stringsAsFactors = FALSE)

TDFfinalDPA_DESPRO <- rbind(TDFfinalDPA_DESPRO, fila_total)

# Convertir columnas de texto a UTF-8 (por si acaso)
TDFfinalDPA_DESPRO$variable <- iconv(TDFfinalDPA_DESPRO$variable, from = "latin1", to = "UTF-8", sub = "")
TDFfinalDPA_DESPRO$Grupo <- iconv(TDFfinalDPA_DESPRO$Grupo, from = "latin1", to = "UTF-8", sub = "")
# Crear tabla con gt (sin print, devolver la tabla)
tabla_Provincia <- TDFfinalDPA_DESPRO %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1.1*"),
    subtitle = md("**Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(
      rows = variable == "Total"
    )
  )

tabla_Provincia

variable	ni	hi	Grupo
Tabla Nro. 1.1
Tabla de distribución de frecuencias simples y acumuladas de Provincias del Ecuador
AZUAY	118	0.5	Costa
BOLIVAR	64	0.3	Costa
CAÃAR	81	0.4	Costa
CARCHI	59	0.3	Costa
CHIMBORAZO	69	0.3	Costa
COTOPAXI	131	0.6	Costa
EL ORO	455	2.0	Costa
ESMERALDAS	212	0.9	Costa
GUAYAS	5561	24.7	AmazonÃa
IMBABURA	211	0.9	Costa
LOJA	2027	9.0	Sierra
LOS RIOS	3373	15.0	Sierra
MANABI	4665	20.8	Sierra
MORONA SANTIAGO	2517	11.2	Sierra
NAPO	275	1.2	Costa
ORELLANA	622	2.8	Costa
PASTAZA	66	0.3	Costa
PICHINCHA	88	0.4	Costa
SANTA ELENA	390	1.7	Costa
SANTO DOMINGO DE LOS TSACHILAS	28	0.1	Costa
SUCUMBIOS	1323	5.9	Costa
TUNGURAHUA	34	0.2	Costa
ZAMORA CHINCHIPE	107	0.5	Costa
Total	22476	100.0	NA
Autor: Grupo 3

# Frecuencias relativas (%) por grupo
Grupo <- table(TDFDPA_DESPRO$Grupo)
hi_grupo <- prop.table(Grupo) * 100
df_grupos <- as.data.frame(hi_grupo)
colnames(df_grupos) <- c("zona", "porcentaje")

# Agregar columna probabilidad (decimal)
df_grupos$probabilidad <- round(df_grupos$porcentaje, 3)

df_grupos

##       zona porcentaje probabilidad
## 1 Amazonía   4.347826        4.348
## 2    Costa  78.260870       78.261
## 3   Sierra  17.391304       17.391

# Graficar porcentaje de frecuencia por zona
colores <- rev(heat.colors(nrow(df_grupos)))

barplot(df_grupos$porcentaje,
        main = "Distribución de Frecuencia de Provincias por Zona",
        xlab = "Zona",
        ylab = "Porcentaje (%)",
        names.arg = df_grupos$zona,
        col = colores,
        ylim = c(0, max(df_grupos$porcentaje) + 5),
        las = 1,
        cex.names = 1)

# Graficar probabilidad por zona (decimal)
barplot(df_grupos$probabilidad,
        main = "Distribución de Probabilidad de Provincias por Zona",
        xlab = "Zona",
        ylab = "Probabilidad",
        names.arg = df_grupos$zona,
        col = colores,
        ylim = c(0, max(df_grupos$probabilidad) + 0.05),
        las = 1,
        cex.names = 1)

#El modelo es Poisson.
# Calcular el total de focos en todo el país
total_focos <- sum(TDFDPA_DESPRO$ni, na.rm = TRUE)

# Calcular el total de focos en la Costa
total_costa <- sum(TDFDPA_DESPRO$ni[TDFDPA_DESPRO$Grupo == "Costa"], na.rm = TRUE)

# Calcular la probabilidad como porcentaje
prob_costa <- round((total_costa / total_focos) * 100, 1)
# Imprimir resultado como respuesta a la pregunta
cat("La probabilidad de que un foco de calor ocurra en la Costa es:", prob_costa, "%\n")

## La probabilidad de que un foco de calor ocurra en la Costa es: 19.3 %