#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleos y Ambiental 
###-----------------Carrera de Ingeniería Ambiental

# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadistica Inferencial
# Nombre: Helen Taipe
# Fecha: 20/07/2025
library(rio)
bd <- import("Waste_Management_and_Recycling_India.csv xd.csv")
names(bd) <- c(
  "Ciudad",
  "Tipo_Residuo",
  "Residuos_Generados_TonDia",
  "Tasa_Reciclaje_Porc",
  "Densidad_Poblacional",
  "Eficiencia_Municipal",
  "Metodo_Disposicion",
  "Costo_Gestion_Residuos",
  "Campanas_Concientizacion",
  "Nombre_Relleno",
  "Ubicacion_Relleno",
  "Capacidad_Relleno_Ton",
  "Anio"
)

library(naniar)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)
bd <- bd %>%
  separate(Ubicacion_Relleno, into = c("Latitud", "Longitud"), sep = ",", remove = FALSE) %>%
  mutate(
    Latitud = as.numeric(trimws(Latitud)),
    Longitud = as.numeric(trimws(Longitud))
  )
# --- DISTRIBUCIÓN BETA: Tasa de Reciclaje ---
x <- bd$Tasa_Reciclaje_Porc
x <- x[!is.na(x)]
x_beta <- x / 100  # Transformar a proporción

# Verificar que esté entre 0 y 1
summary(x_beta)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3000  0.4300  0.5600  0.5708  0.7100  0.8500
# Estimación de parámetros α y β por método de momentos
media <- mean(x_beta)
varianza <- var(x_beta)

alpha <- media * ((media * (1 - media)) / varianza - 1)
beta <- (1 - media) * ((media * (1 - media)) / varianza - 1)

cat("Parámetros estimados:\n")
## Parámetros estimados:
cat("Alpha =", round(alpha, 4), "\n")
## Alpha = 4.8038
cat("Beta  =", round(beta, 4), "\n")
## Beta  = 3.6126
# Histograma con curva beta
hist(x_beta, prob = TRUE, col = "lightblue", breaks = 10,
     main = "Gráfica No.8 : Distribución de Frecuencias Observadas: Tasa de Reciclaje
        en el Estudio de residuos y reciclaje en India",
     xlab = "Tasa de Reciclaje  (proporción)")

curve(dbeta(x, shape1 = alpha, shape2 = beta), from = 0, to = 1,
      add = TRUE, col = "red", lwd = 2)

# Simulación para bondad de ajuste (opcional)
# No se aplica test chi-cuadrado directo, pero se puede usar ajuste gráfico

### Conclusiones ###
# El comportamiento de la variable continua Tasa_Reciclaje_Porc se modeliza a través
# de un modelo beta con parámetros:
#   - Alpha ≈ [escribe alpha]
#   - Beta  ≈ [escribe beta]
#
# Luego de transformar la tasa a proporción (dividir entre 100), se observa que los datos 
# se ajustan razonablemente bien a la distribución beta. El ajuste se verifica mediante la
# comparación visual entre el histograma de datos y la curva teórica.