#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleos y Ambiental
###-----------------Carrera de Ingeniería Ambiental
# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadistica Inferencial
# Nombre: Helen Taipe
# Fecha: 20/07/2025
# install.packages("rio")
library(rio)
bd<- datos <- read.csv2("Waste_Management_and_Recycling_India.csv xd.csv",
sep = ";",
dec = ",",
stringsAsFactors = FALSE)
names(bd) <- c(
"Ciudad",
"Tipo_Residuo",
"Residuos_Generados_TonDia",
"Tasa_Reciclaje_Porc",
"Densidad_Poblacional",
"Eficiencia_Municipal",
"Metodo_Disposicion",
"Costo_Gestion_Residuos",
"Campanas_Concientizacion",
"Nombre_Relleno",
"Ubicacion_Relleno",
"Capacidad_Relleno_Ton",
"Anio"
)
library(naniar)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyr)
bd <- bd %>%
separate(Ubicacion_Relleno, into = c("Latitud", "Longitud"), sep = ",", remove = FALSE) %>%
mutate(
Latitud = as.numeric(trimws(Latitud)),
Longitud = as.numeric(trimws(Longitud))
)
# ESTADÍSTICA INFERENCIAL - MODELO LOG-NORMAL (Costo Gestión Residuos)
# 1. Selección de variable continua
x <- bd$Costo_Gestion_Residuos
# 2. Histograma y Diagrama de Caja
hist(x, main = "Gráfica No.4: Distribución de Frecuencias del Costo de Gestión
en el Estudio de Residuos y Reciclaje en India",
xlab = "₹/Ton",
col = "lightblue",
breaks = 10)

boxplot(x, main = "Gráfica No.5: Diagrama de Caja", ylab = "Costo", col = "orange")

# 3 - 4 Conjetura de Modelo Probabilístico Log-Normal
x_log <- log(x)
# Cálculo de parámetros logarítmicos
media_ln <- mean(x_log, na.rm = TRUE)
desv_ln <- sd(x_log, na.rm = TRUE)
cat("Media log:", round(media_ln, 2), "\n")
## Media log: 7.79
cat("Desviación estándar log:", round(desv_ln, 2), "\n")
## Desviación estándar log: 0.58
# Histograma con curva log-normal
hist(x, prob = TRUE, breaks = 10, col = "lightblue",ylim = c(0,0.000501),
main = "Gráfica No.6: Modelo de Probabilidad y Curva Log-Normal",
xlab = "Costo de Gestión (₹/Ton)")
curve(dlnorm(x, meanlog = media_ln, sdlog = desv_ln), col = "red", lwd = 2, add = TRUE)

# 5. Test de bondad de ajuste (Chi-Cuadrado para log-normal)
hlongitud <- hist(x, breaks = 9, plot = FALSE)
Fo <- hlongitud$counts
liminf <- hlongitud$breaks[1:9]
limsup <- hlongitud$breaks[2:10]
P <- c()
for (i in 1:length(Fo)) {
P[i] <- plnorm(limsup[i], meanlog = media_ln, sdlog = desv_ln) -
plnorm(liminf[i], meanlog = media_ln, sdlog = desv_ln)
}
Fe <- P * length(x)
# Eliminar clases con frecuencia esperada 0
valid <- Fe > 0
Fo_valid <- Fo[valid]
Fe_valid <- Fe[valid]
X2 <- sum((Fo_valid - Fe_valid)^2 / Fe_valid)
VC <- qchisq(0.95, df = length(Fo_valid) - 1 - 2) # gl = clases válidas - 1 - 2 parámetros
cat("X² =", round(X2, 2), "| Valor Crítico =", round(VC, 2), "\n")
## X² = 286 | Valor Crítico = 12.59
cat("¿Se rechaza H0?", X2 > VC, "\n")
## ¿Se rechaza H0? TRUE
# 6. Cálculo de probabilidades: ¿P[X > 3000 ₹/Ton]?
p_mayor <- 1 - plnorm(3000, meanlog = media_ln, sdlog = desv_ln)
cat("P[X > 3000] =", round(p_mayor, 4), "\n")
## P[X > 3000] = 0.3536
# 7. Estimación puntual
cat("Media log:", round(media_ln, 2), "\n")
## Media log: 7.79
cat("Desv. log:", round(desv_ln, 2), "\n")
## Desv. log: 0.58
# 8. Intervalo de Confianza para la media logarítmica
n <- length(na.omit(x))
error_est <- qt(0.975, df = n - 1) * desv_ln / sqrt(n)
li <- media_ln - error_est
ls <- media_ln + error_est
cat("IC 95% para media log:", round(li, 2), "a", round(ls, 2), "\n")
## IC 95% para media log: 7.75 a 7.83
### Conclusiones ###
# El comportamiento de la variable continua Costos de gestion de residuos se modeliza a través
# de un modelo log-normal con parámetros:
# - Media logarítmica (μ) = 7.79
# - Desviación estándar logarítmica (σ) = 0.58
#
# Podemos afirmar que la media aritmética poblacional log-transformada se encuentra entre
# [7.75, 7.83] con un 95% de confianza, y con una desviación estándar igual a 0.58.
#
# La prueba de bondad de ajuste (Chi-cuadrado) arrojó un estadístico X² = 286, que supera
# el valor crítico de 12.59 para un nivel de significancia del 5%, por lo que se rechaza la
# hipótesis nula de ajuste a la distribución log-normal.
#
# Sin embargo, el modelo puede seguir utilizándose como una aproximación razonable para
# analizar el comportamiento general de los costos de gestión de residuos .