##-----Facultad de Ingeniería en Geología, Minas, Petróleos y Ambiental
###-----------------Carrera de Ingeniería Ambiental
# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadística Multivariable
# Fecha: 22/07/2025
# Cargar datos
datos <- read.csv2("Waste_Management_and_Recycling_India.csv xd.csv",
sep = ";", dec = ",", stringsAsFactors = FALSE)
# Variables
densidad <- as.numeric(gsub(",", ".", datos$Population.Density..People.km..))
capacidad <- as.numeric(gsub(",", ".", datos$Landfill.Capacity..Tons.))
# Tabla y limpieza
tabla_log2 <- data.frame(x = densidad, y = capacidad)
tabla_log2 <- tabla_log2[!is.na(tabla_log2$x) & !is.na(tabla_log2$y) & tabla_log2$x > 0 & tabla_log2$y > 0, ]
# Regresión logarítmica: y = a + b * ln(x)
x1 <- log(tabla_log2$x)
modelo_log2 <- lm(tabla_log2$y ~ x1)
# Coeficientes
a <- modelo_log2$coefficients[1]
b <- modelo_log2$coefficients[2]
# Correlación y R²
r <- cor(x1, tabla_log2$y)
r2 <- (r^2) * 100
# Mostrar ecuación
cat("Ecuación del modelo:\n")
## Ecuación del modelo:
cat(paste("y = ", round(a, 2), " + ", round(b, 2), " * ln(x)\n"))
## y = 130613.93 + -7674.05 * ln(x)
# Gráfico
plot(tabla_log2$x, tabla_log2$y,
col = "deepskyblue", pch = 16,
main = "Modelo Logarítmico: Densidad vs Capacidad de Vertedero",
xlab = "Densidad poblacional (hab/km²)",
ylab = "Capacidad del vertedero (Ton)")
curve(a + b * log(x), from = min(tabla_log2$x), to = max(tabla_log2$x),
add = TRUE, col = "red", lwd = 2)

# Restricciones
restric_x <- range(tabla_log2$x)
cat(paste("Restricciones: x > 0 ; x ∈ [", round(restric_x[1], 0), ",", round(restric_x[2], 0), "]\n"))
## Restricciones: x > 0 ; x ∈ [ 2335 , 24032 ]
# Estimar y para x0
x0 <- 3000 # densidad
y0 <- a + b * log(x0)
# Mostrar estimación como gráfico
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")
text(x = 1, y = 1,
labels = paste("¿Cuál es la capacidad estimada del vertedero",
"\ncuando la densidad poblacional es de 3,000 hab/km²?",
"\n\nR ≈", round(y0, 0), " toneladas"),
cex = 2.2, col = "blue", font = 6)

# Tabla resumen
Tabla_resumen <- data.frame(
Variables = "Densidad poblacional vs Capacidad del vertedero",
Modelo = paste0("y = ", round(a, 2), " + ", round(b, 2), "*ln(x)"),
Restricciones = paste0("x > 0 ; x ∈ [", round(restric_x[1], 0), ", ", round(restric_x[2], 0), "]"),
Coef_Pearson = paste0("r = ", round(r, 4)),
Coef_Determinacion = paste0("R² = ", round(r2, 2), "%"),
Estimacion = paste0("y ≈ ", round(y0, 0), " toneladas cuando x = ", x0)
)
print(Tabla_resumen)
## Variables
## 1 Densidad poblacional vs Capacidad del vertedero
## Modelo Restricciones Coef_Pearson
## 1 y = 130613.93 + -7674.05*ln(x) x > 0 ; x ∈ [2335, 24032] r = -0.2552
## Coef_Determinacion Estimacion
## 1 R² = 6.51% y ≈ 69173 toneladas cuando x = 3000