#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleo y Ambiental
###-----------------Carrera de Ingeniería Ambiental
# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadística Inferencial
# Integrantes: Jazmin Guañuna, Nayely Perugachi, Helen Taipe, Gabriela Usiña
# Fecha: 12/7/2025
#REGRESIÓN POTENCIAL #
# Cargar librerías
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readr)
# Leer los datos
datos <- read_delim("Waste_Management_and_Recycling_India.csv xd.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 850 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (5): City/District, Waste Type, Disposal Method, Landfill Name, Landfill...
## dbl (8): Waste Generated (Tons/Day), Recycling Rate (%), Population Density ...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Filtrar solo datos del año 2021
datos_2021 <- datos %>%
filter(Year == 2021)
# Calcular promedios por ciudad: residuos y costo
promedios_ciudad <- datos_2021 %>%
group_by(`City/District`) %>%
summarise(
x = mean(`Waste Generated (Tons/Day)`, na.rm = TRUE),
y = mean(`Cost of Waste Management (₹/Ton)`, na.rm = TRUE)
)
# Verificar primeras filas
head(promedios_ciudad)
## # A tibble: 6 × 3
## `City/District` x y
## <chr> <dbl> <dbl>
## 1 Agra 7467. 3014
## 2 Ahmedabad 5896. 3965.
## 3 Allahabad 5048. 2348
## 4 Amritsar 7034. 2219.
## 5 Bengaluru 4094. 3159.
## 6 Bhopal 5155. 3645
# Gráfico de dispersión
plot(promedios_ciudad$x, promedios_ciudad$y,
main = "Gráfica No.122 :Diagrama de Dispersión entre Costo de Gestión
y Residuos Generados en el 2021",
xlab = "Residuos generados (Tons/Día)",
ylab = "Costo de gestión (rupia/Ton)",
pch = 19, col = "blue")

# Filtrar para x ≥ 7000
subset_intervalo <- promedios_ciudad %>%
filter(x >= 7000)
# 1.Identificar las dos variables de manera lógica
promresiduos<-subset_intervalo$x
promcosto<-subset_intervalo$y
# 2.Definir la variable dependiente e independiente
x<-promresiduos
y<-promcosto
# 3.Diagrama de dispersión o pares de puntos
plot(x, y,
main = "Gráfica No.123:Dispersión de pares de puntos en el Intervalo
Definido entre del Costo de Gestión y Residuos Generados",
xlab = "Residuos generados (Tons/Día)",
ylab = "Costo de gestión (rupia/Ton)",
pch = 19, col = "blue")

# 4. Conjetura
#Potencial
# 5.Sobreponer la curva y cálculo de los parámetros
# y=ax^b
#### Linealización ####
# lny=lna+blnx
# y1=BO+B1x1
# b=B1
# a=e^BO
x1<-log(x)
y1<-log(y)
regresionpotencial<-lm(y1~x1,data = subset_intervalo)
regresionpotencial
##
## Call:
## lm(formula = y1 ~ x1, data = subset_intervalo)
##
## Coefficients:
## (Intercept) x1
## -33.329 4.637
#Parámetros a y b
beta0<-regresionpotencial$coefficients[1]
beta1<-regresionpotencial$coefficients[2]
b<-beta1
b
## x1
## 4.63672
a<-exp(beta0)
a
## (Intercept)
## 3.351383e-15
# y=3.35*10^(-15)x^4.63
plot(x, y,
main = "Gráfica No.124:Modelo y Realidad en el Intervalo Definido
entre Costo de Gestión y Residuos Generados",
xlab = "Residuos generados (Tons/Día)",
ylab = "Costo de gestión (₹/Ton)",
pch = 19, col = "blue", ylim =c(1500,4000), xlim =c(6600,7500))
curve(a * x^b, add = TRUE, col = "red", lwd = 2)

# 6. Realizar el Test de bondad
#TEST
r<-cor(x1,y1)
r
## [1] 0.8349235
# 7.Predicción
#¿Cuál será el costo de gestión de residuos (en rupias por tonelada) si una
#ciudad genera en promedio 7200 toneladas de residuos al día en el año 2021?
# y=3.35*10^(-15)x^4.63
a<- 0.000000000000003351383
b<- 4.63672
x7200 <- 7200
prediccion7200 <- a * x7200^b
prediccion7200
## [1] 2573.919
#Conclusiones
# En el intervalo entre el costo de gestión y los residuos generados del
# Estudio de residuos de la India existe una relacion de tipo potencial
# representado por:
# y=3.35*10^(-15)x^4.63
#Siendo x los residuos generados en (ton/dia) , y el costo de
# gestión en (rupia/Ton),no existen restricciones en el intervalo seleccionado.