#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleo y Ambiental 
###-----------------Carrera de Ingeniería Ambiental

# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadística Inferencial
# Integrantes: Jazmin Guañuna, Nayely Perugachi, Helen Taipe, Gabriela Usiña
# Fecha: 12/7/2025

#REGRESIÓN POTENCIAL #
# Cargar librerías
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)

# Leer los datos
datos <- read_delim("Waste_Management_and_Recycling_India.csv xd.csv", 
                    delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 850 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (5): City/District, Waste Type, Disposal Method, Landfill Name, Landfill...
## dbl (8): Waste Generated (Tons/Day), Recycling Rate (%), Population Density ...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Filtrar solo datos del año 2021
datos_2021 <- datos %>% 
  filter(Year == 2021)

# Calcular promedios por ciudad: residuos y costo
promedios_ciudad <- datos_2021 %>%
  group_by(`City/District`) %>%
  summarise(
    x = mean(`Waste Generated (Tons/Day)`, na.rm = TRUE),
    y = mean(`Cost of Waste Management (₹/Ton)`, na.rm = TRUE)
  )

# Verificar primeras filas
head(promedios_ciudad)
## # A tibble: 6 × 3
##   `City/District`     x     y
##   <chr>           <dbl> <dbl>
## 1 Agra            7467. 3014 
## 2 Ahmedabad       5896. 3965.
## 3 Allahabad       5048. 2348 
## 4 Amritsar        7034. 2219.
## 5 Bengaluru       4094. 3159.
## 6 Bhopal          5155. 3645
# Gráfico de dispersión
plot(promedios_ciudad$x, promedios_ciudad$y,
     main = "Gráfica No.122 :Diagrama de Dispersión entre Costo de Gestión 
   y Residuos Generados en el  2021",
     xlab = "Residuos generados (Tons/Día)",
     ylab = "Costo de gestión (rupia/Ton)",
     pch = 19, col = "blue")

# Filtrar para x ≥ 7000
subset_intervalo <- promedios_ciudad %>%
  filter(x >= 7000)

# 1.Identificar las dos variables de manera lógica

promresiduos<-subset_intervalo$x
promcosto<-subset_intervalo$y

# 2.Definir la variable dependiente e independiente

x<-promresiduos
y<-promcosto

# 3.Diagrama de dispersión o pares de puntos

plot(x, y,
     main = "Gráfica No.123:Dispersión de pares de puntos en el Intervalo 
  Definido entre del Costo de Gestión y Residuos Generados",
     xlab = "Residuos generados (Tons/Día)",
     ylab = "Costo de gestión (rupia/Ton)",
     pch = 19, col = "blue")

# 4. Conjetura
#Potencial

# 5.Sobreponer la curva y cálculo de los parámetros

# y=ax^b
#### Linealización ####
# lny=lna+blnx
# y1=BO+B1x1
# b=B1
# a=e^BO

x1<-log(x)
y1<-log(y)
regresionpotencial<-lm(y1~x1,data = subset_intervalo)
regresionpotencial
## 
## Call:
## lm(formula = y1 ~ x1, data = subset_intervalo)
## 
## Coefficients:
## (Intercept)           x1  
##     -33.329        4.637
#Parámetros a y b 
beta0<-regresionpotencial$coefficients[1]
beta1<-regresionpotencial$coefficients[2]
b<-beta1
b
##      x1 
## 4.63672
a<-exp(beta0)
a
##  (Intercept) 
## 3.351383e-15
# y=3.35*10^(-15)x^4.63

plot(x, y,
     main = "Gráfica No.124:Modelo y Realidad en el Intervalo Definido 
     entre Costo de Gestión y Residuos Generados",
     xlab = "Residuos generados (Tons/Día)",
     ylab = "Costo de gestión (₹/Ton)",
     pch = 19, col = "blue", ylim =c(1500,4000), xlim =c(6600,7500))
curve(a * x^b, add = TRUE, col = "red", lwd = 2)

# 6. Realizar el Test de bondad
#TEST
r<-cor(x1,y1)
r
## [1] 0.8349235
# 7.Predicción
#¿Cuál será el costo de gestión de residuos (en rupias por tonelada) si una 
#ciudad genera en promedio 7200 toneladas de residuos al día en el año 2021?

# y=3.35*10^(-15)x^4.63
a<- 0.000000000000003351383 
b<- 4.63672 
x7200 <- 7200
prediccion7200 <- a * x7200^b
prediccion7200
## [1] 2573.919
#Conclusiones

# En el intervalo entre el costo de gestión  y los residuos generados del 
# Estudio de residuos de la India existe una relacion de tipo potencial
# representado por:
# y=3.35*10^(-15)x^4.63 

#Siendo x los residuos generados en (ton/dia) , y el costo de 
# gestión en (rupia/Ton),no existen restricciones en el intervalo seleccionado.