#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleo y Ambiental 
###-----------------Carrera de Ingeniería Ambiental

# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadistica Descriptiva
# Integrantes: Jazmin Guañuna, Nayely Perugachi, Helen Taipe, Gabriela Usiña
# Fecha: 26/5/2025

#VARIABLE CUANTITATIVA CONTINUA:CAPACIDAD DE VERTEDERO 

#Extraer los datos
library(readr)
Waste_Management_and_Recycling_India_csv_xd <- read_delim("Waste_Management_and_Recycling_India.csv xd.csv", 
                                                          delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 850 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (5): City/District, Waste Type, Disposal Method, Landfill Name, Landfill...
## dbl (8): Waste Generated (Tons/Day), Recycling Rate (%), Population Density ...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
datos<-Waste_Management_and_Recycling_India_csv_xd

#Extraer la variable continua 
capacidad_vertedero<-datos$`Landfill Capacity (Tons)`
capacidad_vertedero<-na.omit(capacidad_vertedero)

#Valores no se presenten en notación científica
options(scipen = 999)

#Procedimiento con Sturges 

min<-min(capacidad_vertedero)
max<-max(capacidad_vertedero)
R<-max-min
k <- 1+3.3*log10(length(capacidad_vertedero))
k<-floor(k)
A <- R/k 
liminf <- seq(from=min, to=max-A, by=A)
limsup <- seq(from=min+A, to=max, by=A)
MC_sturges<-(limsup+liminf)/2
I1 <- subset(capacidad_vertedero, capacidad_vertedero>=liminf[1] & capacidad_vertedero<limsup[1])
length(I1)
## [1] 50
n <- c()

for (i in 1:k) {
  if (i==10)
    n[i] <- length(subset(capacidad_vertedero, capacidad_vertedero>=liminf[i] & capacidad_vertedero<=limsup[i]))
  else
    n[i] <- length(subset(capacidad_vertedero, capacidad_vertedero>=liminf[i] & capacidad_vertedero<limsup[i]))
}
#Frecuencia absoluta
ni<-n
sum(ni)
## [1] 850
#Frecuencia relativa
hi<-(ni/sum(ni))*100
sum(hi)
## [1] 100
#Frecuencias absolutas y relativas acumuladas
Ni_asc<-cumsum(ni)
Hi_asc<-cumsum(hi)
Ni_dsc<-rev(cumsum(rev(ni)))
Hi_dsc<-rev(cumsum(rev(hi)))

TDF_capacidadstur<-data.frame(liminf,limsup,round(MC_sturges,2),ni,round(hi,2),Ni_asc,round(Hi_asc,2),Ni_dsc,round(Hi_dsc,2))
names(TDF_capacidadstur) <- c("liminf","limsup","MC","ni","hi (%)","Ni_asc","Hi_asc (%)","Ni_dsc","Hi_dsc(%)")
TDF_capacidadstur
##     liminf  limsup      MC  ni hi (%) Ni_asc Hi_asc (%) Ni_dsc Hi_dsc(%)
## 1  22690.0 30285.6 26487.8  50   5.88     50       5.88    850    100.00
## 2  30285.6 37881.2 34083.4 100  11.76    150      17.65    800     94.12
## 3  37881.2 45476.8 41679.0  50   5.88    200      23.53    700     82.35
## 4  45476.8 53072.4 49274.6 150  17.65    350      41.18    650     76.47
## 5  53072.4 60668.0 56870.2  50   5.88    400      47.06    500     58.82
## 6  60668.0 68263.6 64465.8 175  20.59    575      67.65    450     52.94
## 7  68263.6 75859.2 72061.4 100  11.76    675      79.41    275     32.35
## 8  75859.2 83454.8 79657.0 125  14.71    800      94.12    175     20.59
## 9  83454.8 91050.4 87252.6   0   0.00    800      94.12     50      5.88
## 10 91050.4 98646.0 94848.2  50   5.88    850     100.00     50      5.88
# Crear Fila de Totales
totales <- c(
  li= "-",
  ls= "-",
  MC= "-",
  ni= sum(ni),
  hi= sum(hi),
  Ni_asc= "-",
  Ni_dsc= "-",
  Hi_asc= "-",
  Hi_dsc= "-") 
TDF_capacidadstur<- rbind(TDF_capacidadstur,totales) 
TDF_capacidadstur
##     liminf  limsup      MC  ni hi (%) Ni_asc Hi_asc (%) Ni_dsc Hi_dsc(%)
## 1    22690 30285.6 26487.8  50   5.88     50       5.88    850       100
## 2  30285.6 37881.2 34083.4 100  11.76    150      17.65    800     94.12
## 3  37881.2 45476.8   41679  50   5.88    200      23.53    700     82.35
## 4  45476.8 53072.4 49274.6 150  17.65    350      41.18    650     76.47
## 5  53072.4   60668 56870.2  50   5.88    400      47.06    500     58.82
## 6    60668 68263.6 64465.8 175  20.59    575      67.65    450     52.94
## 7  68263.6 75859.2 72061.4 100  11.76    675      79.41    275     32.35
## 8  75859.2 83454.8   79657 125  14.71    800      94.12    175     20.59
## 9  83454.8 91050.4 87252.6   0      0    800      94.12     50      5.88
## 10 91050.4   98646 94848.2  50   5.88    850        100     50      5.88
## 11       -       -       - 850    100      -          -      -         -
#HISTOGRAMA STURGES

hist(capacidad_vertedero,
     breaks = seq(min(capacidad_vertedero),max(capacidad_vertedero),A),
     main="Gráfica No.67: Distribución de Cantidad de la Capacidad de Vertederos 
     del Estudio de Residuos de la India ",
     col="skyblue3",
     xlab = "Capacidad de vertederos",
     ylab="Cantidad")

#Procedimiento con R

hist(capacidad_vertedero,col = "orange2",
     main = "Gráfica No.68:Distribución de Cantidad de la Capacidad de Vertederos 
     del Estudio de Residuos de la India",
     xlab = "Capacidad de vertederos (tons)",
     ylab = "Cantidad")

#A PARTIR DE R MODIFICAMOS LOS DATOS
breaks = seq(20000, 100000, by =10000 )

histocap<-hist(capacidad_vertedero,
               breaks = breaks,
               col = "orange2",
               main = "Gráfica No.69:Distribución de Cantidad de la Capacidad de Vertederos 
     del Estudio de Residuos de la India",
               xlab = "Capacidad de vertederos (ton)",
               ylab = "Cantidad")

#Realizamos los limites

limites <- histocap$breaks
liminf <- limites[1:8]
limsup <- limites [2:9]
MC <- histocap$mids
ni<-histocap$counts
#Total de datos
sum(ni)
## [1] 850
#Frecuencia relativa(%)
hi<-(ni/sum(ni))*100
sum(hi)
## [1] 100
#Frecuencias absolutas y relativas acumuladas

Ni_asc<-cumsum(ni)
Hi_asc<-cumsum(hi)
Ni_dsc<-rev(cumsum(rev(ni)))
Hi_dsc<-rev(cumsum(rev(hi)))

#Creamos la tabla
TDF_capacidadvertedero<-data.frame(liminf,limsup,round(MC,2),ni,round(hi,2),Ni_asc,round(Hi_asc,2),Ni_dsc,round(Hi_dsc,2))
names(TDF_capacidadvertedero) <- c("liminf","limsup","MC","ni","hi(%)","Ni_asc","Hi_asc(%)","Ni_dsc","Hi_dsc(%)")


#Creamos la fila con los totales
totales <- c(
  li= "-",
  ls= "-",
  MC= "-",
  ni= sum(ni),
  hi= sum(hi),
  Ni_asc= "-",
  Ni_dsc= "-",
  Hi_asc= "-",
  Hi_dsc= "-") 
TDF_totales<- rbind(TDF_capacidadvertedero,totales) 
TDF_totales
##   liminf limsup    MC  ni hi(%) Ni_asc Hi_asc(%) Ni_dsc Hi_dsc(%)
## 1  20000  30000 25000  50  5.88     50      5.88    850       100
## 2  30000  40000 35000 125 14.71    175     20.59    800     94.12
## 3  40000  50000 45000 125 14.71    300     35.29    675     79.41
## 4  50000  60000 55000 100 11.76    400     47.06    550     64.71
## 5  60000  70000 65000 225 26.47    625     73.53    450     52.94
## 6  70000  80000 75000  75  8.82    700     82.35    225     26.47
## 7  80000  90000 85000 100 11.76    800     94.12    150     17.65
## 8  90000 100000 95000  50  5.88    850       100     50      5.88
## 9      -      -     - 850   100      -         -      -         -
#HISTOGRAMA R LOCAL ni
hist(capacidad_vertedero,
     breaks=limites,
     main = "Gráfica No.70 :Distribución de Cantidad de la Capacidad de Vertederos 
     del Estudio de Residuos de la India",
     xlab = "Capacidad de vertederos (ton)",
     ylab = "Cantidad",
     col = "pink4")

#HISTOGRAMA R GLOBAL ni
hist(capacidad_vertedero,
     breaks=limites,
     main = "Gráfica No.71 :Distribución de Cantidad de la Capacidad de Vertederos 
     del Estudio de Residuos de la India",
     xlab = "Capacidad de vertederos (ton)",
     ylab = "Cantidad",
     col = "green3",
     ylim = c(0,850))

#HISTOGRMA R LOCAL hi

barplot(hi,space=0,
        col = "pink4",
        main ="Gráfica No.72:Distribución de Porcentaje de la Capacidad de Vertederos 
        del Estudio de Residuos de la India ",
        ylab="Porcentaje (%)",
        xlab="Capacidad de vertederos (ton)",
        names.arg=TDF_capacidadvertedero$MC )

#HISTOGRMA R GLOBAL hi 

barplot(hi,space=0,
        col = "green3",
        main ="Gráfica No.73:Distribución de Porcentaje de Capacidad de Vertederos
        del Estudio de Residuos de la India ",
        ylab="Porcentaje (%)",
        xlab="Capacidad de vertederos (ton)",
        names.arg=TDF_capacidadvertedero$MC ,
        ylim = c(0,100))

#DIAGRAMA DE CAJA
boxplot(capacidad_vertedero,
        col = "yellow2",
        main = "Gráfica No.74:Diagrama de Caja de la Cantidad de Capacidad de 
        Vertederos del Estudio de Residuos de la India ",
        xlab="Capacidad de vertederos (ton)",
        horizontal = TRUE)

#OJIVAS
#ni
plot(limsup, Ni_asc, type = "o", col = "blue", pch = 16,
     main = "Gráfica No.75:Ojivas Ascendente y Descendente de la Cantidad de 
     Capacidad de Verderos del Estudio de Residuos de la India ",
     xlab = "Capacidad vertedero (ton)",
     ylab = "Cantidad")
lines(liminf, Ni_dsc,type = "o",col = "red3", pch = 16)

#hi
plot(limsup, Hi_asc, type = "o", col = "blue", pch = 16,
     main = "Gráfica No.76 :Ojivas Ascendente y Descendente del Porcentaje de 
     Capacidad de Verderos del Estudio de Residuos de la India ",
     xlab = "Capacidad vertedero (ton)",
     ylab = "Porcentaje")
lines(liminf, Hi_dsc,type = "o",col = "red3", pch = 16)

#INDICADORES ESTADISTICOS

#---- Indicadores de Tendencia Central
# Mediana
Me <- median(capacidad_vertedero)
Me
## [1] 61038.5
# Media
X <- mean(capacidad_vertedero)
X
## [1] 58934.62
# Moda
Mo <- "[60000,70000]"
Mo  
## [1] "[60000,70000]"
#---- Indicadores de Dispersión
# Varianza
var(capacidad_vertedero)
## [1] 376888925
# Desviación estandar
sd <- sd(capacidad_vertedero)
sd
## [1] 19413.63
# Coeficiente de variación 
CV <- (sd(capacidad_vertedero)/X)*100
CV
## [1] 32.94096
#---- Indicadores de Forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)

# Coeficiente de Asimetría
As <- skewness(capacidad_vertedero)
As
## [1] 0.05328419
# Curtosis
K <- kurtosis(capacidad_vertedero)
K
## [1] -0.6060313
#Tabla de indicadores

Variable <- "Capacidad vertedero"
Rango <- "[22690,98646]"
Tabla_indicadores <- data.frame(Variable,Rango,X,Me,Mo,sd,CV,As,K)
Tabla_indicadores
##              Variable         Rango        X      Me            Mo       sd
## 1 Capacidad vertedero [22690,98646] 58934.62 61038.5 [60000,70000] 19413.63
##         CV         As          K
## 1 32.94096 0.05328419 -0.6060313