#------------------ UNIVERSIDAD CENTRAL DEL ECUADOR
##-----Facultad de Ingeniería en Geología, Minas, Petróleo y Ambiental
###-----------------Carrera de Ingeniería Ambiental
# Proyecto: Estudio de Residuos y Reciclaje en la India
# Etapa: Estadistica Descriptiva
# Integrantes: Jazmin Guañuna, Nayely Perugachi, Helen Taipe, Gabriela Usiña
# Fecha: 26/5/2025
#VARIABLE CUANTITATIVA CONTINUA:CAPACIDAD DE VERTEDERO
#Extraer los datos
library(readr)
Waste_Management_and_Recycling_India_csv_xd <- read_delim("Waste_Management_and_Recycling_India.csv xd.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 850 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (5): City/District, Waste Type, Disposal Method, Landfill Name, Landfill...
## dbl (8): Waste Generated (Tons/Day), Recycling Rate (%), Population Density ...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
datos<-Waste_Management_and_Recycling_India_csv_xd
#Extraer la variable continua
capacidad_vertedero<-datos$`Landfill Capacity (Tons)`
capacidad_vertedero<-na.omit(capacidad_vertedero)
#Valores no se presenten en notación científica
options(scipen = 999)
#Procedimiento con Sturges
min<-min(capacidad_vertedero)
max<-max(capacidad_vertedero)
R<-max-min
k <- 1+3.3*log10(length(capacidad_vertedero))
k<-floor(k)
A <- R/k
liminf <- seq(from=min, to=max-A, by=A)
limsup <- seq(from=min+A, to=max, by=A)
MC_sturges<-(limsup+liminf)/2
I1 <- subset(capacidad_vertedero, capacidad_vertedero>=liminf[1] & capacidad_vertedero<limsup[1])
length(I1)
## [1] 50
n <- c()
for (i in 1:k) {
if (i==10)
n[i] <- length(subset(capacidad_vertedero, capacidad_vertedero>=liminf[i] & capacidad_vertedero<=limsup[i]))
else
n[i] <- length(subset(capacidad_vertedero, capacidad_vertedero>=liminf[i] & capacidad_vertedero<limsup[i]))
}
#Frecuencia absoluta
ni<-n
sum(ni)
## [1] 850
#Frecuencia relativa
hi<-(ni/sum(ni))*100
sum(hi)
## [1] 100
#Frecuencias absolutas y relativas acumuladas
Ni_asc<-cumsum(ni)
Hi_asc<-cumsum(hi)
Ni_dsc<-rev(cumsum(rev(ni)))
Hi_dsc<-rev(cumsum(rev(hi)))
TDF_capacidadstur<-data.frame(liminf,limsup,round(MC_sturges,2),ni,round(hi,2),Ni_asc,round(Hi_asc,2),Ni_dsc,round(Hi_dsc,2))
names(TDF_capacidadstur) <- c("liminf","limsup","MC","ni","hi (%)","Ni_asc","Hi_asc (%)","Ni_dsc","Hi_dsc(%)")
TDF_capacidadstur
## liminf limsup MC ni hi (%) Ni_asc Hi_asc (%) Ni_dsc Hi_dsc(%)
## 1 22690.0 30285.6 26487.8 50 5.88 50 5.88 850 100.00
## 2 30285.6 37881.2 34083.4 100 11.76 150 17.65 800 94.12
## 3 37881.2 45476.8 41679.0 50 5.88 200 23.53 700 82.35
## 4 45476.8 53072.4 49274.6 150 17.65 350 41.18 650 76.47
## 5 53072.4 60668.0 56870.2 50 5.88 400 47.06 500 58.82
## 6 60668.0 68263.6 64465.8 175 20.59 575 67.65 450 52.94
## 7 68263.6 75859.2 72061.4 100 11.76 675 79.41 275 32.35
## 8 75859.2 83454.8 79657.0 125 14.71 800 94.12 175 20.59
## 9 83454.8 91050.4 87252.6 0 0.00 800 94.12 50 5.88
## 10 91050.4 98646.0 94848.2 50 5.88 850 100.00 50 5.88
# Crear Fila de Totales
totales <- c(
li= "-",
ls= "-",
MC= "-",
ni= sum(ni),
hi= sum(hi),
Ni_asc= "-",
Ni_dsc= "-",
Hi_asc= "-",
Hi_dsc= "-")
TDF_capacidadstur<- rbind(TDF_capacidadstur,totales)
TDF_capacidadstur
## liminf limsup MC ni hi (%) Ni_asc Hi_asc (%) Ni_dsc Hi_dsc(%)
## 1 22690 30285.6 26487.8 50 5.88 50 5.88 850 100
## 2 30285.6 37881.2 34083.4 100 11.76 150 17.65 800 94.12
## 3 37881.2 45476.8 41679 50 5.88 200 23.53 700 82.35
## 4 45476.8 53072.4 49274.6 150 17.65 350 41.18 650 76.47
## 5 53072.4 60668 56870.2 50 5.88 400 47.06 500 58.82
## 6 60668 68263.6 64465.8 175 20.59 575 67.65 450 52.94
## 7 68263.6 75859.2 72061.4 100 11.76 675 79.41 275 32.35
## 8 75859.2 83454.8 79657 125 14.71 800 94.12 175 20.59
## 9 83454.8 91050.4 87252.6 0 0 800 94.12 50 5.88
## 10 91050.4 98646 94848.2 50 5.88 850 100 50 5.88
## 11 - - - 850 100 - - - -
#HISTOGRAMA STURGES
hist(capacidad_vertedero,
breaks = seq(min(capacidad_vertedero),max(capacidad_vertedero),A),
main="Gráfica No.67: Distribución de Cantidad de la Capacidad de Vertederos
del Estudio de Residuos de la India ",
col="skyblue3",
xlab = "Capacidad de vertederos",
ylab="Cantidad")

#Procedimiento con R
hist(capacidad_vertedero,col = "orange2",
main = "Gráfica No.68:Distribución de Cantidad de la Capacidad de Vertederos
del Estudio de Residuos de la India",
xlab = "Capacidad de vertederos (tons)",
ylab = "Cantidad")

#A PARTIR DE R MODIFICAMOS LOS DATOS
breaks = seq(20000, 100000, by =10000 )
histocap<-hist(capacidad_vertedero,
breaks = breaks,
col = "orange2",
main = "Gráfica No.69:Distribución de Cantidad de la Capacidad de Vertederos
del Estudio de Residuos de la India",
xlab = "Capacidad de vertederos (ton)",
ylab = "Cantidad")

#Realizamos los limites
limites <- histocap$breaks
liminf <- limites[1:8]
limsup <- limites [2:9]
MC <- histocap$mids
ni<-histocap$counts
#Total de datos
sum(ni)
## [1] 850
#Frecuencia relativa(%)
hi<-(ni/sum(ni))*100
sum(hi)
## [1] 100
#Frecuencias absolutas y relativas acumuladas
Ni_asc<-cumsum(ni)
Hi_asc<-cumsum(hi)
Ni_dsc<-rev(cumsum(rev(ni)))
Hi_dsc<-rev(cumsum(rev(hi)))
#Creamos la tabla
TDF_capacidadvertedero<-data.frame(liminf,limsup,round(MC,2),ni,round(hi,2),Ni_asc,round(Hi_asc,2),Ni_dsc,round(Hi_dsc,2))
names(TDF_capacidadvertedero) <- c("liminf","limsup","MC","ni","hi(%)","Ni_asc","Hi_asc(%)","Ni_dsc","Hi_dsc(%)")
#Creamos la fila con los totales
totales <- c(
li= "-",
ls= "-",
MC= "-",
ni= sum(ni),
hi= sum(hi),
Ni_asc= "-",
Ni_dsc= "-",
Hi_asc= "-",
Hi_dsc= "-")
TDF_totales<- rbind(TDF_capacidadvertedero,totales)
TDF_totales
## liminf limsup MC ni hi(%) Ni_asc Hi_asc(%) Ni_dsc Hi_dsc(%)
## 1 20000 30000 25000 50 5.88 50 5.88 850 100
## 2 30000 40000 35000 125 14.71 175 20.59 800 94.12
## 3 40000 50000 45000 125 14.71 300 35.29 675 79.41
## 4 50000 60000 55000 100 11.76 400 47.06 550 64.71
## 5 60000 70000 65000 225 26.47 625 73.53 450 52.94
## 6 70000 80000 75000 75 8.82 700 82.35 225 26.47
## 7 80000 90000 85000 100 11.76 800 94.12 150 17.65
## 8 90000 100000 95000 50 5.88 850 100 50 5.88
## 9 - - - 850 100 - - - -
#HISTOGRAMA R LOCAL ni
hist(capacidad_vertedero,
breaks=limites,
main = "Gráfica No.70 :Distribución de Cantidad de la Capacidad de Vertederos
del Estudio de Residuos de la India",
xlab = "Capacidad de vertederos (ton)",
ylab = "Cantidad",
col = "pink4")

#HISTOGRAMA R GLOBAL ni
hist(capacidad_vertedero,
breaks=limites,
main = "Gráfica No.71 :Distribución de Cantidad de la Capacidad de Vertederos
del Estudio de Residuos de la India",
xlab = "Capacidad de vertederos (ton)",
ylab = "Cantidad",
col = "green3",
ylim = c(0,850))

#HISTOGRMA R LOCAL hi
barplot(hi,space=0,
col = "pink4",
main ="Gráfica No.72:Distribución de Porcentaje de la Capacidad de Vertederos
del Estudio de Residuos de la India ",
ylab="Porcentaje (%)",
xlab="Capacidad de vertederos (ton)",
names.arg=TDF_capacidadvertedero$MC )

#HISTOGRMA R GLOBAL hi
barplot(hi,space=0,
col = "green3",
main ="Gráfica No.73:Distribución de Porcentaje de Capacidad de Vertederos
del Estudio de Residuos de la India ",
ylab="Porcentaje (%)",
xlab="Capacidad de vertederos (ton)",
names.arg=TDF_capacidadvertedero$MC ,
ylim = c(0,100))

#DIAGRAMA DE CAJA
boxplot(capacidad_vertedero,
col = "yellow2",
main = "Gráfica No.74:Diagrama de Caja de la Cantidad de Capacidad de
Vertederos del Estudio de Residuos de la India ",
xlab="Capacidad de vertederos (ton)",
horizontal = TRUE)

#OJIVAS
#ni
plot(limsup, Ni_asc, type = "o", col = "blue", pch = 16,
main = "Gráfica No.75:Ojivas Ascendente y Descendente de la Cantidad de
Capacidad de Verderos del Estudio de Residuos de la India ",
xlab = "Capacidad vertedero (ton)",
ylab = "Cantidad")
lines(liminf, Ni_dsc,type = "o",col = "red3", pch = 16)

#hi
plot(limsup, Hi_asc, type = "o", col = "blue", pch = 16,
main = "Gráfica No.76 :Ojivas Ascendente y Descendente del Porcentaje de
Capacidad de Verderos del Estudio de Residuos de la India ",
xlab = "Capacidad vertedero (ton)",
ylab = "Porcentaje")
lines(liminf, Hi_dsc,type = "o",col = "red3", pch = 16)

#INDICADORES ESTADISTICOS
#---- Indicadores de Tendencia Central
# Mediana
Me <- median(capacidad_vertedero)
Me
## [1] 61038.5
# Media
X <- mean(capacidad_vertedero)
X
## [1] 58934.62
# Moda
Mo <- "[60000,70000]"
Mo
## [1] "[60000,70000]"
#---- Indicadores de Dispersión
# Varianza
var(capacidad_vertedero)
## [1] 376888925
# Desviación estandar
sd <- sd(capacidad_vertedero)
sd
## [1] 19413.63
# Coeficiente de variación
CV <- (sd(capacidad_vertedero)/X)*100
CV
## [1] 32.94096
#---- Indicadores de Forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)
# Coeficiente de Asimetría
As <- skewness(capacidad_vertedero)
As
## [1] 0.05328419
# Curtosis
K <- kurtosis(capacidad_vertedero)
K
## [1] -0.6060313
#Tabla de indicadores
Variable <- "Capacidad vertedero"
Rango <- "[22690,98646]"
Tabla_indicadores <- data.frame(Variable,Rango,X,Me,Mo,sd,CV,As,K)
Tabla_indicadores
## Variable Rango X Me Mo sd
## 1 Capacidad vertedero [22690,98646] 58934.62 61038.5 [60000,70000] 19413.63
## CV As K
## 1 32.94096 0.05328419 -0.6060313