library(readxl)
Capitulo_III <- read_excel("D:/000_Doc_UDES/000_Doc_UDES/Clases/Metodos_estadisticos/Clase_2/Guia_2/r_DANE/Capitulo_III.xlsx")
View(Capitulo_III)
attach(Capitulo_III)

Tratamiento de microdatos COLOMBIA - Encuesta Ambiental Industrial - EAI - 2019

Se trabajaron los datos del capitulo III el cual contiene 2991 observaciones con 95 variables. Rows: 2991 Columns: 95

Regiones geográficas

La encuesta fue realizada con cobertura nacional, siendo desgregada en 6 regiones geográficas:

  • Caribe
  • Oriental
  • Central
  • Pacífica
  • Bogotá
  • Amazonía y Orinoquía

La información ase obtuvo mediante un muestreo probabilístico con una estratificación triple: probabilístico porque cada establecimiento tiene una probabilidad mayor a cero de ser seleccionado y estratificado triple porque se hace una partición del universo, por regiones en primer lugar, seguido por divisiones industriales y por último por el algoritmo de Hidroglou.

Se estratificó con las siguientes variables:

  • Región
  • Principal actividad económica
  • Tamaño del establecimiento

Capitulo III, Actividades económicas

El capitulo III (Generación de residuos sólidos industriales) recolecta información respecto a la cantidad generada de este tipo de residuos y el destino que se da a cada uno de ellos.

Las opciones son: aprovechamiento por el establecimiento (reutilizado, reciclado, otro), método usado para reciclar el material (mecánico y/o químico), residuos vendidos, el valor de venta y a quién fueron vendidos, los residuos donados y a quien fueron donados, los residuos almacenados, en destinación final por un tercero y en destinación final por el establecimiento, la fuente podía escoger una o varias de las alternativas.

Con la información disponible se decide analizar algunas de las variables, en primera medida se presentan las variables de actividades en el estudio, las cuáles son 9:

  1. Alimentos, bebidas y tabaco.

  2. Coquización, fabricación de productos de la refinación del petróleo y combustible nuclear.

  3. Fabricación de productos de caucho y plástico.

  4. Fabricación de productos y sustancias químicas.

  5. Inductría de la madera y el corcho, fabricación de papel y actividades de edicción e impresión.

  6. Industría de productos minerales no metálicos

  7. Metalurgia y fabricación de productos no metálicos.

  8. Textiles, confección, calzado y pieles.

  9. Otras divisiones industriales.

summary(CODIGO_ACTIVIDAD)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   3.000   5.000   5.009   8.000   9.000       5

En la variable código de actividad se encontraron 5 datos NA’s, por lo tanto la muestra se ajusta a 2986 observaciones.

Estadística básica para las actividades

library(modeest)
library(raster)
library(moments)
SubCapitulo_III=subset(Capitulo_III,Capitulo_III$CODIGO_ACTIVIDAD<10)
attach(SubCapitulo_III)
mean(SubCapitulo_III$CODIGO_ACTIVIDAD)
## [1] 5.009042
median(SubCapitulo_III$CODIGO_ACTIVIDAD)
## [1] 5
skewness(CODIGO_ACTIVIDAD)
## [1] -0.06762502
sd(CODIGO_ACTIVIDAD)
## [1] 2.865304
kurtosis(CODIGO_ACTIVIDAD)
## [1] 1.624516
quantile(CODIGO_ACTIVIDAD)
##   0%  25%  50%  75% 100% 
##    1    3    5    8    9
coef_var <- function(CODIGO_ACTIVIDAD, na.rm = FALSE) {
  (sd(CODIGO_ACTIVIDAD, na.rm=na.rm) / mean(CODIGO_ACTIVIDAD, na.rm=na.rm))*100
}
coef_var(CODIGO_ACTIVIDAD, na.rm=T)
## [1] 57.20264
mfv(CODIGO_ACTIVIDAD)
## [1] 1

De acuerdo a los resultados, las actividades de las empresas presentan una media y mediana de 5 dando indicios de simetría, sin embargo se obtuvo un valor de asimetría de Pearson negativo pero muy cercano a cero. El valor obtenido para la curtosis es mayor a cero por lo tanto se trata de una distribución leptocurtica.

Distribución de frecuencia

library(fdth)
dist1 <- fdt(CODIGO_ACTIVIDAD,k=9) 
dist1
##  Class limits   f   rf rf(%)   cf  cf(%)
##   [0.99,1.89) 638 0.21 21.37  638  21.37
##   [1.89,2.79)  88 0.03  2.95  726  24.31
##   [2.79,3.69) 283 0.09  9.48 1009  33.79
##   [3.69,4.59) 340 0.11 11.39 1349  45.18
##   [4.59,5.49) 293 0.10  9.81 1642  54.99
##   [5.49,6.39) 228 0.08  7.64 1870  62.63
##   [6.39,7.29) 276 0.09  9.24 2146  71.87
##   [7.29,8.19) 391 0.13 13.09 2537  84.96
##   [8.19,9.09) 449 0.15 15.04 2986 100.00
hist(CODIGO_ACTIVIDAD,xlab="Actividad",ylab="Frecuencia",main="Histograma de actividades", labels = T, xlim=c(0,10), ylim=c(0,700), col="royalblue3")

Se obtuvo como moda la actividad 1 la cual corresponde a Alimento, bebidas y tabaco, siendo esta el tipo de actividad que predominó en el estudio. En el histograma se puede observar que 638 empresas tienen está actividad como principal. La actividad que menor predominó es la 2 correspondiente a “Coquización, fabricación de productos de la refinación del petróleo y combustible nuclear” con 88 empresas.

Cantidad de residuos que se generan

Se planteó el interrogante: ¿el establecimiento cuenta con un instrumento de medición de los residuos que genera? El 65 % de las empresas miden los residuos que generan, sin embargo el 35% aún no realizan la medición, por lo que no se lleva un control de los residuos generados.

REGRESIDGEN<-data.frame(Prom = REGRESIDGEN)

library(lessR)

PieChart(Prom, hole = 0, values = "%", data = REGRESIDGEN,
         fill = c("turquoise4", "violetred"), main = "¿Se miden los residuos que se generan?")

En los gráficos de densidad y diagrama de barras que se muestran a continuación, se puede observar que la mayoría de las actividades que no realizan una medición de los residuos que generan son las actividades 8 (Textiles, confección, calzado y pieles) y 9 (Otras divisiones industriales). Por otra parte la actividad 1 (Alimentos, bebidas y tabaco) es la que más realiza está medición.

library(ggplot2)
ggplot(data=SubCapitulo_III, aes(CODIGO_ACTIVIDAD,fill=REGRESIDGEN)) +
  geom_density(alpha=0.7)

a= ggplot(data=SubCapitulo_III, aes(CODIGO_ACTIVIDAD,fill=REGRESIDGEN))
a +geom_histogram(bins = 50)+theme_bw()

Residuos orgánicos

plot(CODIGO_ACTIVIDAD,C2RSCA1_kg,xlim=c(0,9),main="Cantidad de residuos orgánicos generada",
     col="green2",ylab="Cantidad generada (Kg/año)",xlab="Actividad de la empresa")

El gráfico permite detectar que la actividad 1 es la que genera la mayor cantidad de residuos orgánicos. Al correlacionar la cantidad generada con la cantidad de residuos orgánicos aprovechados por el establecimiento mediante la reutilización obtenemos un coeficiente medianamente alto, lo que nos indica que entre más residuos orgánicos son generados, más de estos se reutilizan con la misma empresa. A continuación se muestra la correlación y su grafico de dispersión.

cor(C2RSCA1_kg,C2RSCB1_kg)
## [1] 0.772735
plot(C2RSCA1_kg,C2RSCB1_kg,main="Aprovechamiento de la cantidad de residuos orgánicos generada",
     col="green2",ylab="Cantidad aprovechada (Kg/año)",xlab="Cantidad generada (Kg/año)")

Residuos plásticos

plot(CODIGO_ACTIVIDAD,C2RSCA2_kg,xlim=c(0,9),main="Cantidad de residuos plásticos generada",
     col="blue2",ylab="Cantidad generada (Kg/año)",xlab="Actividad de la empresa")

Las actividades 3 (fabricación de productos de caucho y plástico) y 5 (Industría de la madera y el corcho, fabricación de papel y actividades de edicción e impresión) son las que generan mayor cantidad de residuos plásticos. La acvtividad principal corresponde a la cantidad de residuo generada.

cor(C2RSCA2_kg,C2RSCB2_kg)
## [1] 0.4836628
plot(C2RSCA2_kg,C2RSCB2_kg,main="Aprovechamiento de la cantidad de residuos plásticos generada",
     col="blue2",ylab="Cantidad aprovechada (Kg/año)",xlab="Cantidad generada (Kg/año)")

Al correlación la cantidad de residuos de plásticos generada con la cantidad de residuos plásticos aprovechados por el establecimiento mediante reutilización, se evidencia pobre relación, esto es debido a que no todos los tipos de plásticos se pueden reciclar y/o reutilizar.

Residuos de papel y cartón

plot(CODIGO_ACTIVIDAD,C2RSCA3_kg,xlim=c(0,9),main="Cantidad de residuos de papel y cartón generada",
     col="gold2",ylab="Cantidad generada (Kg/año)",xlab="Actividad de la empresa")

Las actividades 5 (Industría de la madera y el corcho, fabricación de papel y actividades de edicción e impresión) predomina como la que genera mayor cantidad de este tipo de residuos.

cor(C2RSCA3_kg,C2RSCB3_kg)
## [1] 0.3155391
plot(C2RSCA3_kg,C2RSCB3_kg,main="Aprovechamiento de la cantidad de residuos de papel y cartón generada",
     col="gold2",ylab="Cantidad aprovechada (Kg/año)",xlab="Cantidad generada (Kg/año)")

Aunque se esperaría una alta correlación entre cantidad generada y la aprovechada de residuos de papel y cartón debido a su versatilidad para ser reciclada y reciclada, se obtuvo una correlación baja, en la gráfica se puede observar una linealidad pero predominan los valores que corresponden al no aprovechamiento de la cantidad generada.