• Establecer folder de trabajo
setwd("~/PYE1213")

Principales productores de basura en el mundo

Importar

Importar paquetes

library(pacman)
p_load('prettydoc','DT','readr')

Importar datos

basuramx <- read_csv("basuramx.csv")
## Parsed with column specification:
## cols(
##   anio = col_double(),
##   basura = col_double()
## )
datatable(basuramx)

Visualizamos los datos

podemos ver los datos en modo tabla

head(basuramx)
## # A tibble: 6 x 2
##    anio basura
##   <dbl>  <dbl>
## 1  1992 21968.
## 2  1993 28090.
## 3  1994 29472.
## 4  1995 30510.
## 5  1996 31959.
## 6  1997 29272.

Analisis de correalación

  • Matriz de diagramas de dispersión
pairs(basuramx)

A simple vista se puede ver que esta estrechamente relacionada los años con la cantidad de basura, se puede asumir que el incremento de basura es lineal en relación con el paso de los años, por ende se puede decir que a este paso la basura se convertirá en un problema todavía mayor a que ya es.

  • A continuación se verá como se relaciona la cantidad de basura y el paso de los años
cor(basuramx)
##             anio    basura
## anio   1.0000000 0.9503863
## basura 0.9503863 1.0000000

Se puede ver que existe una relación de 95% entre la basura y el año, por ende esto significa que la basura crece de una manera lineal, y se buscará saber cuanto es el crecimiento y que tanto creció en 2013 y posterior.

Recta de minimos cuadrados

Generamos mediante la siguiente formula la recta de mínimos cuadrados para conocer la relación y confianza que tienen los datos

datos <- lm(basura ~ anio,data = basuramx)
summary(datos)
## 
## Call:
## lm(formula = basura ~ anio, data = basuramx)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4015.9  -439.2  -287.5   911.8  2993.4 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.459e+06  1.121e+05  -13.02 6.46e-11 ***
## anio         7.456e+02  5.599e+01   13.32 4.38e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1554 on 19 degrees of freedom
## Multiple R-squared:  0.9032, Adjusted R-squared:  0.8981 
## F-statistic: 177.4 on 1 and 19 DF,  p-value: 4.376e-11

Ecuación de minimos cuadrados

En base a lo visto anterior se puede hacer la formula de mínimos cuadrados

\[y= -1.459e+06 + 5.3207x\]

Gráficamos los datos de acuerdo a la obtención de la recta de mínimos cuadrados

plot(basuramx$anio, basuramx$basura, xlab = "Año", ylab="Cantidad de basura en toneladas por años")
abline(datos)

Calculamos la confiablilidad

confint(datos)
##                     2.5 %        97.5 %
## (Intercept) -1693960.6387 -1224728.5864
## anio             628.4563      862.8369

Predicciones

progreso.anios <- data.frame(anio=seq(2013,2020))
predict(datos,progreso.anios, interval = "prediction")
##        fit      lwr      upr
## 1 41642.01 38072.68 45211.35
## 2 42387.66 38774.35 46000.98
## 3 43133.31 39472.79 46793.82
## 4 43878.95 40168.13 47589.77
## 5 44624.60 40860.50 48388.70
## 6 45370.25 41550.01 49190.48
## 7 46115.89 42236.80 49994.99
## 8 46861.54 42920.97 50802.11
  predict(datos,progreso.anios)
##        1        2        3        4        5        6        7        8 
## 41642.01 42387.66 43133.31 43878.95 44624.60 45370.25 46115.89 46861.54

Se puede ver que en próximos años el aumento de basura es muy grande, pudiendo incluso alcanzar como un máximo para 2020 50802.11 toneladas de basura, por supuesto en un caso hipotetico muy grave, tal como una pandemia, pero esto probablemente bajaría los basureros interurbanos, pero subiría la producción de basura en los hogares, ya que las personas están mas tiempo en sus casas.

Representación de los intervalos de confianza

progreso.anios <- data.frame(anio=seq(1992,2020))
plot(basuramx$anio, basuramx$basura, xlab = "Año", ylab="Cantidad de basura en toneladas por años")
abline(datos)
intervalo <- predict(datos, progreso.anios, interval = "confidence")
lines(progreso.anios$anio, intervalo[, 2], lty=2, col="red")
lines(progreso.anios$anio, intervalo[, 3], lty=2, col="red")


intervalo <- predict(datos, progreso.anios, interval = "prediction")
lines(progreso.anios$anio, intervalo[, 2], lty=2, col="green")
lines(progreso.anios$anio, intervalo[, 3], lty=2, col="green")

A manera de conclusión se puede ver que el aumento de producción de basura va en aumento año con año, se podría decir que llegará un momento en el cual sera imposible vivir, debido a la contaminación que exista en el medio ambiente, la cantidad de basura es mas cada año, y esto seguirá así a menos que tanto personas, como gobierno empiecen a trabajar de una manera en la cual no se genere tanta basura, y que se empiece a enseñar a las nuevas generaciones desde pequeños la importancia, ademas de instruirlos y acostumbrarlos a que reciclen, reduzcan, reutilicen y la ultima que en ingles suena mejor refuse, decir No, ademas de que el gobierno toma cartas en el asunto, creando una ley para la sanción económica de las personas que se nieguen a contribuir al reciclaje.