Basura en México

Caso de estudio de la 2da unidad de la materia de probabilidad y estadística en el cual se aborda la temática del problema de la basura en México

Antecedentes

¿Qué es la basura?

El término basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intención de desechar.

¿La basura es un problema?

Además de la contaminación del aire, la tierra y el agua; la mala gestión de los residuos tiene efectos perjudiciales para la salud pública (por la contaminación ambiental y por la posible transmisión de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradación del medio ambiente en general, además de impactos paisajísticos.

Asimismo, la degradación ambiental conlleva costos sociales y económicos tales como la devaluación de propiedades, pérdida de la calidad ambiental y sus efectos en el turismo.

¿Cómo es la problemática de la basura en México?

https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/

El planeta genera más de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Cómo contribuye América Latina a estas preocupantes cifras?

Asignación sería:

Utilizando los datos proporcionados conteste a las siguientes preguntas:

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth", "caTools")
datos <- read_csv("basura.csv")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   anio = col_double(),
##   basura = col_double(),
##   rellenos = col_double()
## )
datatable(datos)

Resumen de datos

summary(datos)
##       anio          basura         rellenos     
##  Min.   :1995   Min.   :29272   Min.   : 30.00  
##  1st Qu.:1999   1st Qu.:30952   1st Qu.: 66.00  
##  Median :2003   Median :32916   Median : 89.00  
##  Mean   :2003   Mean   :34153   Mean   : 93.24  
##  3rd Qu.:2007   3rd Qu.:36865   3rd Qu.:114.00  
##  Max.   :2011   Max.   :41062   Max.   :196.00
#correlaciòn de pares
pairs(datos)

## Selecciòn de variables

#basura
basura <- datos$basura

#anio
anio <- datos$anio

#rellenos
rellenos <- datos$rellenos

Creando grafica

cor(basura, anio)
## [1] 0.9495559
#regresion lineal
r1<-lm(basura~anio)
r1
## 
## Call:
## lm(formula = basura ~ anio)
## 
## Coefficients:
## (Intercept)         anio  
##  -1344259.7        688.2
#x <- anio
#y <- basura
  • Grafica 1
#Grafica1
plot(anio, basura, col="blue", title(main="relacion de basura por año"))
abline(r1)

* Grafica 2

r2<-lm(rellenos~basura)
r2
## 
## Call:
## lm(formula = rellenos ~ basura)
## 
## Coefficients:
## (Intercept)       basura  
##  -323.94059      0.01221
plot(basura,rellenos, col="green", title(main="aumento de rellenos por la basura"))
abline(r2)

1.- ¿Cómo ha aumentado la producción de basura en México? ha estado aumentando significativamente, aunque hubo una excepciòn por el año 1997, en el cual Mexico tuvo su menor dato de basura, despues de ese año el aumento de basura fue constante. Muchos factores son los responsables del aumento en la basura, si miramos a la historia de Mexico por el ambito economico y cultural hasta cierto punto. por los años 90 Mexico fue aumento su poblaciòn y esto significo un aumento industrial, a mayor poblaciòn mayor demanda de recursos, esto sumando que por estos años Mexico recibio cartas de empresas extranjeras pidiendo poder construir depositos de basura.

2.- ¿Los rellenos son suficientes para atender la demanda de generación de basura? al paso que vamos se necesitaran mas rellenos para atender la demanda, el aumento de rellenos por año es como de 1 a 3, las opciones son intentar desacerse de la basura en mas medida o tener mas rellenos por año

3.-¿Es posible usar la distribución normal para predecir la probabilidad de incremento de generación de basura?

#predicciòn de basura por año
mediaBasura<-mean(datos$basura) #media
sdBasura<-sd(datos$basura) #desviaciòn estandar
max(datos$basura) #valor maximo
## [1] 41062.5
pnorm(45000, mediaBasura,sdBasura, lower.tail = TRUE)
## [1] 0.9984807

tenemos 99% de probabilidad de generar basura de 45,000 toneladas por año.

Regresiòn polinomial

y <- datos$basura
x <- datos$anio
xsq <- x^2
xcub <- x^3
xquar <- x^4
plot(x,y,pch = 19, xlab = "años", ylab = "basura generada por año", title(main = "basura generada por año"))

fit1 <- lm(y~x)
anova(fit1)
## Analysis of Variance Table
## 
## Response: y
##           Df    Sum Sq   Mean Sq F value    Pr(>F)    
## x          1 193222184 193222184  137.53 5.915e-09 ***
## Residuals 15  21074728   1404982                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
abline(fit1, col = "red")

fit2 <- lm(y~x+xsq)
anova(fit2)
## Analysis of Variance Table
## 
## Response: y
##           Df    Sum Sq   Mean Sq F value    Pr(>F)    
## x          1 193222184 193222184  401.40 1.050e-11 ***
## xsq        1  14335494  14335494   29.78 8.447e-05 ***
## Residuals 14   6739234    481374                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
xv <- seq(min(x), max(x), 0.01)
yv <- predict(fit2, list(x = xv, xsq = xv^2))
lines(xv, yv, col = "blue")

fit3 <- lm(y~x+xsq+xcub)
anova(fit3)
## Analysis of Variance Table
## 
## Response: y
##           Df    Sum Sq   Mean Sq F value    Pr(>F)    
## x          1 193222184 193222184  401.40 1.050e-11 ***
## xsq        1  14335494  14335494   29.78 8.447e-05 ***
## Residuals 14   6739234    481374                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
xv <- seq(min(x), max(x), 0.01)
yv <- predict(fit3, list(x = xv, xsq = xv^2, xcub = xv^3))
## Warning in predict.lm(fit3, list(x = xv, xsq = xv^2, xcub = xv^3)): prediction
## from a rank-deficient fit may be misleading
lines(xv, yv, col = "gray")

plot(fit2, which = 1)

plot(fit2, which = 2)

  • ¿Es la distribución normal la mejor manera de predecir probabilidad para estos datos? puede funcionar y con una recta se predicen los datos como se puede observar en la grafica.

  • ¿Los datos son normales? el valor p no es representativo ya que no se agrupan a la media.

shapiro.test(datos$basura)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$basura
## W = 0.92441, p-value = 0.1753
  • ¿Que distribución se ajusta mejor a estos datos? como se puede observar en la grafica, la distribuciòn normal predice los datos futuros, con la regresiòn polinomial se puede observar un aumento en la precisiòn con la que se predicen los datos.

¿Què probabilidad hay de que se genere el doble de basura?

mean(datos$basura)
## [1] 34153.28
#ratio de 2000, checa la probabilidad de que x=4500 > 2000
pexp(4500, rate = 2000)
## [1] 1

como el valor de la basura va aumentando en 2000 a valores cercanos a 2400 por año, la probabilidad de que aumente a 4500 por año es bastante probable.Esto fue basado en el codigo de arriba.