Basura en Mexico

Caso de estudio de la 2da unidad de la materia de probabilidad y estadística en el cual se aborda la temática del problema de la basura en México

Antecedentes

¿Que es la basura?

El término basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intención de desechar.

¿La basura es un problema?

Además de la contaminación del aire, la tierra y el agua; la mala gestión de los residuos tiene efectos perjudiciales para la salud pública (por la contaminación ambiental y por la posible transmisión de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradación del medio ambiente en general, además de impactos paisajísticos.

Asimismo, la degradación ambiental conlleva costos sociales y económicos tales como la devaluación de propiedades, pérdida de la calidad ambiental y sus efectos en el turismo.

¿Como es la problematica de la basura en Mexico?

https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/

El planeta genera más de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Cómo contribuye América Latina a estas preocupantes cifras?

Asignacion

Utilizando los datos proporcionados conteste a las siguientes preguntas:

library(readr)
library(DT)
basura <- read_csv("basura.csv")
## 
## -- Column specification -------------------------------------------------------------
## cols(
##   anio = col_double(),
##   basura = col_double(),
##   rellenos = col_double()
## )
datatable(basura)

## 1.- ¿COmo ha aumentado la producciOn de basura en Mexico?

plot(basura$basura)

hist(basura$basura)

cumsum(basura$basura)
##  [1]  30509.61  62469.03  91741.45 122292.12 153244.40 183977.66 215466.14
##  [8] 247639.75 280555.45 315159.45 350564.45 386699.45 423564.45 461159.45
## [15] 499484.45 539543.20 580605.70

2.- ¿Los rellenos son suficientes para atender la demanda de generacion de basura?

cor(basura)
##               anio    basura  rellenos
## anio     1.0000000 0.9495559 0.9435149
## basura   0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
pairs(basura)

Se puede oberservar que con el aumento de basura, el numero de rellenos es un tanto proporcional, mas sin embargo, decir si son los suficientes no es algo que se pueda estimar con estas graficas, ya que no se sabe la capacidad disponible de los rellenos.

Un vertedero normal, ¿cuantas toneladas de basura puede atender?

  • Investigue la poblacion de mexico para los años que estan en los datos, ahora tomando en cuenta que cada mexicano produce en promedio 1.16 kg de basura, estimar en base a esta tasa y la poblacion de cada año, cuanta basura se estaria produciendo.
library(readxl)
poblacion <- read_excel("poblacion.xlsx", 
    col_types = c("numeric", "numeric"))
datatable(poblacion)
(1.6)*(poblacion$poblacion)
## Warning: Unknown or uninitialised column: `poblacion`.
## numeric(0)

Podemos ver los numeros de basura por año en orden desde 1995 hasta 2011

3.- ¿Es posible usar la distribucion normal para predecir la probabilidad de incremento de generacion de basura?

mean(basura$basura) #media
## [1] 34153.28
sd(basura$basura) #desviacion estandar 
## [1] 3659.721
max(basura$basura) #valor maximo
## [1] 41062.5

Tenemos 99% de probabilidad de que se presente un valor de generacion de basura de 45,000 toneladas por año

¿Es la distribucion normal la mejor manera de predecir probabilidad para estos datos?

¿Los datos son normales?

shapiro.test(basura$basura)
## 
##  Shapiro-Wilk normality test
## 
## data:  basura$basura
## W = 0.92441, p-value = 0.1753

Dado que el valor de p no es representativo, entonces la distribucion de valores no es normal

¿Que distribucion se ajusta mejor a estos datos?

Primero se probo un ajuste con distribucion exponencial, dado que se tiene la premisa de que la generacion de basura responde al incremento poblacional y este a su vez se comporta de manera exponencial

¿Que distribuciones existen?

Distribucion Alias Distribucion binomial binom Distribucion de Poisson pois Distribucion normal norm Distribucio exponencial exp Distribucion t de Student t Distribucion \(\chi^2\) chisq Distribucion F

¿Que prefijos se usan en estas distribuciones para hacer calculos?

$$ \[\begin{array}{l|l|l|c} \text{Funcion} & \text{Significado} & \text{Uso}& \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo lo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$ ## ¿Como funciona la distribucion exponencial?

  • Problema acerca de la distribucion exponencial

Suponga que el tiempo medio de atencion en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.

Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribucion exponencial:

\[ f(x)=\lambda e^{-\lambda x},\; x\geq 0,\;\lambda>0 \]

Luego, con λ=3 tenemos que:

pexp(2, rate=3)
## [1] 0.9975212

Cual sera la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)

pexp(6, rate=3) - pexp(5,rate=3)
## [1] 2.906723e-07

¿Cual es la curva funcion de densidad de esta probabilidad exponencial?

curve(dexp(x, rate=3), xlim=c(0,10), xlab="valores de x", y= "Densidad de probabilidad")

Ahora que conocemos esta premisa, responda lo siguiente:

¿Que probabilidad hay de que la generacion de basura se genere al doble?

-pista: estimar el incremento que se tiene por año

mean(basura$basura)
## [1] 34153.28
34153*2
## [1] 68306

La basura aumenta en promedio 34153.28 por año

pexp(68306, rate=34153.28)
## [1] 1

Es 100% probable que suceda