Caso de estudio de la 2da unidad de la materia de probabilidad y estadística en el cual se aborda la temática del problema de la basura en México
¿Que es la basura?
El término basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intención de desechar.
¿La basura es un problema?
Además de la contaminación del aire, la tierra y el agua; la mala gestión de los residuos tiene efectos perjudiciales para la salud pública (por la contaminación ambiental y por la posible transmisión de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradación del medio ambiente en general, además de impactos paisajísticos.
Asimismo, la degradación ambiental conlleva costos sociales y económicos tales como la devaluación de propiedades, pérdida de la calidad ambiental y sus efectos en el turismo.
¿Como es la problematica de la basura en Mexico?
https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/
El planeta genera más de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Cómo contribuye América Latina a estas preocupantes cifras?
Utilizando los datos proporcionados conteste a las siguientes preguntas:
library(readr)
library(DT)
basura <- read_csv("basura.csv")
##
## -- Column specification -------------------------------------------------------------
## cols(
## anio = col_double(),
## basura = col_double(),
## rellenos = col_double()
## )
datatable(basura)
## 1.- ¿COmo ha aumentado la producciOn de basura en Mexico?
plot(basura$basura)
hist(basura$basura)
cumsum(basura$basura)
## [1] 30509.61 62469.03 91741.45 122292.12 153244.40 183977.66 215466.14
## [8] 247639.75 280555.45 315159.45 350564.45 386699.45 423564.45 461159.45
## [15] 499484.45 539543.20 580605.70
cor(basura)
## anio basura rellenos
## anio 1.0000000 0.9495559 0.9435149
## basura 0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
pairs(basura)
Se puede oberservar que con el aumento de basura, el numero de rellenos es un tanto proporcional, mas sin embargo, decir si son los suficientes no es algo que se pueda estimar con estas graficas, ya que no se sabe la capacidad disponible de los rellenos.
Un vertedero normal, ¿cuantas toneladas de basura puede atender?
library(readxl)
poblacion <- read_excel("poblacion.xlsx",
col_types = c("numeric", "numeric"))
datatable(poblacion)
(1.6)*(poblacion$poblacion)
## Warning: Unknown or uninitialised column: `poblacion`.
## numeric(0)
Podemos ver los numeros de basura por año en orden desde 1995 hasta 2011
mean(basura$basura) #media
## [1] 34153.28
sd(basura$basura) #desviacion estandar
## [1] 3659.721
max(basura$basura) #valor maximo
## [1] 41062.5
Tenemos 99% de probabilidad de que se presente un valor de generacion de basura de 45,000 toneladas por año
¿Es la distribucion normal la mejor manera de predecir probabilidad para estos datos?
¿Los datos son normales?
shapiro.test(basura$basura)
##
## Shapiro-Wilk normality test
##
## data: basura$basura
## W = 0.92441, p-value = 0.1753
Dado que el valor de p no es representativo, entonces la distribucion de valores no es normal
¿Que distribucion se ajusta mejor a estos datos?
Primero se probo un ajuste con distribucion exponencial, dado que se tiene la premisa de que la generacion de basura responde al incremento poblacional y este a su vez se comporta de manera exponencial
Distribucion Alias Distribucion binomial binom Distribucion de Poisson pois Distribucion normal norm Distribucio exponencial exp Distribucion t de Student t Distribucion \(\chi^2\) chisq Distribucion F
$$ ## ¿Como funciona la distribucion exponencial?
Suponga que el tiempo medio de atencion en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.
Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribucion exponencial:
\[ f(x)=\lambda e^{-\lambda x},\; x\geq 0,\;\lambda>0 \]
Luego, con λ=3 tenemos que:
pexp(2, rate=3)
## [1] 0.9975212
Cual sera la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)
pexp(6, rate=3) - pexp(5,rate=3)
## [1] 2.906723e-07
¿Cual es la curva funcion de densidad de esta probabilidad exponencial?
curve(dexp(x, rate=3), xlim=c(0,10), xlab="valores de x", y= "Densidad de probabilidad")
Ahora que conocemos esta premisa, responda lo siguiente:
-pista: estimar el incremento que se tiene por año
mean(basura$basura)
## [1] 34153.28
34153*2
## [1] 68306
La basura aumenta en promedio 34153.28 por año
pexp(68306, rate=34153.28)
## [1] 1
Es 100% probable que suceda