U2A2

Bernardo Valenzuela Martinez

30/10/2020

setwd("~/R")

Basura en México

Basura

Caso de estudio de la 2da unidad de la materia de probabilidad y estadística en el cual se aborda la temática del problema de la basura en México

Antecedentes

¿Qué es la basura?

El término basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intención de desechar.

¿La basura es un problema?

Además de la contaminación del aire, la tierra y el agua; la mala gestión de los residuos tiene efectos perjudiciales para la salud pública (por la contaminación ambiental y por la posible transmisión de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradación del medio ambiente en general, además de impactos paisajísticos.

Asimismo, la degradación ambiental conlleva costos sociales y económicos tales como la devaluación de propiedades, pérdida de la calidad ambiental y sus efectos en el turismo.

¿Cómo es la problemática de la basura en México?

https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/

El planeta genera más de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Cómo contribuye América Latina a estas preocupantes cifras?

Asignación sería:

Utilizando los datos proporcionados conteste a las siguientes preguntas:

1.- ¿Cómo ha aumentado la producción de basura en México?

Basura <- basura$basura
Años <- basura$anio

plot(Años,Basura,col='green3',main='Basura Generada de  1995 a 2011',type='l', xlab='año registrado',ylab='basura generada ')

LineaTendenciabasura <- lm(Basura ~ Años )

abline(LineaTendenciabasura,col='red2',lwd=2.5)

summary(LineaTendenciabasura)
## 
## Call:
## lm(formula = Basura ~ Años)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1355.49  -751.81  -124.62    42.68  2623.36 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.344e+06  1.175e+05  -11.44 8.32e-09 ***
## Años         6.882e+02  5.868e+01   11.73 5.92e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1185 on 15 degrees of freedom
## Multiple R-squared:  0.9017, Adjusted R-squared:  0.8951 
## F-statistic: 137.5 on 1 and 15 DF,  p-value: 5.915e-09

Ecuación de la recta

\[y = 688.2x−1344000\] \[R^2=0.8951 \]

Se puede oberservar como el aumento de basura va aumentando con cada año posterior registrado, esto igual el numero de rellenos. Se puede ver de igual manera, que apartir del año 2000, el incremento de basura tomo un crecimiento mas acelerado.

2.- ¿Los rellenos son suficientes para atender la demanda de generación de basura?

#Comparativa de rellenos disponibles vs basura generada



rellenos <- basura$rellenos

plot(Basura,rellenos,col='darkblue',main='Basura Vs Rellenos disponibles',type='p', xlab='Basura generada',ylab='Rellenos disponibles ')

LineaTendenciabasuravsrellenos <- lm(rellenos ~ Basura)

abline(LineaTendenciabasuravsrellenos <- lm(rellenos ~ Basura)
,col='darkorchid3',lwd=2.5)

cor(basura)
##               anio    basura  rellenos
## anio     1.0000000 0.9495559 0.9435149
## basura   0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
pairs(basura)

Se puede oberservar que con el aumento de basura, el numero de rellenos es un tanto proporcional, mas sin embargo, decir si son los suficientes no es algo que se pueda estimar con estas graficas, ya que no se sabe la capacidad disponible de los rellenos.

3.- ¿Es posible usar la distribución normal para predecir la probabilidad de incremento de generación de basura?

#Media
mean(Basura)
## [1] 34153.28
#desviación estándar 


sd(Basura)
## [1] 3659.721
#valor máximo
max(Basura) 
## [1] 41062.5
pnorm(35500.5, mean=34153.28, sd=3659.721, lower.tail = TRUE)
## [1] 0.6436085

Se tiene 99% de probabilidad de que se presente un valor de generación de basura de 45,000 toneladas por año

  • ¿Es la distribución normal la mejor manera de predecir probabilidad para estos datos?

Con el registro de basura a lo largo de años, es como se tienen datos para realizar esta distribucion normal, que nos dice cual es la probablilidad segun datos registrados, de que se vuelva a presentar cierta cantidad de toneladas en un año. Si nos puede ayudar a predecir en cierta parte cual es la probabilidad en porcentaje, pero esta distribucion no funciona para valores muy alejados del maximo registrado en los datos, ya que no se calcula para probabilidades futuras, si no la probabilidad de que la cantidad de basura se encuentren por encima de los datos registrados. Si se supone que la basura en 5 años, sera >45500, la distribución nos dira que habra 100% probablilidad.

  • ¿Los datos son normales? ¿Que distribución se ajusta mejor a estos datos?
shapiro.test(basura$basura)
## 
##  Shapiro-Wilk normality test
## 
## data:  basura$basura
## W = 0.92441, p-value = 0.1753

Dado que el valor de p no es representativo, entonces la distribución de valores no es normal

Primero se probará un ajuste con distribución exponencial, dado que se tiene la premisa de que la generación de basura responde al incremento poblacional y este a su vez se comporta de manera exponencial

¿Que distribuciones existen?

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución \(\chi^2\) chisq Distribución F

¿Que prefijos se usan en estas distribuciones para hacer cálculos?

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

¿Como funciona la distribución exponencial?

Imagen de modelo exponencial

  • Problema acerca de la distribución exponencial

Suponga que el tiempo medio de atención en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.

Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribución exponencial:

\[ f(x)=\lambda e^{-\lambda x},\; x\geq 0,\;\lambda>0 \]

Luego, con λ=3 tenemos que:

pexp(2, rate=3)
## [1] 0.9975212

Cual sería la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)

pexp(6, rate=3) - pexp(5,rate=3)
## [1] 2.906723e-07

¿Cual es la curva función de densidad de esta probabilidad exponencial?

curve(dexp(x, rate=3), xlim=c(0,10), xlab="valores de x", y= "Densidad de probabilidad")

Ahora que conocemos esta premisa, responda lo siguiente:

¿Que probabilidad hay de que la generación de basura se genere al doble?

-pista: estimar el incremento que se tiene por año

mean(basura$basura)
## [1] 34153.28
34153*2
## [1] 68306

La basura aumenta en promedio 34153.28 por año

pexp(68306, rate=34153.28)
## [1] 1

Es 100% probable que suceda