Basura en México
Caso de estudio de la 2da unidad de la materia de probabilidad y estadística en el cual se aborda la temática del problema de la basura en México
Antecedentes
¿Qué es la basura?
El término basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intención de desechar.
¿La basura es un problema?
Además de la contaminación del aire, la tierra y el agua; la mala gestión de los residuos tiene efectos perjudiciales para la salud pública (por la contaminación ambiental y por la posible transmisión de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradación del medio ambiente en general, además de impactos paisajísticos.
Asimismo, la degradación ambiental conlleva costos sociales y económicos tales como la devaluación de propiedades, pérdida de la calidad ambiental y sus efectos en el turismo.
¿Cómo es la problemática de la basura en México?
https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/
El planeta genera más de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Cómo contribuye América Latina a estas preocupantes cifras?
Análisis
- IMPORTAR LIBRERÍAS Y CARPETA DE TRABAJO
- LEER DATOS Y PRESENTAR TABLA
Resumen de datos
## anio basura rellenos
## Min. :1995 Min. :29272 Min. : 30.00
## 1st Qu.:1999 1st Qu.:30952 1st Qu.: 66.00
## Median :2003 Median :32916 Median : 89.00
## Mean :2003 Mean :34153 Mean : 93.24
## 3rd Qu.:2007 3rd Qu.:36865 3rd Qu.:114.00
## Max. :2011 Max. :41063 Max. :196.00
## anio basura rellenos
## anio 1.0000000 0.9495559 0.9435149
## basura 0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
1.- ¿Cómo ha aumentado la producción de basura en México?
basura <- basuramx$basura
t <- basuramx$anio
plot(t,basura,col='brown',main='Producción de basura de 1995 a 2011',type='p', xlab='año',ylab='basura generada ')
modelolinealbasuramx <- lm(basura ~ t)
abline(modelolinealbasuramx,col='purple',lwd=2.5)##
## Call:
## lm(formula = basura ~ t)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1355.49 -751.81 -124.62 42.68 2623.36
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.344e+06 1.175e+05 -11.44 8.32e-09 ***
## t 6.882e+02 5.868e+01 11.73 5.92e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1185 on 15 degrees of freedom
## Multiple R-squared: 0.9017, Adjusted R-squared: 0.8951
## F-statistic: 137.5 on 1 and 15 DF, p-value: 5.915e-09
Ecuación de la recta
\[ y = 688.2x -1344000 \] con: \[R^2 = 0.8951\]
Como se puede ver que la cantidad de basura dentro del país desde 1995 hasta el 2011 ha aumentado de una manera prácticamente proporcional, ya que conforme fueron pasando los años la cantidad de basura generada fué aumentando tambien. Analizando en especial los años de 1995 a 2000 se observa una caída brusca en la generación de basura , para después seguir un comportamiento normal.
2.- ¿Los rellenos son suficientes para atender la demanda de generación de basura?
rellenos <- basuramx$rellenos
plot(basura,rellenos,col='red',main='Relación entre bassura generada y número de rellenos',type='p', xlab='Basura generada',ylab='No. de rellenos')
modelolinealbasuramx2 <- lm(rellenos ~ basura)
abline(modelolinealbasuramx2,col='green',lwd=2.5)##
## Call:
## lm(formula = rellenos ~ basura)
##
## Residuals:
## Min 1Q Median 3Q Max
## -35.438 -12.358 -1.054 15.864 20.630
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.239e+02 3.956e+01 -8.19 6.45e-07 ***
## basura 1.222e-02 1.152e-03 10.60 2.30e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 16.86 on 15 degrees of freedom
## Multiple R-squared: 0.8823, Adjusted R-squared: 0.8744
## F-statistic: 112.4 on 1 and 15 DF, p-value: 2.299e-08
Ecuación de la recta
\[ y = 0.0122x - 3.239 \] con : \[R^2=0.8744\]
Se puede observar que la relación entre la cantidad de rellenos ha ido aumentando a lo largo de los años, ya que la producciónde basaura lo ha hecho de igual forma; para poder evaluar si la cantidad de rellenos son los necesarios para atender la cantidad de basura generada , habría que conocer que tanta capacidad tienen en conjutno para realizar la comparación de sí son los necesarios o no.
La cantidad de generación de basura en teoría respondería al crecimiento poblacional y la modificación de los hábitos de las personas, sería que el crecimiento de los vertederos responde de manera más o menos uniforme al crecimiento de basura.
Un vertedero normal, ¿cuantas toneladas de basura puede atender?
Investigue la población de méxico para los años que están en los datos, ahora tomando en cuenta que cada mexicano produce en promedio 1.16 kg de basura, estimar en base a esta tasa y la población de cada año, cuanta basura se estaría produciendo.
library(readxl)
poblacion <- read_excel("poblacion.xlsx",
col_types = c("numeric", "numeric"))
datatable(poblacion)Basura generada
## [1] 151184000 153403200 155528000 157576000 159529600 161433600 163395200
## [8] 165468800 167552000 169523200 171441600 173454400 175659200 178078400
## [15] 180564800 182809600 185092800
¿Es posible usar la distribución normal para predecir la probabilidad de incremento de generación de basura?
¿Es la distribución normal la mejor manera de predecir probabilidad para estos datos?
##
## Shapiro-Wilk normality test
##
## data: basura
## W = 0.92441, p-value = 0.1753
Por lo que al no ser signifcativo el valor de “p”, no se considera una distribución normal para los datos.
¿Los datos son normales?, ¿Que distribución se ajusta mejor a estos datos?
¿Que distribución se ajusta mejor a estos datos?
Primero se probará un ajuste con distribución exponencial, dado que se tiene la premisa de que la generación de basura responde al incremento poblacional y este asu vez se comporta de manera exponencial
¿Que distribuciones existen?
Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución \(\chi^2\) chisq Distribución F
¿Que prefijos se usan en estas distribuciones para hacer cálculos?
$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]$$
¿Como funciona la distribución exponencial?
- Problema acerca de la distribución exponencial
Suponga que el tiempo medio de atención en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.
Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribución exponencial:
\[ f(x)=\lambda e^{-\lambda x},\; x\geq 0,\;\lambda>0 \]
Luego, con λ=3 tenemos que:
## [1] 0.9975212
Cual sería la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)
## [1] 2.906723e-07
¿Cual es la curva función de densidad de esta probabilidad exponencial?
Problema:
Ahora que conocemos esta premisa, responda lo siguiente:
¿Que probabilidad hay de que la generación de basura se genere al doble?
-pista: estimar el incremento que se tiene por año
## [1] 693.5341
## [1] 1
## [1] 2009.016