U2A2

Nicole Urias

02/11/2020

BASURA EN MEXICO

En México una persona produce casi un kilo de residuos sólidos al día. En México se generan poco más de 42 millones de toneladas de residuos sólidos al año. Esta cantidad equivale a: 175 veces el volumen de la pirámide del Sol de Teotihuacán.

CONTESTAR LO SIGUIENTE

1.- ¿Cómo ha aumentado la producción de basura en México?

2.- ¿Los rellenos son suficientes para atender la demanda de generación de basura?

3.- ¿Es posible usar la distribución normal para predecir la probabilidad de incremento de generación de basura?

IMPORTAR DATOS

library(pacman)
p_load("prettydoc", "readr","tidyverse","DT","modeest","readxl")
basura <- read.csv("basura.csv")
datatable(basura)

* 1.- ¿Cómo ha aumentado la producción de basura en México?

plot(basura$anio, basura$basura, title(main = 'Basura generada en toneladas'), xlab = 'Año', ylab = 'Basura generada')

Rectabasura <- lm(basura$basura ~ basura$anio)

abline(Rectabasura, col='red', lwd='3')

summary(Rectabasura)
## 
## Call:
## lm(formula = basura$basura ~ basura$anio)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1355.49  -751.81  -124.62    42.68  2623.36 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.344e+06  1.175e+05  -11.44 8.32e-09 ***
## basura$anio  6.882e+02  5.868e+01   11.73 5.92e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1185 on 15 degrees of freedom
## Multiple R-squared:  0.9017, Adjusted R-squared:  0.8951 
## F-statistic: 137.5 on 1 and 15 DF,  p-value: 5.915e-09
  • Con estos datos se puede observar que la basura entre los años 1995 y 2010 a tenido un aumento constante durante al inicio un aumento muy elevadi para luego disminuir bruscamente y apartir del 2005 una tendencia constante.

  • 2.- ¿Los rellenos son suficientes para atender la demanda de generación de basura?

plot(basura$basura, basura$rellenos, title(main = 'Rellenos vs basura generada'), xlab = 'Basura generada', ylab = 'Rellenos sanitarios')

Rectarellenos <- lm(basura$rellenos ~ basura$basura)

abline(Rectarellenos, col='red', lwd='3')

summary(Rectarellenos)
## 
## Call:
## lm(formula = basura$rellenos ~ basura$basura)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -35.438 -12.358  -1.054  15.864  20.630 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -3.239e+02  3.956e+01   -8.19 6.45e-07 ***
## basura$basura  1.222e-02  1.152e-03   10.60 2.30e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 16.86 on 15 degrees of freedom
## Multiple R-squared:  0.8823, Adjusted R-squared:  0.8744 
## F-statistic: 112.4 on 1 and 15 DF,  p-value: 2.299e-08
  • Se observa con estos datos que conforme va aumentando los indices de basura obviamente va aumentando la cantidad de relleno.

  • 3.- ¿Es posible usar la distribución normal para predecir la probabilidad de incremento de generación de basura?

max(basura$basura)
## [1] 41062.5
mean(basura$basura)
## [1] 34153.28
sd(basura$basura)
## [1] 3659.721
pnorm(45000, mean=34153.28, sd=3659.721 , lower.tail = TRUE)
## [1] 0.9984807
  • Conrespecto a los datos se observa que se tiene una probabilidad de 99% de que la cantidad de basura sea de 45000 millones de toneladas.

¿Es la distribución normal la mejor manera de predecir probabilidad para estos datos?

Si, nos ayuda a poder entender mejor las relaciones de los datos y la probabilidad de un valor.

¿Los datos son normales?, ¿Que distribución se ajusta mejor a estos datos?

Si, nos sirve para tener una mejor prespectiva sobre los datos, el cual nos dice que van incrementando a lo largo de las años.

¿COMO FUNCIONAN LA DISTRIBUCION EXPONENCIAL?

plot(basura$basura)

hist(basura$basura)

cumsum(basura$basura)
##  [1]  30509.61  62469.03  91741.45 122292.12 153244.40 183977.66 215466.14
##  [8] 247639.75 280555.45 315159.45 350564.45 386699.45 423564.45 461159.45
## [15] 499484.45 539543.20 580605.70

¿Los rellenos son suficientes para atender la demanda de generacion de basura?

cor(basura)
##               anio    basura  rellenos
## anio     1.0000000 0.9495559 0.9435149
## basura   0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
pairs(basura)

La cantidad de generación de basura en teoría respondería al crecimiento poblacional y la modificación de los hábitos de las personas, sería que el crecimiento de los vertederos responde de manera más o menos uniforme al crecimiento de basura.

Un vertedero normal, ¿cuantas toneladas de basura puede atender?

Investigue la población de méxico para los años que están en los datos, ahora tomando en cuenta que cada mexicano produce en promedio 1.16 kg de basura, estimar en base a esta tasa y la población de cada año, cuanta basura se estaría produciendo.

¿Los datos son normales?

shapiro.test(basura$basura)
## 
##  Shapiro-Wilk normality test
## 
## data:  basura$basura
## W = 0.92441, p-value = 0.1753

Dado que el valor de p no es representaivo, entonces la distribucion de valores no es normal.

¿que distribucion se ajusta mejor a estos datos? primero se probara un ajuste con dsitribucion exponencial, dado que se tiene la premisa de que la generacion de basura responde al incremento poblacional y este asu vez se comparta de manera exponencial.

¿Que distribuciones existen?

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución \(\chi^2\) chisq Distribución F

¿Que prefijos se usan en estas distribuciones para hacer cálculos?

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

¿Como funciona la distribución exponencial?

  • Problema acerca de la distribución exponencial

Suponga que el tiempo medio de atención en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.

Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribución exponencial:

$ f(x)=e^{-x},; x0,;>0 $

Luego, con λ=3 tenemos que:

pexp(2, rate=3)
## [1] 0.9975212

Cual sería la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)

pexp(6, rate=3) - pexp(5,rate=3)
## [1] 2.906723e-07

¿Cual es la curva función de densidad de esta probabilidad exponencial?

curve(dexp(x, rate=3), xlim=c(0,10), xlab="valores de x", y= "Densidad de probabilidad")

Ahora que conocemos esta premisa, responda lo siguiente:

¿Que probabilidad hay de que la generación de basura se genere al doble?

-pista: estimar el incremento que se tiene por año

mean(basura$basura)
## [1] 34153.28
#Ratio de 2000, la probabilidad de que x=4500 > 2000
pexp(4500, rate = 2000)
## [1] 1

El valor de la basura aumenta a los valores estimados