setwd("~/ESTADISTICA1011")

Basura en México

En México una persona produce casi un kilo de residuos sólidos al día. En México se generan poco más de 42 millones de toneladas de residuos sólidos al año. Esta cantidad equivale a: 175 veces el volumen de la pirámide del Sol de Teotihuacán.

Antecedentes

¿Qué es la basura?

El termino basura se refiere a cualquier residuo inservible, a todo material no deseado y del que se tiene intencion de desechar.

¿La basura es un problema?

Ademas de la contaminacion del aire, la tierra y el agua; la mala gestion de los residuos tiene efectos perjudiciales para la salud publica (por la contaminacion ambiental y por la posible transmision de enfermedades infecciosas vehiculizadas por los roedores que los habitan) y degradacion del medio ambiente en general, ademas de impactos paisajisticos.

Asimismo, la degradacion ambiental conlleva costos sociales y economicos tales como la devaluacion de propiedades, perdida de la calidad ambiental y sus efectos en el turismo.

¿Como es la problemtica de la basura en México?

https://www.animalpolitico.com/2018/10/mexico-genera-basura-paises-america-latina/

El planeta genera mas de 2.000 millones de toneladas de basura al año, pero expertos calculan que produciremos hasta 3.400 millones en el año 2050. ¿Como contribuye America Latina a estas preocupantes cifras?

ESTADISTICA1011

ESTADISTICA1011

Asignacion

Utilizando los datos proporcionados conteste a las siguientes preguntas:

library(readr)
library(DT)
## Warning: package 'DT' was built under R version 4.0.3
basura <- read_csv("basura.csv")
## 
## -- Column specification -------------------------------------------------------------------------------
## cols(
##   anio = col_double(),
##   basura = col_double(),
##   rellenos = col_double()
## )
datatable(basura)

1.- ¿Como ha aumentado la produccion de basura en Mexico?

plot(basura$basura)

hist(basura$basura)

cumsum(basura$basura)
##  [1]  30509.61  62469.03  91741.45 122292.12 153244.40 183977.66 215466.14
##  [8] 247639.75 280555.45 315159.45 350564.45 386699.45 423564.45 461159.45
## [15] 499484.45 539543.20 580605.70

2.- ¿Los rellenos son suficientes para atender la demanda de generacion de basura?

cor(basura)
##               anio    basura  rellenos
## anio     1.0000000 0.9495559 0.9435149
## basura   0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
pairs(basura)

La cantidad de generacion de basura en teoria responderia al crecimiento poblacional y la modificacion de los habitos de las personas, seria que el crecimiento de los vertederos responde de manera mas o menos uniforme al crecimiento de basura.

Un vertedero normal, ¿cuantas toneladas de basura puede atender?

Investigue la poblacion de mexico para los años que estan en los datos, ahora tomando en cuenta que cada mexicano produce en promedio 1.16 kg de basura, estimar en base a esta tasa y la poblacion de cada año, cuanta basura se estaria produciendo.

3.- ¿Es posible usar la distribucion normal para predecir la probabilidad de incremento de generacion de basura?

mean(basura$basura) #media
## [1] 34153.28
sd(basura$basura) #desviacion estandar 
## [1] 3659.721
max(basura$basura) #valor maximo
## [1] 41062.5
pnorm(45000, mean=34153.28, sd=3659.721, lower.tail = TRUE)
## [1] 0.9984807

TEnemos 99% de probabilidad de que se presente un valor de generacion de basura de 45,000 toneladas por año

¿Es la distribucion normal la mejor manera de predecir probabilidad para estos datos?

¿Los datos son normales?

shapiro.test(basura$basura)
## 
##  Shapiro-Wilk normality test
## 
## data:  basura$basura
## W = 0.92441, p-value = 0.1753

Dado que el valor de p no es representativo, entonces la distribución de valores no es normal

¿Que distribucion se ajusta mejor a estos datos?

Primero se probara un ajuste con distribucion exponencial, dado que se tiene la premisa de que la generacion de basura responde al incremento poblacional y este asu vez se comporta de manera exponencial

¿Que distribuciones existen?

Distribucion Alias Distribucion binomial binom Distribucion de Poisson pois Distribucion normal norm Distribucion exponencial exp Distribucion t de Student t Distribucion \(\chi^2\) chisq Distribucion F

¿Que prefijos se usan en estas distribuciones para hacer calculos?

$$ \[\begin{array}{l|l|l|c} \text{Funcion} & \text{Significado} & \text{Uso}& \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sen lo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$

¿Como funciona la distribucion exponencial?

  • Problema acerca de la distribucion exponencial

Suponga que el tiempo medio de atencion en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.

Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribucion exponencial:

$ f(x)=e^{-x},; x0,;>0 $

Luego, con λ=3 tenemos que:

pexp(2, rate=3)
## [1] 0.9975212

Cual seria la probabilidad de demorar entre 5 y 6 minutos P(X<=6)-P(X<=5)

pexp(6, rate=3) - pexp(5,rate=3)
## [1] 2.906723e-07

¿Cual es la curva funcion de densidad de esta probabilidad exponencial?

curve(dexp(x, rate=3), xlim=c(0,10), xlab="valores de x", y= "Densidad de probabilidad")