## Parsed with column specification:
## cols(
## anio = col_double(),
## basura = col_double(),
## rellenos = col_double()
## )
## anio basura rellenos
## anio 1.0000000 0.9495559 0.9435149
## basura 0.9495559 1.0000000 0.9393043
## rellenos 0.9435149 0.9393043 1.0000000
## [1] 3659.721
¿Es posible predecir la probabilidad de generación de basura?
Primer paso sería conocer los datos, ¿Cómo son los datos? ¿Los datos son normales? ¿Se puede usar la distribución normal?
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
## Class limits f rf rf(%) cf cf(%)
## [28979.696,31061.934) 5 0.29 29.41 5 29.41
## [31061.934,33144.172) 4 0.24 23.53 9 52.94
## [33144.172,35226.41) 1 0.06 5.88 10 58.82
## [35226.41,37308.649) 3 0.18 17.65 13 76.47
## [37308.649,39390.887) 2 0.12 11.76 15 88.24
## [39390.887,41473.125) 2 0.12 11.76 17 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 29272 30952 32916 34153 36865 41063
## [1] 3659.721
Apararentemente según los análisis anteriores parecería que los datos no son normales dado que su tendencia no está alineada a la media
¿Cómo podemos saber si los datos son normales o no?
Para esto usaremos la prueba de normalidad de Shapiro-Wilk
##
## Shapiro-Wilk normality test
##
## data: basura$basura
## W = 0.92441, p-value = 0.1753
Analizando el valor de p < 0.05, concluimos que los datos no son normales.
Si los datos no son normales, ¿que resultados tendríamos si usamos la distribución normal para predecir probabilidad?
Para poder calcular probabilidad usando la distribución normal, utilizaremos la función de densidad de probabilidad:
## [1] 0.9984811
Asignación:
¿Es la distribución normal la mejor manera de estimar probabilidad en estos conjuntos de datos observando lo anterior?
¿Que tantos de estos residuos no tienen control? es decir, no llegan a rellenos
Para esto utilce los siguientes datos: https://datos.gob.mx/busca/dataset/indicadores-clave--residuos
Analice estos datos y estime la probabilidad de producción utilizando primero la distribución normal y posteriormente otra distribución que se ajuste mejor
El objetivo de esto es analizar los resultados que se tienen cuando se usa la distribución normal comparada con otros tipos de distribuciones de probabilidad.
¿Es la distribución normal la mejor manera de predecir probabilidad para estos datos?
¿Los datos son normales?
##
## Shapiro-Wilk normality test
##
## data: basura$basura
## W = 0.92441, p-value = 0.1753
Dado que el valor de p no es representativo, entonces la distribución de valores no es normal
Primero se probará un ajuste con distribución exponencial, dado que se tiene la premisa de que la generación de basura responde al incremento poblacional y este asu vez se comporta de manera exponencial
Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución χ2 chisq Distribución F
\[ FunciónpqdrSignificadoprobabilityquantiledensityrandomUsoCalcula probabilidades acumuladas (cdf)Calcula cuantiles (percentiles)Calcula probabilidades puntualesGenera datos aleatorios según una distribución específicaObservación------Sólo uso gráfico en el caso continuo--- \]
Problema acerca de la distribución exponencial Suponga que el tiempo medio de atención en la caja de un supermercado es de 3 minutos. Encuentre la probabilidad de que un cliente al azar sea atendido en menos de 2 minutos.
Para solucionar este problema debemos considerar que R asume la siguiente forma de la distribución exponencial:
$ f(x)=e^{-x},; x0,;>0 $
Luego, con λ=3 tenemos que:
## [1] 0.9975212
## [1] 2.906723e-07
Ahora que conocemos esta premisa, responda lo siguiente:
## [1] 1
## [1] 0.9175025
Con esto podemos ver que tiene una probabilidad de 91 de que el nivel de basura aumente, como sabemos se han estado creando medidas para que esto no suceda, cada vez hay mas campañas, pero esto solamente se puede hacer con las personas, que las personas se den cuenta de estos datos de como estamos en % con la basura, ellos no saben, no estan informados, solamente piensan “es una basura no hace daño” pero si muchos piensan asi se genera mucha basura.