Se quieren exportar sacos de cafe 2000 sacos, cada saco pesa 60Kg, la penalizacion en el centro de acopio se da por porcentaje de granos de cafe verde
PORCENTAJE DE GRANO VERDE
| % GRANO | Penalización |
|---|---|
| [0, 10) | 0% |
| [10, 20) | 12% |
| [20, 50) | 60% |
| [50, 100) | devolución |
Usar set.seed(‘cedula o TI’)
Usar la distribucion Beta
La muestra es de 2000 sacos
shape1 = 10 shape2 = 0.2
ASIGNACION:
Hacer histograma
Ubicar la media, mediana, Q1, Q3, P20, P80, en el mismo grafico
¿Cual de estas medidas puede ser mas representativa? (discutir)
basado en el promedio: ¿Probabilidad de que devuelvan el cafe?
basado en el mediana: ¿Probabilidad de que penalicen el 12% de los sacos?
basado en el Q1: ¿Probabilidad de que no penalicen?
basado en el Q3: ¿Probabilidad de que me penalicen con el 60%?
¿Que porcentaje de los sacos tiene a lo sumo 18% de grano verde?
¿Que porcentaje de los sacos tiene como minimo 5% de grano verde?
Hacer boxplot e identificar ¿en que parte del diagrama no se penaliza?
Si cada saco tiene un costo de recepcion $100.0000. si la penalizacion se hace por saco ¿que monto real se recibira por los 2000 sacos?
set.seed(1000066215)
x = rbeta(n = 2000, 10, 0.2 )
hist(x, main = "proporción de grano maduro en sacos de café",breaks = 150)
abline(v = mean(x), col = "blue", lwd = 4, )
text((mean(x)-0.0046),810,expression(bar(x)),col="blue", cex = 0.8)
abline(b = median(x), col="red", lwd = 4)
text((median(x)-0.004),920,expression(hat(x)),col="red", cex = 0.8)
Q_1= quantile(x,0.25)
Q_3= quantile(x,0.75)
abline(v = Q_1, col = "orange", lwd = 2)
text((Q_1+0.009),800,expression(x[q1]),col="orange", cex = 0.8)
abline(v = Q_3, col = "orange", lwd = 2)
text((Q_3+0.007),800,expression(x[q3]),col="orange", cex = 0.8)
P_20 = quantile(x,0.20)
P_80 = quantile(x,0.80)
abline(v = P_20, col = "green")
text((P_20-0.007),900,expression(x[P[20]]),col="green", cex = 0.8)
abline(v = P_80, col = "green")
text((P_80+0.007),900,expression(x[P[80]]),col="green", cex = 0.7)
La mediana, el cuartil superior y el percentil 80 son medidas representativas pues se encuentran donde estan la mayoría de los datos, por el contario las medidas alejadas de la mayoría son la media, el cuartil superior y el percentil 20.
table(x < 0.5)
##
## FALSE
## 2000
range(x)
## [1] 0.6623192 1.0000000
La probabilidad de que los sacos sean devueltos es del 0% pues todos los sacos tiene un porcentaje mayor al 66% de grano maduro Y si eligen la media como criterio tampoco hay devolución ni ninguna penalización, pues segun esta medida los sacos tienen menos del 10% de grano verde
table(x < 0.9 & x > 0.8)
##
## FALSE TRUE
## 1923 77
table(x < 0.9 & x > 0.8)/sum(table(x < 0.9 & x > 0.8))
##
## FALSE TRUE
## 0.9615 0.0385
La probabilidad de que sacos sean penalizados con un 12% es igual a 0.0385, pues 77 de los sacos tiene un porcentaje de grano verde entre 10 y 20 porciento. Si se toma la mediana como criterio para tomar la decisión, no habría ninguna penalización, pues diría que los sacos tienen menos del 10% de grano verde.
table(x > 0.9)
##
## FALSE TRUE
## 107 1893
table(x > 0.9 )/sum(table(x > 0.9 ))
##
## FALSE TRUE
## 0.0535 0.9465
La probabilidad de que no penalicen es de 0.946 pues 1893 de los sacos tienen un porcentaje de grano verde menor al 10%
Si se usara el cuartil inferior como criterio de igual manera no habría penalización pues mostraria que los sacos tienen menos del 10% de grano verde
table(x<0.8 & x > 0.5)
##
## FALSE TRUE
## 1970 30
table(x<0.8 & x > 0.5)/sum(table(x<0.8 & x > 0.5))
##
## FALSE TRUE
## 0.985 0.015
La probabilidad de que penalicen con 60% es de 0.015 pues 30 de los sacos tienen un porcentaje de grano verde entre 20 y 50%.
Si se usa como criterio el cuartil superior no habría penalización pues mostraria que los sacos tienen menos del 10% de grano verde
table(x>0.82)
##
## FALSE TRUE
## 36 1964
table(x>0.82)/sum(table(x>0.82))
##
## FALSE TRUE
## 0.018 0.982
El 98.2% de los sacos tienen a lo sumo 18% de grano verde
table(x<0.95)
##
## FALSE TRUE
## 1745 255
table(x<0.95)/sum(table(x<0.95))
##
## FALSE TRUE
## 0.8725 0.1275
12.75% de los sacos tienen un porcentaje mínimo del 5% de grano verde
boxplot(x, horizontal = T)
abline(v = 0.9 , col = "blue")
abline(v = 1 , col = "blue")
text(0.923,1.33,labels = "zona ", cex = 0.6, col = "blue")
text(0.923,1.28, labels = "de no ", cex = 0.6, col = "blue")
text(0.93,1.22,labels = "penalización", cex = 0.6, col = "blue")
precio_saco=100000
precio_full=length(x)*precio_saco
precio_60 = precio_saco*0.6*30
precio_12 = precio_saco*0.12*77
precio_r = precio_full - precio_60 - precio_12
precio_saco
## [1] 1e+05
precio_r
## [1] 197276000