Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas y visualización gráficas relacionados con variables discretas.
Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.
Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 14 encontrados en la literatura.
library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
library(knitr)
Ejercicio sacado de: (https://www.vadenumeros.es/sociales/variable-aleatoria-discreta.htm)
Lanzamos un dado perfecto 240 veces, anotamos el resultado obtenido en la cara superior obteniendo los siguientes resultados: 40, 39, 42, 38, 42, 39. Las probabilidades de que le primer tiro sea 2 y los demas tiros sean 4 y 6.
lanzadas <- c(1,2,3,4,5,6)
n <- 240
resultados <- c(40, 39, 42, 38, 42, 39)
probabilidades <- resultados / n
acumulada <- cumsum(probabilidades)
tabla <- data.frame(x=lanzadas,
resultados = resultados,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x resultados f.prob.x F.acum.x
## 1 1 40 0.1666667 0.1666667
## 2 2 39 0.1625000 0.3291667
## 3 3 42 0.1750000 0.5041667
## 4 4 38 0.1583333 0.6625000
## 5 5 42 0.1750000 0.8375000
## 6 6 39 0.1625000 1.0000000
Las probabilidades de que el primer tiro sea 2 es de 0.16%
La probabilidad de que los demas tiros sean 4 y 6 son de 0.31%
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
ejercicio sacado de (https://rpubs.com/rpizarro/686538)
Las ventas de automóviles de una empresa durante los últimos 300 días de operación, los datos de ventas muestran que hubo:
80 días en los que se vendieron 2 automóviles.
200 días en los que se vendieron 3 automóviles.
49 días en los que se vendieron 5 automóviles.
72 días en los que se vendieron 8 automóviles.
50 días en los que se vendieron 1 automóviles.
14 días en los que se vendieron 10 automóviles.
discretas <- c(2,3,5,8,1,10)
n <- 300
casos <- c(80, 200, 49, 72, 50, 12)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades)
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 2 80 0.2666667 0.2666667
## 2 3 200 0.6666667 0.9333333
## 3 5 49 0.1633333 1.0966667
## 4 8 72 0.2400000 1.3366667
## 5 1 50 0.1666667 1.5033333
## 6 10 12 0.0400000 1.5433333
La probabilidad de que se venda exactamente 5 automoviles es: 0.16%
La probabilidad de que se venda 3 automóviles es: 0.66%
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
En Estados Unidos un porcentaje de los niños de cuarto grado no pueden leer un libro adecuado a su edad. La tabla siguiente muestra, de acuerdo con las edades de entre 6 y 14 años, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.(Anderson et al., 2008)
discretas <- 6:14
n <- 1000000
casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)
n <- sum(casos)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades)
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 6 37369 0.01848875 0.01848875
## 2 7 87436 0.04325998 0.06174874
## 3 8 160840 0.07957747 0.14132621
## 4 9 239719 0.11860378 0.25992999
## 5 10 286719 0.14185758 0.40178757
## 6 11 306533 0.15166079 0.55344837
## 7 12 310787 0.15376551 0.70721387
## 8 13 302604 0.14971687 0.85693075
## 9 14 289168 0.14306925 1.00000000
La probabilidad de elegir alumnos que tienen problemas de exactamente 13 años es 14.97%
La probabilidad de encontrar alumnos por de 7 años o menos es de 61.73%
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
3.7.1 Que sea exactamente igual a un valor de variable aleatoria:
La probabilidad de que se venda 3 automóviles es: 0.66%.
3.7.2 Qué sea menor o igual:
La probabilidad de que se venda exactamente 5 automoviles es de 0.16%.
3.7.3 Que sea mayor o igual:
La probabilidad de encontrar alumnos por de 7 años o menos es de 61.73%.
3.7.4 Alguna otra pregunta del caso.
Ninguna