Objetivo
Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.
Descripción
Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.
Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.
Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.
1. Cargar librerías
library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(gtools)
options(scipen = 999)
2. Ejercicios
- Para cada ejercicio, se describe y define el contexo.
- Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
- Se determina el valor esperado de cada ejercicio
- Se determina la varianza y la desviación estándar de la distribución de las variables discretas.
2.1. Ejercicio 1
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000 # sum(casos)
casos <- c(4950,50)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
| 0 |
4950 |
0.99 |
0.99 |
0.00 |
| 1 |
50 |
0.01 |
1.00 |
0.01 |
Valor esperado
- Se determina el valor esperado de acuerdo a la fórmula.
- VE es igual a valor esperado.
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 0.01
- El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
Varianza
- Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
| 0 |
4950 |
0.99 |
0.99 |
0.00 |
0.01 |
0.000099 |
| 1 |
50 |
0.01 |
1.00 |
0.01 |
0.01 |
0.009801 |
- varianza = varianza de la distribución
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.0099
Desviación estándard de una distribución discreta
- La raiz cuadrada de la varianza
- desv.std = desviación estándard
desv.std <- sqrt(varianza)
desv.std
## [1] 0.09949874
La tabla con las sumatorias
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")
Tabla de probabilidad con sumatorias
| 0 |
4950 |
0.99 |
0.99 |
0.00 |
0.01 |
0.000099 |
| **** |
50 |
0.01 |
**** |
0.01 |
**** |
0.009801 |
| 1 |
5000 |
1.00 |
1.99 |
0.01 |
0.02 |
0.009900 |
Gráfica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")

Gráfica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")

2.1. Ejercicio 2
Venta de autmóviles de Pelican Ford
Un vendedor llamado John Rasgdale vende la mayor cantidad de automóviles el sábado, así que desarrolló la siguiente distribución de probabilidades, en la cual se muestra la cantidad de automóviles que espera vender un sábado determinado.
- La variable discreta venta de aumóviles: 0,1,2,3,4 el sábado. Los valores de la probabilida son : 0.1,0.2,0.3,0.3,0.1, previamente definidos.
Tabla de probabilidad
discretas <- 0:4
# casos <- c(4950,50)
# n <- sum(casos)
# probabilidades <- casos / n
casos <- rep('?', 5)
probabilidades <- c(0.1, 0.2, 0.3, 0.3, 0.1)
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
| 0 |
? |
0.1 |
0.1 |
0.0 |
| 1 |
? |
0.2 |
0.3 |
0.2 |
| 2 |
? |
0.3 |
0.6 |
0.6 |
| 3 |
? |
0.3 |
0.9 |
0.9 |
| 4 |
? |
0.1 |
1.0 |
0.4 |
Valor esperado
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 2.1
- El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
Varianza
- Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
| 0 |
? |
0.1 |
0.1 |
0.0 |
2.1 |
0.441 |
| 1 |
? |
0.2 |
0.3 |
0.2 |
2.1 |
0.242 |
| 2 |
? |
0.3 |
0.6 |
0.6 |
2.1 |
0.003 |
| 3 |
? |
0.3 |
0.9 |
0.9 |
2.1 |
0.243 |
| 4 |
? |
0.1 |
1.0 |
0.4 |
2.1 |
0.361 |
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.29
Desviación estándard de una distribución discreta
desv.std <- sqrt(varianza)
desv.std
## [1] 1.135782
Gráfica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
#### Gráfica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
### 2.3. Caso Hombre y Mujeres. ##### Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y tres hombres. Suponga que los cinco solicitantes son igualmente calificados y que no hay preferencia para elegir su género. Sea x igual al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. (???) * Haciendo las combinacones * M = Mujer * H = Hombre
personas <- c("H1", "H2", "H3", "M1", "M2")
S.espacio.muestral <- combinations(n = 5, r = 2, v=personas)
S.espacio.muestral
## [,1] [,2]
## [1,] "H1" "H2"
## [2,] "H1" "H3"
## [3,] "H1" "M1"
## [4,] "H1" "M2"
## [5,] "H2" "H3"
## [6,] "H2" "M1"
## [7,] "H2" "M2"
## [8,] "H3" "M1"
## [9,] "H3" "M2"
## [10,] "M1" "M2"
Interpretacion del caso.
En el ejercicio uno el valor esperado es de 0.01 por lo que la probabilidad de ganar en una rifa de 5000 boletos con un solo boleto es muy poca, o muy improbable.
En el ejercicio 2 la variable aleatoria discreta toma el valor del numero de automóviles vendidos. Y el espacio muestral es de {0.1,2,3,4}. El valor esperado es el resultado que se estima tener, en el ejercicio 2, el valor esperado es de 2.1 por lo que se espera que un sábado normal se vendan 2 autos. Por lo que en un año se espera que se vendan 109 autos tomando en cuenta solo las ventas del sábado. Debido a que un año tiene 52 semanas y la esperanza de ventas en los sábados es de 2.1 por lo que 50*2.1 = 109.
En el ejercicio 3 la probabilidad de que no se contrate a ninguna mujer es del 30%, mientras que la probabilidad de que se contrate a una sola mujer es del 60%, y por lo tanto la probabilidad de que se contraten a dos mujeres es del 10%.