Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.
Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.
Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.
Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.
library(ggplot2)
library(stringr) # String
library(stringi) # String
library(gtools)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(gtools)
options(scipen = 999) # Notación normal
Para cada ejercicio algunos vistos en el caso 13 y otros nuevos para este caso 14, se describe y define su contexto.
Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
Se determina el valor esperado de cada ejercicio
Se determina la varianza y la desviación estándar de la distribución de las variables discretas.
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere cincuenta billetes. (Hero, n.d.)
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000 # sum(casos)
casos <- c(4950,50)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
0 | 4950 | 0.99 | 0.99 | 0.00 |
1 | 50 | 0.01 | 1.00 | 0.01 |
Se determina el valor esperado de acuerdo a la fórmula:
\(μ=∑xP(x)\)
# VE <- sum(tabla$x * tabla$f.prob.x)
VE <- sum(tabla$x.f.prob.x)
VE
## [1] 0.01
El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
Significa muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos 0.01
Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
#tabla
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | 4950 | 0.99 | 0.99 | 0.00 | 0.01 | 0.000099 |
1 | 50 | 0.01 | 1.00 | 0.01 | 0.01 | 0.009801 |
\(α^2=∑(x−μ)^2P(x)\)
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.0099
La raíz cuadrada de la varianza
\(α=\sqrt{α^2}\)
desv.std = desviación estándar
desv.std <- sqrt(varianza)
desv.std
## [1] 0.09949874
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | 4950 | 0.99 | 0.99 | 0.00 | 0.01 | 0.000099 |
1 | 50 | 0.01 | 1 | 0.01 | 0.01 | 0.009801 |
**** | 5000 | 1.00 | **** | 0.01 | **** | 0.009900 |
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
Un vendedor llamado John Rasgdale vende la mayor cantidad de automóviles el sábado, así que desarrolló la siguiente distribución de probabilidades, en la cual se muestra la cantidad de automóviles que espera vender un sábado determinado.
La variable discreta venta de automóviles: \(0,1,2,3,4\) el sábado. Los valores de la probabilidad son : \(0.1,0.2,0.3,0.3,0.1\), previamente definidos.
Ya se dan las probabilidades de tal forma que la cantidad de casos no se dispone en este ejercicio.
¿De qué tipo de distribución se trata?, variables discretas
¿Cuántos automóviles espera vender John un sábado normal?
¿Cuál es la varianza de la distribución? (Lind, Marchal, and Wathen 2015a).
discretas <- 0:4
# casos <- c(4950,50)
# n <- sum(casos)
# probabilidades <- casos / n
casos <- rep('?', 5)
probabilidades <- c(0.1, 0.2, 0.3, 0.3, 0.1)
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
0 | ? | 0.1 | 0.1 | 0.0 |
1 | ? | 0.2 | 0.3 | 0.2 |
2 | ? | 0.3 | 0.6 | 0.6 |
3 | ? | 0.3 | 0.9 | 0.9 |
4 | ? | 0.1 | 1.0 | 0.4 |
Se determina el valor esperado de acuerdo a la fórmula:
\(μ=∑x⋅P(x)\)
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 2.1
El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | ? | 0.1 | 0.1 | 0.0 | 2.1 | 0.441 |
1 | ? | 0.2 | 0.3 | 0.2 | 2.1 | 0.242 |
2 | ? | 0.3 | 0.6 | 0.6 | 2.1 | 0.003 |
3 | ? | 0.3 | 0.9 | 0.9 | 2.1 | 0.243 |
4 | ? | 0.1 | 1.0 | 0.4 | 2.1 | 0.361 |
\(α^2=∑(x−μ)^2⋅P(x)\)
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.29
La raíz cuadrada de la varianza
\(α=\sqrt{α^2}\)
desv.std = desviación estándar.
desv.std <- sqrt(varianza)
desv.std
## [1] 1.135782
#tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
#tabla.sumatorias[nrow(tabla), c(1,4,6)] <- '****'
#kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y tres hombres. Suponga que los cinco solicitantes son igualmente calificados y que no hay preferencia para elegir su género al igual que no importa el orden de género de hombres y mujeres (combinaciones).
Sea \(x\) la variable aleatoria discreta al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. (mendenhall_introduccion_2010?)
Haciendo las combinaciones en donde \(M=Mujer\) y \(H=Hombre\)
personas <- c("H1", "H2", "H3", "M1", "M2")
S.espacio.muestral <- combinations(n = 5, r = 2, v=personas)
S.espacio.muestral
## [,1] [,2]
## [1,] "H1" "H2"
## [2,] "H1" "H3"
## [3,] "H1" "M1"
## [4,] "H1" "M2"
## [5,] "H2" "H3"
## [6,] "H2" "M1"
## [7,] "H2" "M2"
## [8,] "H3" "M1"
## [9,] "H3" "M2"
## [10,] "M1" "M2"
De cuerdo al espacio muestral \(n\) con diez elementos: ¿En cuántas ocasiones hay cero mujeres? ¿En cuántas ocasiones hay una mujer? y ¿En cuántas ocasiones hay dos mujeres?
discretas <- c(0, 1, 2)
casos <- c(3, 6, 1 )
n <- sum(casos)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
0 | 3 | 0.3 | 0.3 | 0.0 |
1 | 6 | 0.6 | 0.9 | 0.6 |
2 | 1 | 0.1 | 1.0 | 0.2 |
Se determina el valor esperado de acuerdo a la fórmula:
\(μ=∑x⋅P(x)\)
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 0.8
\(α^2=∑(x−μ)^2⋅P(x)\)
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | 3 | 0.3 | 0.3 | 0.0 | 0.8 | 0.192 |
1 | 6 | 0.6 | 0.9 | 0.6 | 0.8 | 0.024 |
2 | 1 | 0.1 | 1.0 | 0.2 | 0.8 | 0.144 |
Calculando la varianza:
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.36
\(α=\sqrt{α^2}\)
Con la raíz cuadrada de la varianza se determina la desviación estándar de la distribución de variables aleatorias.
desv.std <- sqrt(varianza)
desv.std
## [1] 0.6
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
En esta práctica se presentaron varios ejercicios de Variables Aleatorias Discretas en donde se determinaron las funciones de Probabilidad y la Función Acumulada, la Media o Valor Esperado, la Varianza y sus Desviaciones Estándar. A la vez, se generaron gráficas de barras de los valores de las variables y la gráfica lineal de las tendencias.
El Valor Esperado en el ejercicio 1, del sorteo con valor de 0.01 significa que la posibilidad de ganar en el sorteo de 5000 boletos es muy remota, tratándose de una probabilidad de 1%.
En el ejercicio de Venta de Automóviles de John, se trata de una distribución de probabilidad discreta de la variable aleatoria “número de automóviles vendidos.” El valor esperado es del 2.1, lo que significa que puede esperar vender 2 automóviles.
El valor esperado aquí se utiliza para predecir la media aritmética de la cantidad de automóviles vendidos a largo plazo. Por ejemplo, si John trabaja \(50\) sábados en un año, puede esperar vender \((50)*(2.1)\) o \(105\) automóviles solamente durante los sábados. Por consiguiente, a veces la media recibe el nombre de valor esperado (Lind, Marchal, and Wathen 2015b).
El valor de la varianza es de 1.29 que significa lo que puede variar con respecto al valor esperado. La desviación estándar es de \(1.135782\).
La variación representa la posibilidad de que se vendan más o menos autos que los que se esperan vender normalmente. Por ejemplo, si la vendedora Rita Kirsch también vendió un promedio de 2.1 automóviles los sábados pero tiene tal vez una desviacón de 1.9 en comparación del 1.135782 de John, entonces se puede decir que hay mayor variabilidad en la vendedora Rita dado que \(1.91≥1.35\), lo que significa que ella tiene una mayor probabilidad de vender una cantidad diferente de autos que la de John (Lind, Marchal, and Wathen 2015b).
En el caso de las vacantes de puestos para hombres y mujeres, el resultado del valor esperado es de \(0.8\), lo que significa que la probabilidad promedio de contratar mujeres es del \(80\)%. Su desviación estándar es de \(0.6\), que significa el nivel de dispersión (alejamiento) de la probabilidad de cada variable aleatoria con respecto al valor esperado. Esto se traduce como una probabilidad del \(60\)% de que se contrate una cantidad de mujeres diferente a la que se espera originalmente.
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008b. Estadística Para Administración y Economía. 10th ed. Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur: Cengage Learning,.
———. 2008a. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,.
Hero, Course. n.d. “Variables Aleatorias - Variables Aleatorias Problemas…” https://www.coursehero.com/file/14618142/Variables-aleatorias/.
Lind, Douglas, William Marchal, and Samuel Wathen. 2015a. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill.
———. 2015b. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill.
Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.