Variables aleatorias discretas

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

CASO

Una compañía tiene SIETE solicitantes para DOS puestos de trabajo: TRES mujeres y CUATRO hombres. Suponga que los SIETE solicitantes son igualmente calificados y que no hay preferencia para elegir su género. Sea x igual al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. (Mendenhall, Beaver, & Beaver, 2010)

Objetivo

Cálculo de probabilidades

Librerías necesarias

library(gtools) # Para combinations() y permutations()
library(knitr)  # Para kable()

Combinaciones de personas

personas <- c("H1", "H2", "H3", "H4", "M1", "M2", "M3")
#personas <- c("H1", "H2", "H3","M1", "M2")
personas
## [1] "H1" "H2" "H3" "H4" "M1" "M2" "M3"
#posibles.elecciones <- combinations(5,2, personas)
posibles.elecciones <- combinations(7,2, personas)

posibles.elecciones
##       [,1] [,2]
##  [1,] "H1" "H2"
##  [2,] "H1" "H3"
##  [3,] "H1" "H4"
##  [4,] "H1" "M1"
##  [5,] "H1" "M2"
##  [6,] "H1" "M3"
##  [7,] "H2" "H3"
##  [8,] "H2" "H4"
##  [9,] "H2" "M1"
## [10,] "H2" "M2"
## [11,] "H2" "M3"
## [12,] "H3" "H4"
## [13,] "H3" "M1"
## [14,] "H3" "M2"
## [15,] "H3" "M3"
## [16,] "H4" "M1"
## [17,] "H4" "M2"
## [18,] "H4" "M3"
## [19,] "M1" "M2"
## [20,] "M1" "M3"
## [21,] "M2" "M3"
  • ¿En cuantas ocasiones se puede seleccionar 0 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 1 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 2 MUJERES?

Determinando las frecuencias para cuando haya cero mujeres, una mujer o dos mujeres

Cero mujeres
n <- nrow(posibles.elecciones)

cero <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    cero <- cero + 1
  }
}
cero 
## [1] 6
Una mujer
n <- nrow(posibles.elecciones)

una <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "M") | (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    una <- una + 1
  }
}
una 
## [1] 12
Dos mujeres
n <- nrow(posibles.elecciones)

dos <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "M") ) {
    dos <- dos + 1
  }
}
dos
## [1] 3

1. Identificar los valores de x y de probabilidad de x

  • Cuánto vale n ?, 21 número total de casos en la población.
  • Se determina la frecuencia relativa frecuencia / n para cada variable aleatoria discreta.
x <- c(0,1,2)
prob.x <- c(cero/n , una/n, dos/n)
#prob.x <- c(0.3, 0.6, 0.1)
prob.x
## [1] 0.2857143 0.5714286 0.1428571

2. Determinar valor esperado \(\sum xp(x)\)

v.e <- sum(x * prob.x)
v.e
## [1] 0.8571429

3. Determinar la probabilidad acumulada \(F(X)\) de \(p(x)\)

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]))
prob.acum.x
## [1] 0.2857143 0.8571429 1.0000000

4. Determinar y visualizar la tabla de distribución

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x - \mu) ^ 2)\) \((x - \mu) ^ 2 p(x)\)
tabla <- data.frame(x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

barplot(height = prob.x, names.arg = x)

6. Visualizar la gráfica de la probabilidad acumulada \(F(x)\)

plot(x,prob.acum.x, type = 'l')

7. Determinar varianza \(\sigma ^ 2 = \sum (x - \mu) ^ 2 p(x)\)

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 0.4081633

8. Determinar desviación std \(\sigma = \sqrt{\sigma^2}\)

desv.std <- sqrt(var)
desv.std
## [1] 0.6388766

Mostrando la tabla de distribucipon de la probabilidad previamente generada

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x - \mu) ^ 2)\) \((x - \mu) ^ 2 p(x)\)
kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

9. ¿Cual es la probabilida para seleccionar un grupo de 1 mujer o menos?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea \(0\) y \(1\) y sumarlos o seleccionar de la probabilidad acumulada la \(F(1)\) \[p(x\leq1) = \sum p(x=0), p(x=1) = F(x=1)\]

  • La probabilidad de \(x\) sea \(\leq1\) es igual a la suma de las probabilidades de \(p(0) + p(1)\) o lo que es lo mismo es la probabildia acumulada de \(F(1)\)

tabla$prob.acum.x[1+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.8571429
  • La probabilida para seleccionar un grupo de 1 mujer o menos es 0.8571429

10. ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea menor \(1\) o seleccionar de la probabilidad acumulada la \(F(0)\) \[p(x<1) = p(x\leq0) = F(x=0)\]

  • La probabilidad de \(x\) sea \(\le1\) es igual a la probabilidad de que sea menor o igual que \(p(x\leq0\) o lo que es lo mismo es la probabilidad acumulada de \(F(0)\)

tabla$prob.acum.x[0+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.2857143
  • La probabilidad para no seleccionar ninguna mujer en el grupo 0.2857143

11. ¿Cuál es la probabilidad para seleccionar una o más de una persona de género mujer?

  • Significa seleccionar 1 o más personas de género mujer \[p(x\geq1) = 1 - p(x\leq1) = 1 - (\sum p(x=0), p(x=1)) = 1 - F(1)\]
1 - tabla$prob.acum.x[1+1] # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.1428571
  • La probabilidad para seleccionar una o más de una persona de género mujer es 0.1428571

12. ¿Cuál es la probabilida de seleccionar TRES mujeres en grupos de DOS?

CERO ó \(0\)