Variables aleatorias discretas

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

CASO

Una compañía tiene SIETE solicitantes para TRES puestos de trabajo: TRES mujeres y CUATRO hombres. Suponga que los SIETE solicitantes son igualmente calificados y que no hay preferencia para elegir su género. Sea x igual al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer,2 mujeres o 3 mujeres. (Mendenhall, Beaver, & Beaver, 2010) [Ajustado]

Objetivo

Cálculo de probabilidades

Librerías necesarias

library(gtools) # Para combinations() y permutations()
library(knitr)  # Para kable()

Combinaciones de personas

personas <- c("H1", "H2", "H3", "H4", "M1", "M2", "M3")
#personas <- c("H1", "H2", "H3","M1", "M2")
personas
## [1] "H1" "H2" "H3" "H4" "M1" "M2" "M3"
#posibles.elecciones <- combinations(5,2, personas)
#posibles.elecciones <- combinations(7,2, personas)

posibles.elecciones <- combinations(7,3, personas)
posibles.elecciones
##       [,1] [,2] [,3]
##  [1,] "H1" "H2" "H3"
##  [2,] "H1" "H2" "H4"
##  [3,] "H1" "H2" "M1"
##  [4,] "H1" "H2" "M2"
##  [5,] "H1" "H2" "M3"
##  [6,] "H1" "H3" "H4"
##  [7,] "H1" "H3" "M1"
##  [8,] "H1" "H3" "M2"
##  [9,] "H1" "H3" "M3"
## [10,] "H1" "H4" "M1"
## [11,] "H1" "H4" "M2"
## [12,] "H1" "H4" "M3"
## [13,] "H1" "M1" "M2"
## [14,] "H1" "M1" "M3"
## [15,] "H1" "M2" "M3"
## [16,] "H2" "H3" "H4"
## [17,] "H2" "H3" "M1"
## [18,] "H2" "H3" "M2"
## [19,] "H2" "H3" "M3"
## [20,] "H2" "H4" "M1"
## [21,] "H2" "H4" "M2"
## [22,] "H2" "H4" "M3"
## [23,] "H2" "M1" "M2"
## [24,] "H2" "M1" "M3"
## [25,] "H2" "M2" "M3"
## [26,] "H3" "H4" "M1"
## [27,] "H3" "H4" "M2"
## [28,] "H3" "H4" "M3"
## [29,] "H3" "M1" "M2"
## [30,] "H3" "M1" "M3"
## [31,] "H3" "M2" "M3"
## [32,] "H4" "M1" "M2"
## [33,] "H4" "M1" "M3"
## [34,] "H4" "M2" "M3"
## [35,] "M1" "M2" "M3"
  • ¿En cuantas ocasiones se puede seleccionar 0 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 1 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 2 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 3 MUJERES?

Determinando las frecuencias para cuando haya cero mujeres, una mujer o dos mujeres

Cero mujeres
n <- nrow(posibles.elecciones)

cero <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "H") & (substr(posibles.elecciones[r,3], 1,1) == "H")) {
    cero <- cero + 1
  }
}
cero 
## [1] 4
Una mujer
n <- nrow(posibles.elecciones)

una <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "H" & substr(posibles.elecciones[r,3], 1,1) == "M") |
     (substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "M" & substr(posibles.elecciones[r,3], 1,1) == "H") |
     (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "H" & substr(posibles.elecciones[r,3], 1,1) == "H")) {
    una <- una + 1
  }
}
una
## [1] 18
Dos mujeres
n <- nrow(posibles.elecciones)

dos <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "M" & substr(posibles.elecciones[r,3], 1,1) == "M") |
     (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "H" & substr(posibles.elecciones[r,3], 1,1) == "M") |
     (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "M" & substr(posibles.elecciones[r,3], 1,1) == "H")) {
    dos <- dos + 1
  }
}
dos
## [1] 12
Tres mujeres
n <- nrow(posibles.elecciones)

tres <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "M") & (substr(posibles.elecciones[r,3], 1,1) == "M")) {
    tres <- tres + 1
  }
}
tres
## [1] 1

1. Identificar los valores de x y de probabilidad de x

  • Cuánto vale n ?, 35 número total de casos en la población.
  • Se determina la frecuencia relativa frecuencia / n para cada variable aleatoria discreta.
x <- c(0,1,2,3)
prob.x <- c(cero/n , una/n, dos/n, tres/n)
#prob.x <- c(0.3, 0.6, 0.1)
prob.x
## [1] 0.11428571 0.51428571 0.34285714 0.02857143

2. Determinar valor esperado \(\sum xp(x)\)

v.e <- sum(x * prob.x)
v.e
## [1] 1.285714

3. Determinar la probabilidad acumulada \(F(X)\) de \(p(x)\)

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]), sum(prob.x[1:4]) )
prob.acum.x
## [1] 0.1142857 0.6285714 0.9714286 1.0000000

4. Determinar y visualizar la tabla de distribución

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x - \mu) ^ 2)\) \((x - \mu) ^ 2 p(x)\)
tabla <- data.frame(x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.1142857 0.1142857 0.0000000 1.6530612 0.1889213
1 0.5142857 0.6285714 0.5142857 0.0816327 0.0419825
2 0.3428571 0.9714286 0.6857143 0.5102041 0.1749271
3 0.0285714 1.0000000 0.0857143 2.9387755 0.0839650

5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

barplot(height = prob.x, names.arg = x)

6. Visualizar la gráfica de la probabilidad acumulada \(F(x)\)

plot(x,prob.acum.x, type = 'l')

7. Determinar varianza \(\sigma ^ 2 = \sum (x - \mu) ^ 2 p(x)\)

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 0.4897959

8. Determinar desviación std \(\sigma = \sqrt{\sigma^2}\)

desv.std <- sqrt(var)
desv.std
## [1] 0.6998542

Mostrando la tabla de distribucipon de la probabilidad previamente generada

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x - \mu) ^ 2)\) \((x - \mu) ^ 2 p(x)\)
kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.1142857 0.1142857 0.0000000 1.6530612 0.1889213
1 0.5142857 0.6285714 0.5142857 0.0816327 0.0419825
2 0.3428571 0.9714286 0.6857143 0.5102041 0.1749271
3 0.0285714 1.0000000 0.0857143 2.9387755 0.0839650

Probabilidades acumuladas

  • Calculando probabilidades \[F(x=0) = F(0) = p(0) \] \[F(x=1) = F(1) = \sum p(0), p(1) = p(0) + p(1)\]

\[F(x=2) = F(2) = \sum p(0), p(1), p(2) = p(0) + p(1) + p(2)\] \[F(x=3) = F(3) = \sum p(0), p(1), p(2), p(3) = p(0) + p(1) + p(2) + p(3)\]

9. ¿Cual es la probabilida para seleccionar un grupo de 1 mujer o menos?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea \(0\) y \(1\) y sumarlos o seleccionar de la probabilidad acumulada la \(F(1)\)

\[p(x\leq1) \] igual a

\[\sum p(x=0), p(x=1) = p(0) + p(1)\]

\[F(x=1)\]

  • La probabilidad de \(x\) sea \(\leq1\) es igual a la suma de las probabilidades de \(p(0) + p(1)\) o lo que es lo mismo es la probabilidad acumulada de \(F(1)\)
tabla$prob.acum.x[1+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.6285714
  • La probabilidad para seleccionar un grupo de 1 mujer o menos es 0.6285714

10. ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea menor \(1\) o seleccionar de la probabilidad acumulada la \(F(0)\) \[p(x<1) \] igual a: \[p(x\leq0) \] \[F(x=0)\]

  • La probabilidad de \(x\) sea \(\le1\) es igual a la probabilidad de que sea menor o igual que \(p(x\leq0\) o lo que es lo mismo es la probabilidad acumulada de \(F(0)\)

tabla$prob.acum.x[0+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.1142857
  • La probabilidad para no seleccionar ninguna mujer en el grupo 0.1142857

11. ¿Cuál es la probabilidad para seleccionar una o más de una persona de género mujer?

  • Significa seleccionar 1 o más personas de género mujer \[p(x\geq1) \] igual a: \[1 - p(x\leq1) \] \[1 - (\sum p(x=0), p(x=1)) = 1 - (p(0) + p(1)) \] \[1 - F(1)\]
1 - tabla$prob.acum.x[1+1] # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.3714286
  • La probabilidad para seleccionar una o más de una persona de género mujer es 0.3714286

12. ¿Cuál es la probabilidad de seleccionar mas de dos Mujeres en grupos de TRES?

  • Significa seleccionar 2 o más personas de género mujer \[p(x>2) \] igual a: \[1 - p(x\leq2) \] \[1 - (\sum p(x=0), p(x=1), p(x=2)) = 1-(p(0) + p(1) + p(2)) \] \[1 - F(2)\]
1 - tabla$prob.acum.x[1+2] # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.02857143

13. ¿Cuál es la probabilidad de seleccionar entre dos y tres personas del género mujeres en grupo de TRES?

PENDIENTE Probabilida entre 2 y 3 o sea: \[p(2)\leq x \leq(3) \] igual a:

\[p(x\leq3) - p(\leq2)\] \[F(3) - F(2)\]

tabla$prob.acum.x[3+1] - tabla$prob.acum.x[2+1]
## [1] 0.02857143