Variables aleatorias discretas

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

CASO

Una compañía tiene SIETE solicitantes para DOS puestos de trabajo: TRES mujeres y CUATRO hombres. Suponga que los SIETE solicitantes son igualmente calificados y que no hay preferencia para elegir su género. Sea x igual al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. (Mendenhall, Beaver, & Beaver, 2010)

Objetivo

°¿En cuantas ocasiones se puede seleccionar 0 MUJERES? °¿En cuantas ocasiones se puede seleccionar 1 MUJERES? °¿En cuantas ocasiones se puede seleccionar 2 MUJERES?

Cálculo de probabilidades

    1. ¿Cual es la probabilida para seleccionar un grupo de 1 mujer o menos?
    1. ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?
    1. ¿Cuál es la probabilidad para seleccionar una o más de una mujer?

Librerías necesarias

library(gtools) # Para combinations() y permutations()
library(knitr)  # Para kable()

Combinaciones de personas

personas <- c("H1", "H2", "H3", "H4", "M1", "M2", "M3")
#personas <- c("H1", "H2", "H3","M1", "M2")
personas
## [1] "H1" "H2" "H3" "H4" "M1" "M2" "M3"
#posibles.elecciones <- combinations(5,2, personas)
posibles.elecciones <- combinations(7,2, personas)

posibles.elecciones
##       [,1] [,2]
##  [1,] "H1" "H2"
##  [2,] "H1" "H3"
##  [3,] "H1" "H4"
##  [4,] "H1" "M1"
##  [5,] "H1" "M2"
##  [6,] "H1" "M3"
##  [7,] "H2" "H3"
##  [8,] "H2" "H4"
##  [9,] "H2" "M1"
## [10,] "H2" "M2"
## [11,] "H2" "M3"
## [12,] "H3" "H4"
## [13,] "H3" "M1"
## [14,] "H3" "M2"
## [15,] "H3" "M3"
## [16,] "H4" "M1"
## [17,] "H4" "M2"
## [18,] "H4" "M3"
## [19,] "M1" "M2"
## [20,] "M1" "M3"
## [21,] "M2" "M3"

Determinando las frecuencias para cuando haya cero mujeres, una mujer o dos mujeres

Cero mujeres

n <- nrow(posibles.elecciones)

cero <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    cero <- cero + 1
  }
}
cero 
## [1] 6

Una mujer

n <- nrow(posibles.elecciones)

una <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "M") | (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    una <- una + 1
  }
}
una 
## [1] 12

Dos mujeres

n <- nrow(posibles.elecciones)

dos <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "M") ) {
    dos <- dos + 1
  }
}
dos
## [1] 3

1. Identificar los valores de x y de probabilidad de x

  • Cuánto vale n ?, 21 número total de casos en la población.
  • Se determina la frecuencia relativa frecuencia / n para cada variable aleatoria discreta.
x <- c(0,1,2)
prob.x <- c(cero/n , una/n, dos/n)
#prob.x <- c(0.3, 0.6, 0.1)
prob.x
## [1] 0.2857143 0.5714286 0.1428571

2. Determinar valor esperado \(∑xp(x)\)

v.e <- sum(x * prob.x)
v.e
## [1] 0.8571429

3. Determinar la probabilidad acumulada \(F(X)\) de \(p(x)\)

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]))
prob.acum.x
## [1] 0.2857143 0.8571429 1.0000000

4. Determinar y visualizar la tabla de distribución

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x−μ)2)\) \((x−μ)2p(x)\)

tabla <- data.frame(x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

5. Visualizar la gráfica de barra de la variable aleatoria \(x\) con respecto a su probabilidad

barplot(height = prob.x, names.arg = x)

6. Visualizar la gráfica de la probabilidad acumulada \(F(x)\)

plot(x,prob.acum.x, type = 'l')

7. Determinar varianza \(σ^2=∑(x−μ)^2p(x)\)

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 0.4081633

8. Determinar desviación std \(σ=√σ^2\)

desv.std <- sqrt(var)
desv.std
## [1] 0.6388766

Mostrando la tabla de distribucipon de la probabilidad previamente generada

\(x\) \(p(x)\) \(F(x)\) \(xp(x)\) \((x−μ)2)\) \((x−μ)2p(x)\)

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

9. ¿Cual es la probabilida para seleccionar un grupo de 1 mujer o menos?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea \(0\) y \(1\) y sumarlos o seleccionar de la probabilidad acumulada la \(F(1)\)

\(p(x≤1)=∑p(x=0)\) , \(p(x=1)=F(x=1)\)

  • La probabilidad de \(x\) sea \(≤1\) es igual a la suma de las probabilidades de \(p(0)+p(1)\) o lo que es lo mismo es la probabildia acumulada de \(F(1)\)
tabla$prob.acum.x[1+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.8571429
  • La probabilida para seleccionar un grupo de 1 mujer o menos es 0.8571429

10. ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?

  • De la tabla seleccionar los valores para cuando \(p(x)\) sea menor 1 o seleccionar de la probabilidad acumulada la \(F(0)\) \(p(x<1)=p(x≤0)=F(x=0)\)

  • La probabilidad de x sea ≤1 es igual a la probabilidad de que sea menor o igual que \(p(x≤0)\) o lo que es lo mismo es la probabilidad acumulada de \(F(0)\)

tabla$prob.acum.x[0+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.2857143
  • La probabilidad para no seleccionar ninguna mujer en el grupo 0.2857143

11. ¿Cuál es la probabilidad para seleccionar una o más de una persona de género mujer?

  • Significa seleccionar 1 o más personas de género mujer

\(p(x≥1)=1−p(x≤1)=1−(∑p(x=0)\),\(p(x=1))=1−F(1)\)

1 - tabla$prob.acum.x[1+1] # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.1428571
  • La probabilidad para seleccionar una o más de una persona de género mujer es 0.1428571

12. ¿Cuál es la probabilida de seleccionar TRES mujeres en grupos de DOS?

CERO ó 0