Variables aleatorias discretas

Descripcion

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

CASO

Una compañía tiene SIETE solicitantes para DOS puestos de trabajo: TRES mujeres y CUATRO hombres. Suponga que los SIETE solicitantes son igualmente calificados y que no hay preferencia para elegir su género. Sea x igual al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. (Mendenhall, Beaver, & Beaver, 2010)

Objetivo

  • 1.- Identificar los valores de x y de probabilidad de x en la tabla de distribución mediante combinaciones…

    • ¿En cuantas ocasiones se puede seleccionar 0 MUJERES?
    • ¿En cuantas ocasiones se puede seleccionar 1 MUJERES?
    • ¿En cuantas ocasiones se puede seleccionar 2 MUJERES?
    • ¿En cuantas ocasiones se puede seleccionar 3 MUJERES?
  • 2.- Determinar valor esperado ∑xp(x)

  • 3.- Determinar la probabilidad acumulada F(X) de x

  • 4.- Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)

  • 5.- Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

  • 6.- Visualizar la gráfica de la probabilidad acumulada F(x)

  • 7.- Determinar varianza σ2=∑(x−μ)2p(x)

  • 8.- Determinar desviación std σ=σ2−−√

Calculo de probabilidades

  • 9.- ¿Cual es la probabilida para seleccionar un grupo de 1 mujer o menos?
  • 10.- ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?
  • 11.- ¿Cuál es la probabilidad para seleccionar una o más de una mujer?
  • 12.- ¿Cuál es la probabilida de seleccionar TRES mujeres en grupos de DOS?

Librerías necesarias

library(gtools) # Para combinaciones() y permutaciones()
## Warning: package 'gtools' was built under R version 3.6.3
library(knitr)  # Para kable()

Combinaciones de personas

#personas <- c("H1", "H2", "H3", "H4", "M1", "M2", "M3")
#personas <- c("H1", "H2", "H3","M1", "M2")
personas <- c("H", "H", "H", "H", "M", "M", "M")
personas
## [1] "H" "H" "H" "H" "M" "M" "M"

Posibles Elecciones

#posibles.elecciones <- combinations(5,2, personas)
posibles.elecciones <- data.frame(combinations(7,2, personas, set = FALSE))

posibles.elecciones
##    X1 X2
## 1   H  H
## 2   H  H
## 3   H  H
## 4   H  M
## 5   H  M
## 6   H  M
## 7   H  H
## 8   H  H
## 9   H  M
## 10  H  M
## 11  H  M
## 12  H  H
## 13  H  M
## 14  H  M
## 15  H  M
## 16  H  M
## 17  H  M
## 18  H  M
## 19  M  M
## 20  M  M
## 21  M  M
  • ¿En cuantas ocasiones se puede seleccionar 0 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 1 MUJERES?
  • ¿En cuantas ocasiones se puede seleccionar 2 MUJERES?

Determinando las frecuencias para cuando haya cero mujeres, una mujer o dos mujeres

Cero Mujeres

n <- nrow(posibles.elecciones)

cero <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    cero <- cero + 1
  }
}
cero 
## [1] 6

Cero Mujeres con funcion Table

tabla.cruzada <- table(posibles.elecciones)
tabla.cruzada
##    X2
## X1   H  M
##   H  6 12
##   M  0  3
cero <- tabla.cruzada[1,1]
cero
## [1] 6

Una Mujer

n <- nrow(posibles.elecciones)

una <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "H" & substr(posibles.elecciones[r,2], 1,1) == "M") | (substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "H")) {
    una <- una + 1
  }
}
una 
## [1] 12

Una Mujer con funcion Table

una <- tabla.cruzada[1,2]
una
## [1] 12

Dos Mujeres

n <- nrow(posibles.elecciones)

dos <- 0
for (r in 1:n) {
  if((substr(posibles.elecciones[r,1], 1,1) == "M" & substr(posibles.elecciones[r,2], 1,1) == "M") ) {
    dos <- dos + 1
  }
}
dos
## [1] 3

Dos Mujeres Funcion Table

dos <- tabla.cruzada[2,2]
dos
## [1] 3

1.- Identificar los valores de x y de probabilidad de x

  • Cuánto vale n ?, 21 número total de casos en la población.
  • Se determina la frecuencia relativa frecuencia / n para cada variable aleatoria discreta.
x <- c(0,1,2)
prob.x <- c(cero/n , una/n, dos/n)
#prob.x <- c(0.3, 0.6, 0.1)
prob.x
## [1] 0.2857143 0.5714286 0.1428571

2.- Determinar valor esperado ∑xp(x)

v.e <- sum(x * prob.x)
v.e
## [1] 0.8571429

3.- Determinar la probabilidad acumulada F(X) de p(x)

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]))
prob.acum.x
## [1] 0.2857143 0.8571429 1.0000000

4.- Determinar y visualizar la tabla de distribución

tabla <- data.frame(x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

5.- Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

barplot(height = prob.x, names.arg = x)

6.- Visualizar la gráfica de la probabilidad acumulada F(x)

plot(x,prob.acum.x, type = 'l')

7.- Determinar varianza σ2=∑(x−μ)2p(x)

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 0.4081633

8.- Determinar desviación std σ=σ2−−√

desv.std <- sqrt(var)
desv.std
## [1] 0.6388766

Mostrando la tabla de distribucipon de la probabilidad previamente generada

kable(tabla)
x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
0 0.2857143 0.2857143 0.0000000 0.7346939 0.2099125
1 0.5714286 0.8571429 0.5714286 0.0204082 0.0116618
2 0.1428571 1.0000000 0.2857143 1.3061224 0.1865889

9.- ¿Cual es la probabilidad para seleccionar un grupo de 1 mujer o menos?

  • De la tabla seleccionar los valores para cuando p(x) sea 0 y 1 y sumarlos o seleccionar de la probabilidad acumulada la F(1) ## p(x≤1)=∑p(x=0),p(x=1)=F(x=1)

  • La probabilidad de x sea ≤1 es igual a la suma de las probabilidades de p(0)+p(1) o lo que es lo mismo es la probabildia acumulada de F(1)

tabla$prob.acum.x[1+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.8571429
  • La probabilidad para seleccionar un grupo de 1 mujer o menos es 0.8571429

10.- ¿Cuál es la probabilidad para no seleccionar ninguna mujer en el grupo ?

  • De la tabla seleccionar los valores para cuando p(x) sea menor 1 o seleccionar de la probabilidad acumulada la F(0)

p(x<1)=p(x≤0)=F(x=0)

tabla$prob.acum.x[0+1]   # Es que el vector en R empieza en 1 y no en cero como la variable aleatoria
## [1] 0.2857143

11.- ¿Cuál es la probabilidad para seleccionar una o más de una persona de género mujer?

  • Significa seleccionar 1 o más personas de género mujer

p(x≥1)=1−p(x≤1)=1−(∑p(x=0),p(x=1))=1−F(1)

1 - tabla$prob.acum.x[1+1] 
## [1] 0.1428571

-La probabilidad para seleccionar una o más de una persona de género mujer es 0.1428571

12.- ¿Cuál es la probabilida de seleccionar TRES mujeres en grupos de DOS?

CERO