1 Paquetes

En R podemos encontrar diversas funciones para ello:

expand.grid en el paquete base de R.
combn en el paquete combinat.

2 Funciones

Para nuestros cálculos, utilizaremos la función expand.grid. En este caso, creamos la siguientes CINCO funcione: tosscoin(n), rolldie(n), isin(), urnsamples() y nsamp(). Se describirán a continuación.

2.0.1 Función `tosscoin(n)`

La idea de esta función es generar el espacio muestral de lanzar una moneda exactamente $n$ veces, con valores cara (H) y sello (T):

tosscoin <- function(n) {
  df <- expand.grid(replicate(n, c("H", "T"), simplify = FALSE),
              KEEP.OUT.ATTRS = FALSE,
              stringsAsFactors = FALSE)
  
  names(df) <- paste0("X", seq_len(n))
  return(df)
}

2.0.2 Función `rolldie(n)`

Con ella se genera el espacio muestral al lanzar un dado exactamente $n$ veces, con valores de 1 a 6 por lanzamiento.

rolldie <- function(n, sides = 6, makespace = FALSE) {
  df <- expand.grid(replicate(n, 1:sides, simplify = FALSE),
                    KEEP.OUT.ATTRS = FALSE)
  names(df) <- paste0("X", seq_len(n))
  
  if (makespace) {
    df$prob <- rep(1 / nrow(df), nrow(df))  # Agrega la columna de probabilidad
  }
  
  return(df)
}

NOTA: En esta función, makespace = TRUE agregará una columna de probabilidades (prob = 1/n) al espacio muestral, para convertirlo en un “objeto tipo espacio de probabilidad”.

2.0.3 Función `isin()`

Con ella se verifica si ciertos valores están presentes en cada fila de una matriz o data frame. Se puede usar con o sin tener en cuenta el orden.

isin <- function(x, table, ordered = FALSE) {
  # Si x es un vector, lo convertimos en una matriz con una sola fila
  if (is.vector(x)) {
    x <- matrix(x, nrow = 1)
  }
  
  # Validación
  if (!is.data.frame(x) && !is.matrix(x)) stop("x debe ser un vector, data.frame o matriz")

  # Aplicar fila por fila
  apply(x, 1, function(row) {
    row_vals <- as.character(row)
    tab_vals <- as.character(table)

    if (ordered) {
      # Buscar subsecuencia exacta
      len_row <- length(row_vals)
      len_tab <- length(tab_vals)
      if (len_tab > len_row) return(FALSE)
      for (i in 1:(len_row - len_tab + 1)) {
        if (all(row_vals[i:(i + len_tab - 1)] == tab_vals)) return(TRUE)
      }
      return(FALSE)
    } else {
      # Verificar si todos los valores de 'table' están presentes (sin importar orden)
      all(tab_vals %in% row_vals)
    }
  })
}

2.0.4 Función `urnsamples()`

Esta función genera todas las muestras posibles de una urna según estos cuatro escenarios:

x: Representa la urna desde la cual se va a hacer el muestreo.
size: Tamaño de la muestra.
replace: TRUE, si es con reemplazo; y FALSE, sin reemplazo.
ordered: TRUE, si es con orden; y FALSE, sin orden.

urnsamples <- function(x, size, ordered = TRUE, replace = FALSE) {
  if (ordered) {
    # Producto cartesiano
    expand.grid(replicate(size, x, simplify = FALSE),
                KEEP.OUT.ATTRS = FALSE)
  } else {
    # Combinaciones sin orden
    combn(x, size, simplify = FALSE) |>
      do.call(what = rbind)
  }
}

2.0.5 Función `nsamp()`

Esta función calcula cuántas formas distintas hay de tomar $k$ elementos de una población de n elementos, bajo distintas condiciones:

n: Tamaño de la población (elementos disponibles).
k: Tamaño de la muestra-
replace = FALSE: Sin reemplazo (sin repetir elementos).
ordered = TRUE: Orden importa (permuta, no combina).

nsamp <- function(n, k, replace = FALSE, ordered = TRUE) {
  if (ordered) {
    if (replace) {
      return(n^k)  # Producto cartesiano con repetición
    } else {
      return(factorial(n) / factorial(n - k))  # Permutaciones sin repetición
    }
  } else {
    if (replace) {
      return(choose(n + k - 1, k))  # Combinaciones con repetición
    } else {
      return(choose(n, k))  # Combinaciones sin repetición
    }
  }
}

3 Probabilidad clásica

Sea $\Omega \ne \emptyset$ un espacio muestral finito y supongamos que todos los eventos elementales suceden con la misma probabilidad. Entonces, para cada evento $A$ de $\Omega$: \[P(A)\;= \; \frac{\mbox{Número de elementos de $A$}}{\mbox{Número de elementos de $\Omega$}}\]

4 Propiedades

Para eventos $A$, $B$, $C$ de un espacio muestral $\Omega \ne \emptyset$ se tiene:

$0 \leq P(A)\leq 1$.
$P(\emptyset)=0$.
$P(\Omega)=1$.
Propiedad del complemento: Si $\overline{A}$ es el complemento de $A$, entonces, \[P(\overline {A})= 1- P(A)\]
Teorema de la partición de un conjunto: \[P(A)= P(A\cap B) + P(A\cap \overline{B})\] \[P(B)= P(A\cap B) + P(B\cap \overline{A})\]
Teorema de adición para 2 eventos mutuamente excluyentes (es decir, eventos con intersección vacía): \[P(A\cup B)= P(A) + P(B)\]
Teorema de adición para 2 eventos (no necesariamente mutuamente excluyentes): \[P(A\cup B)= P(A) + P(B) - P(A\cap B)\]
Teorema de adición para 3 eventos mutuamente excluyentes (es decir, eventos con intersección vacía, dos a dos): \[P(A \cup B \cup C) = P(A) + P(B) + P(C)\]
Teorema de adición para 3 eventos (no necesariamente mutuamente excluyentes): \[P(A\cup B\cup C)= P(A) + P(B) + P(C)- P(A\cap B) - P(A\cap C) - P(B\cap C) + P(A\cap B\cap C)\]

5 Ejemplos (dados)

5.1 Ejemplo 1: Con orden

Supongamos que un dado se lanza 3 veces. Hallaremos la probabilidad de que salga el 2 delante del 1. Nuestro espacio muestral está dado por:

Omega <- rolldie(3); head(Omega)    #A) Espacio muestral

##   X1 X2 X3
## 1  1  1  1
## 2  2  1  1
## 3  3  1  1
## 4  4  1  1
## 5  5  1  1
## 6  6  1  1

Y el evento de interés:

A <- subset(Omega, isin(Omega, c(2, 1), ordered = TRUE)); A   #B) Evento

##     X1 X2 X3
## 2    2  1  1
## 7    1  2  1
## 8    2  2  1
## 9    3  2  1
## 10   4  2  1
## 11   5  2  1
## 12   6  2  1
## 38   2  1  2
## 74   2  1  3
## 110  2  1  4
## 146  2  1  5
## 182  2  1  6

Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene $w= \#\Omega =216$ elementos, la muestra es de tamaño $n=3$ y el evento $A$ tiene $a=\#A=16$ elementos.

w <- nrow(Omega)    #C) Tamaño del espacio muestral
n <- dim(Omega)[2]  #D) Tamaño de la muestra 
di<- dim(Omega)     #E) Tamaño del espacio muestral y de la muestra
a <- nrow(A)        #F) Tamaño del evento

Por consiguiente, la probablidad pedida es \[P(A)=\frac{16}{216}=0.074\]

a/w      #F) Probabilidad pedida

## [1] 0.05555556

Al lanzar 3 veces un dado, la probabilidad de que salga el 2 delante del 1 es aproximadamente 0.074.

5.2 Ejemplo 2: Sin orden

Supongamos que un dado se lanza 3 veces. Hallaremos la probabilidad de que salga el 1 y el 2. En este caso, el espacio muestral es:

Omega <- rolldie(3); head(Omega)     #A) Espacio muestral

##   X1 X2 X3
## 1  1  1  1
## 2  2  1  1
## 3  3  1  1
## 4  4  1  1
## 5  5  1  1
## 6  6  1  1

Y el evento de interés:

B <- subset(Omega, isin(Omega, c(2, 1), ordered = FALSE)); B   #B) Evento

##     X1 X2 X3
## 2    2  1  1
## 7    1  2  1
## 8    2  2  1
## 9    3  2  1
## 10   4  2  1
## 11   5  2  1
## 12   6  2  1
## 14   2  3  1
## 20   2  4  1
## 26   2  5  1
## 32   2  6  1
## 37   1  1  2
## 38   2  1  2
## 39   3  1  2
## 40   4  1  2
## 41   5  1  2
## 42   6  1  2
## 43   1  2  2
## 49   1  3  2
## 55   1  4  2
## 61   1  5  2
## 67   1  6  2
## 74   2  1  3
## 79   1  2  3
## 110  2  1  4
## 115  1  2  4
## 146  2  1  5
## 151  1  2  5
## 182  2  1  6
## 187  1  2  6

Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene $w= \#\Omega =216$ elementos, la muestra es de tamaño $n=3$ y el evento $B$ tiene $b=\#B=30$ elementos.

w <- nrow(Omega)    #C) Tamaño del espacio muestral
n <- dim(Omega)[2]  #D) Tamaño de la muestra 
di<- dim(Omega)     #E) Tamaño del espacio muestral y de la muestra
b <- nrow(B)        #F) Tamaño del evento

Por lo tanto, la probabilidad pedida es \[P(B)=\frac{30}{216}=0.139\]

b/w

## [1] 0.1388889

Al lanzar 3 veces un dado, la probabilidad de que salga el 1 y el 2 es aproximadamente 0.139.

6 Ejemplos (monedas)

6.1 Ejemplo 3: Dos caras

Una moneda no falsa se lanza 3 veces. Hallaremos la probabilidad de que salgan por lo menos 2 caras (H). El espacio muestral y su tamaño son:

Omega<- tosscoin(4); Omega           #A) Espacio muestral

##    X1 X2 X3 X4
## 1   H  H  H  H
## 2   T  H  H  H
## 3   H  T  H  H
## 4   T  T  H  H
## 5   H  H  T  H
## 6   T  H  T  H
## 7   H  T  T  H
## 8   T  T  T  H
## 9   H  H  H  T
## 10  T  H  H  T
## 11  H  T  H  T
## 12  T  T  H  T
## 13  H  H  T  T
## 14  T  H  T  T
## 15  H  T  T  T
## 16  T  T  T  T

El evento de que salgan por lo menos 2 caras (H) es:

C <- subset(Omega, isin(Omega, c("H", "H"), ordered = FALSE)); C   #B) Evento

##    X1 X2 X3 X4
## 1   H  H  H  H
## 2   T  H  H  H
## 3   H  T  H  H
## 4   T  T  H  H
## 5   H  H  T  H
## 6   T  H  T  H
## 7   H  T  T  H
## 8   T  T  T  H
## 9   H  H  H  T
## 10  T  H  H  T
## 11  H  T  H  T
## 12  T  T  H  T
## 13  H  H  T  T
## 14  T  H  T  T
## 15  H  T  T  T

Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene $w= \#\Omega =16$ elementos, la muestra es de tamaño $n=4$ y el evento $C$ tiene $c=\#C=11$ elementos.

w <- nrow(Omega)    #C) Tamaño del espacio muestral
n <- dim(Omega)[2]  #D) Tamaño de la muestra 
di<- dim(Omega)     #E) Tamaño del espacio muestral y de la muestra
c <- nrow(C)        #F) Tamaño del evento

Entonces, la probabilidad de que salgan por lo menos 2 caras (H) es: \[P(C)=\frac{11}{16}=0.6875\]

c/w

## [1] 0.9375

Al lanzar 4 veces una moneda no falsa, la probabilidad de que salgan por lo menos 2 caras (H) es aproximadamente 0.6875.

6.2 Ejemplo 4: Tres caras

Una moneda no falsa se lanza 4 veces. Hallaremos la probabilidad de que salgan por lo menos 3 caras (H). El espacio muestral es:

Omega<- tosscoin(4); Omega           #A) Espacio muestral

##    X1 X2 X3 X4
## 1   H  H  H  H
## 2   T  H  H  H
## 3   H  T  H  H
## 4   T  T  H  H
## 5   H  H  T  H
## 6   T  H  T  H
## 7   H  T  T  H
## 8   T  T  T  H
## 9   H  H  H  T
## 10  T  H  H  T
## 11  H  T  H  T
## 12  T  T  H  T
## 13  H  H  T  T
## 14  T  H  T  T
## 15  H  T  T  T
## 16  T  T  T  T

El evento de que salgan por lo menos 3 caras (H):

D <- subset(Omega, isin(Omega, c("H", "H", "H"), ordered = TRUE)); D   #B) Evento

##   X1 X2 X3 X4
## 1  H  H  H  H
## 2  T  H  H  H
## 9  H  H  H  T

Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene $w= \#\Omega =16$ elementos, la muestra es de tamaño $n=4$ y el evento $C$ tiene $d=\#D=5$ elementos.

w <- nrow(Omega)    #C) Tamaño del espacio muestral
n <- dim(Omega)[2]  #D) Tamaño de la muestra 
di<- dim(Omega)     #E) Tamaño del espacio muestral y de la muestra
d <- nrow(D)        #F) Tamaño del evento

Entonces, la probabilidad de que salgan por lo menos 3 caras (H) es: \[P(D)=\frac{5}{16}=0.3125\]

d/w

## [1] 0.1875

Al lanzar 4 veces una moneda no falsa, la probabilidad de que salgan por lo menos 2 caras (H) es aproximadamente 0.3125.

7 Ejemplos (con base de datos)

7.1 Ejemplo 5: El data frame

Los siguientes datos representan los resultados obtenidos al realizar una encuesta a 400 estudiantes universitarios. En este documento, se importará la base de datos desde una dirección web (dos opciones):

Opción A (web, desde github): Para esta opción, se necesita cargar la librería “repmis”:

library(repmis)
source_data("https://github.com/hllinas/DatosPublicos/blob/main/Estudiantes.Rdata?raw=false")
datosCompleto <- Estudiantes

Opción B (web, desde Google Drive):

url.dat<- "http://bit.ly/Database-Estudiantes"
datosCompleto <- read.delim(url.dat)

Recuérdense las otras opciones, si tienen las bases de datos descargadas en su sesión de trabajo (ya sea en extensiones en Rdata, en excel o en otros formatos). Para más detalles, véase el documento R básico. A manera de ejemplo:

Opción C (local, con archivo en Rdata):

load(file="Estudiantes.Rdata")
datosCompleto <- Estudiantes

Opción D (local, con archivo en excel):

datosCompleto <- read.delim('clipboard')

El objetivo es utilizar esta información para calcular probabilidades clásicas. Es decir, probablidades de la forma: \[P(A)\;= \; \frac{\mbox{Número de elementos de $A$}}{\mbox{Número de elementos de $\Omega$}}\]

7.2 Ejemplo 5: Enunciado

Considere solamente las primeras 100 observaciones. Supongamos que se seleccionan cuatro estudiantes al azar.

a) Defina como "datos" al data frame con las 100 primeras observaciones y verifique su tamaño.
b) Defina como "Sexo" al objeto que represente el sexo de los estudiantes. Conviértalo en factor.
c) Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.  
d) ¿Cuál es la probabilidad de seleccionar dos mujeres y dos hombres?
e) Si seleccionan de uno en uno, ¿cuál es la probabilidad de que las dos primeras personas 
   seleccionadas sean mujeres y las dos últimas, hombres. 
f) ¿Cuál es la probabilidad de seleccionar cuatro mujeres?
g) ¿Cuál es la probabilidad de seleccionar tres hombres?   
h) ¿Cuál es la probabilidad de seleccionar cuatro mujeres y tres hombres?
i) ¿Cuál es la probabilidad de seleccionar cuatro mujeres o tres hombres?
j) ¿Cuál es la probabilidad de que no seleccionemos hombres?
k) ¿Cuál es la probabilidad de que seleccionemos un hombre?  
l) ¿Cuál es la probabilidad de que seleccionemos dos hombres? 
m) ¿Cuál es la probabilidad de seleccionar máximo dos hombres? 
n) ¿Cuál es la probabilidad de seleccionar al menos tres hombres?
o) ¿Cuál es la probabilidad de seleccionar máximo dos mujeres? 
p) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los tres
   primeros estudiantes seleccionados sean mujeres y el último, un hombre?
q) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos
   primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer? 
r) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los cuatro estudiantes 
   seleccionados sean mujeres?
s) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes    seleccionados sean mujeres?

7.3 Solución del ejemplo 5

7.3.1 Solución parte (a)

Filtramos y definimos como “datos” al data frame con las 100 primeras observaciones:

datos <- datosCompleto[1:100,]    #A) La nueva base de datos

El número de observaciones es 100 y se obtiene así:

nrow(datos)                       #B) Número de observaciones

## [1] 100

7.3.2 Solución parte (b)

Definimos la variable categórica y revisamos sus niveles:

Sexo <- as.factor(datos$Sexo)    #C) La variable
levels(Sexo)                     #D) Sus niveles

## [1] "Femenino"  "Masculino"

7.3.3 Solución parte (c)

La tabla de frecuencia es:

Cuentas <- table(Sexo); Cuentas         #F) Tabla de frecuencia

## Sexo
##  Femenino Masculino 
##        49        51

Observamos que, en la muestra de 100, hay 49 mujeres y 51 hombres.

El diagrama de barras:

barplot(Cuentas, main="Diagrama de barras", xlab="Sexo", ylab="Frecuencias", legend = rownames(Cuentas), col=c("pink","blue"),  ylim = c(0, 80))

7.3.4 Solución parte (d)

Nos piden hallar la probabilidad de seleccionar dos mujeres y dos hombres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica. Tenemos:

w <- choose(100, 4); w            #G) Tamaño del espacio muestral

## [1] 3921225

Mujer <- choose(49, 2); Mujer     #H) Combinaciones de las mujeres

## [1] 1176

Hombre <- choose(51,2); Hombre    #I) Combinaciones de los hombres

## [1] 1275

La probabilidad de seleccionar dos mujeres y dos hombres es \[P(A)= \frac{(1176)(1275)}{3921225}= 0.3824\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{(1176)(1275)}{3921225}= 0.3824$$

Probabilidad_d <- (Mujer * Hombre)/w; Probabilidad_d   #J) Probabilidad pedida

## [1] 0.3823805

7.3.5 Solución parte (e)

Ahora se seleccionan de uno en uno. Nos piden hallar la probabilidad de que las dos primeras personas seleccionadas sean mujeres y las dos últimas, hombres. Como interesa el orden, utilizaremos permutaciones sin repetición de $n$ objetos tomados de $k$ en $k$ (puede verse el punto 2 de la sección 3.0.1 en Rpubs):

w <- factorial(100)/factorial(100-4); w       #K) Tamaño del espacio muestral

## [1] 94109400

Mujer <- factorial(49)/factorial(49-2); Mujer         #L) Permutaciones de las mujeres

## [1] 2352

Hombre <- factorial(51)/factorial(51-2); Hombre       #M) Permutaciones de los hombres

## [1] 2550

La probabilidad de que las dos primeras personas seleccionadas sean mujeres y las dos últimas, hombres, es \[P(A)= \frac{(2352)(2550)}{94109400}=0.0637\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{(2352)(2550)}{94109400}=0.0637$$

Probabilidad_e <- (Mujer * Hombre)/w; Probabilidad_e   #N) Probabilidad pedida

## [1] 0.06373008

7.3.6 Solución parte (f)

Nos piden hallar la probabilidad de seleccionar cuatro mujeres. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:

w <- choose(100, 4); w    #O) Tamaño del espacio muestral

## [1] 3921225

Mujer <- choose(49, 4); Mujer     #P) Combinaciones de las mujeres

## [1] 211876

La probabilidad de seleccionar cuatro mujeres es \[P(A)= \frac{211876}{3921225}=0.054\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{211876}{3921225}=0.054$$

Probabilidad_f <- Mujer/w; Probabilidad_f   #Q) Probabilidad pedida

## [1] 0.05403311

7.3.7 Solución parte (g)

Nos piden hallar la probabilidad de seleccionar tres hombres. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:

w <- choose(100, 4); w    #R) Tamaño del espacio muestral

## [1] 3921225

Hombre <- choose(51,3); Hombre    #S) Combinaciones de los hombres

## [1] 20825

Mujer <- choose(49, 1); Mujer     #T) Combinaciones de las mujeres

## [1] 49

La probabilidad de seleccionar tres hombres es \[P(A)= \frac{(20825)(49)}{3921225}=0.2602\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{(20825)(49)}{3921225}=0.2602$$

Probabilidad_g <- (Hombre * Mujer)/w; Probabilidad_g   #U) Probabilidad pedida

## [1] 0.2602312

7.3.8 Solución parte (h)

La probabilidad de seleccionar cuatro mujeres y tres hombres es 0, ya que los eventos “seleccionar cuatro mujeres” y “seleccionar tres hombres” son disyuntos (intersecciones vacías):

Probabilidad_h <- 0;  Probabilidad_h   #V) Prob. pedida

## [1] 0

7.3.9 Solución parte (i)

Nos piden hallar la probabilidad de seleccionar cuatro mujeres o tres hombres. Por el inciso (h), la probabilidad de la intersección de los eventos “seleccionar cuatro mujeres” y “seleccionar tres hombres” es cero. Por esta razón, se aplicará el teorema de adición para dos eventos (inciso (f) de la sección 3): \[P(A\cup B)= P(A) + P(B)\]

De los resultados encontrados en los incisos (f) y (g), la probabilidad de seleccionar cuatro mujeres o tres hombres es: \[P(A) = 0.0540 + 0.2602 = 0.3142\]

El código para escribir la expresión anterior es:

$$P(A) = 0.0540 + 0.2602 = 0.3142$$

Probabilidad_i <- Probabilidad_f +Probabilidad_g; Probabilidad_i  #U) Prob. pedida

## [1] 0.3142643

7.3.10 Solución parte (j)

Nos piden hallar la probabilidad de que no seleccionemos hombres. Entonces, si no se seleccionan hombres, entonces, hemos seleccionado cuatro mujeres. Por lo tanto, por la parte (f), la probabilidad de que no seleccionemos hombres es 0.0540.

Probabilidad_j <- Probabilidad_f; Probabilidad_j   #A) Probabilidad pedida

## [1] 0.05403311

7.3.11 Solución parte (k)

Nos piden hallar la probabilidad de que seleccionemos un hombre. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:

w <- choose(100, 4); w    #B) Tamaño del espacio muestral

## [1] 3921225

Hombre <- choose(51,1); Hombre    #C) Combinaciones de los hombres

## [1] 51

Mujer <- choose(49, 3); Mujer     #D) Combinaciones de las mujeres

## [1] 18424

La probabilidad de seleccionar un hombre es \[P(A)= \frac{(51)(18424)}{3921225}=0.2396\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{(51)(18424)}{3921225}=0.2396$$

Probabilidad_k <- (Hombre * Mujer)/w; Probabilidad_k   #E) Probabilidad pedida

## [1] 0.2396251

7.3.12 Solución parte (l)

Nos piden hallar la probabilidad de que seleccionemos dos hombres. Entonces, al seleccionar dos hombres, también estaremos seleccionando dos mujeres. Por lo tanto, por la parte (d), la probabilidad de que seleccionemos dos hombres es 0.3824.

Probabilidad_l <- Probabilidad_d; Probabilidad_l   #F) Probabilidad pedida

## [1] 0.3823805

7.3.13 Solución parte (m)

Nos piden hallar la probabilidad de seleccionar máximo dos hombres. Para ello, solo debemos sumar las probabilidades de seleccionar 0, 1 y 2 hombres. Entonces, por las partes (j), (k) y (l), tenemos que \[P(A) = 0.0540 + 0.2396 + 0.3824 = 0.6760\]

El código para escribir la expresión anterior es:

$$P(A) = 0.0540 + 0.2396 + 0.3824  = 0.6760$$

Probabilidad_m <- Probabilidad_j + Probabilidad_k + Probabilidad_l; Probabilidad_m   #G) Probabilidad pedida

## [1] 0.6760387

7.3.14 Solución parte (n)

Nos piden hallar la probabilidad de seleccionar al menos tres hombres. Observe que el evento “seleccionar al menos tres hombres” es el complemento del evento “seleccionar máximo dos hombres”. Por lo tanto, por la parte (m), la probabilidad pedida es: \[P(\overline {A})= 1- P(A) = 1 - 0.6760 = 0.3239\]

El código para escribir la expresión anterior es:

$$P(\overline {A})= 1- P(A) = 1 - 0.6760 = 0.3239$$

Probabilidad_n <- 1 - Probabilidad_m;  Probabilidad_n   #H) Probabilidad pedida

## [1] 0.3239613

7.3.15 Solución parte (o)

Nos piden hallar la probabilidad de seleccionar máximo dos mujeres. El evento “seleccionar máximo dos mujeres” es el complemento del evento “seleccionar al menos tres mujeres”. Y la probabilidad de este evento (“seleccionar al menos tres mujeres”) es igual a la suma de las probabilidades halladas en las partes (f) y (k). Por lo tanto, utilizando la propiedad del complemento (inciso (d) de la sección 3), la probabilidad pedida es: 0.7064.

Probabilidad_o <- 1- (Probabilidad_f + Probabilidad_k); Probabilidad_o   #I) Probabilidad pedida

## [1] 0.7063418

7.3.16 Solución parte (p)

Ahora, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último, un hombre. En este caso, utilizaremos permutaciones sin repetición de $n$ objetos tomados de $k$ en $k$ (puede verse el punto 2 de la sección 3.0.1 en Rpubs):

w <- factorial(100)/factorial(100-4); w       #K) Tamaño del espacio muestral

## [1] 94109400

Mujer <- factorial(49)/factorial(49-3); Mujer         #L) Permutaciones de las mujeres

## [1] 110544

Hombre <- factorial(51)/factorial(51-1); Hombre       #M) Permutaciones de los hombres

## [1] 51

La probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último, un hombre, es \[P(A)= \frac{(110544)(51)}{94109400}=0.0599\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{(110544)(51)}{94109400}=0.0599$$

Probabilidad_p <- (Mujer * Hombre)/w; Probabilidad_p   #N) Probabilidad pedida

## [1] 0.05990628

7.3.17 Solución parte (q)

Nuevamente, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer. Basicamente, en este inciso, se pide la misma probabilidad formulada en (p). Por lo tanto, la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer es 0.0599.

Probabilidad_q <- Probabilidad_p; Probabilidad_q     #O) Probabilidad pedida

## [1] 0.05990628

7.3.18 Solución parte (r)

Otra vez, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los cuatro estudiantes seleccionados sean mujeres. Utilizaremos permutaciones sin repetición de $n$ objetos tomados de $k$ en $k$ (puede verse el punto 2 de la sección 3.0.1 en Rpubs):

w <- factorial(100)/factorial(100-4); w       #P) Tamaño del espacio muestral

## [1] 94109400

Mujer <- factorial(49)/factorial(49-4); Mujer         #Q) Permutaciones de las mujeres

## [1] 5085024

La probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último un hombre es \[P(A)= \frac{5085024}{94109400}=0.0540\]

El código para escribir la expresión anterior es:

$$P(A)= \frac{5085024}{94109400}=0.0540$$

Probabilidad_r <- Mujer/w; Probabilidad_r         #R) Probabilidad pedida

## [1] 0.05403311

7.3.19 Solución parte (s)

Nuevamente, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres. Como en la dos primeras selecciones aparecen las mujeres, entonces, para en las dos últimas dos posiciones pueden ocurrir alguno de los eventos siguientes:

“Seleccionar dos hombres”: que es la situación en (e).
“Seleccionar primero una mujer y luego un hombre”: que es la situación en (p).
“Seleccionar primero un hombre y luego una mujer”: que es la situación en (q).
“Seleccionar dos mujeres”: que es la situación en (r).

Por esta razón, la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres es la suma de aquéllas halladas en esos incisos. Es decir, \[P(A) \; =\; 0.0637 + 0.0599 + 0.0599 + 0.0540 \; =\; 0.2376\]

El código para escribir la expresión anterior es:

$$P(A) \; =\;  0.0637 + 0.0599 + 0.0599 + 0.0540 \; =\; 0.2376$$

Probabilidad_s <- Probabilidad_e + Probabilidad_p + Probabilidad_q + Probabilidad_r   #S) Cálculo 
Probabilidad_s   #T) El valor de la probabilidad

## [1] 0.2375758

8 Ejemplos (asociación de los temas con la realidad)

Ejemplo 1 (Baloto)

Baloto es un juego novedoso de tipo loto en línea, de suerte y azar, donde el jugador, por 5.700 pesos, apuesta por un acumulado multimillonario eligiendo, de uno en uno, 5 números del 1 al 43 (sin repetición) y una súper balota con números del 1 al 16 a través de una terminal de venta.

El objetivo es determinar el número de posibilidades que tenemos en sacar las 6 balotas con las condiciones descritas anteriormente.

Solución.

Se deben escoger 6 números. Entonces:

Para el primer número, hay 43 opciones de elegir un número.
Para el segundo número, hay 42 opciones de escogencia, porque no pueden repetirse.
Para el tercer número, hay 41 opciones.
Para el cuarto, hay 40 opciones.
Para el quinto, hay 39 opciones.
Para el sexto 16 opciones.

Para conocer el número total de opciones se aplica el teorema fundamental del conteo: se multiplican las opciones por cada número. Es decir:

\[43 \cdot 42\cdot 41\cdot 40\cdot 39\cdot 16 \;=\; 1.848´188.160\]

Este resultado corresponde al número de casos posibles, el cual es muy grande, ya que debe seleccionar uno de esa cantidad. La probabilidad de ganarse el baloto es

\[P(\mbox{ganar el baloto}) = \frac{1}{1.848´188.160} = 5.410705\; \times\; 10^{-10} = 0.0005410705\]

Es una probabilidad muy pequeña, lo que muestra que es difícil ganarse el baloto, pero…. la esperanza es lo último que se pierde.

9 Ejercicios

Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo. Interprete los resultados hallados.

NOTA: Al final de la sección 2.3 de la referencia 2 (ver abajo), se pueden revisar más ejercicios.

Dos dados no falsos se lanzan. Halle la probabilidad de que:
1. La suma de los números sea un 7.
2. La suma sea por lo menos un 11.
3. La suma sea a lo más un 2.
4. Se obtenga un doble.
5. No se obtenga un doble.
Cinco monedas no falsas se lanzan.
1. Halle el espacio muestral y su tamaño. Calcule la probabilidades de los eventos que se indican a continuación.
2. B: sale 1 cara.
3. C: salen 2 caras.
4. D: salen 2 sellos.
5. E: salen 4 caras.
6. F: salen 0 sellos.
Un estante tiene 6 libros de matemáticas y 4 de física. Halle la probabilidad de que 3 libros determinados de matemáticas estén juntos, si todos los libros de matemáticas son diferentes y los libros de física también.
Un director de personal tiene ocho candidatos para cubrir 4 puestos. De éstos, 5 son hombres y 3 mujeres. Si, de hecho, toda combinación de candidatos tiene las mismas probabilidades de ser elegido, ¿cuál es la probabilidad de que ninguna mujer sea contratada?
Una caja de doce lapiceros tiene dos defectuosos. Se extraen 10 lapiceros sin reemplazo. ¿Cuál es la probabilidad de que 4 salgan defectuosos?
Una caja contiene 8 fichas rojas, 3 blancas y 9 azules. Si se extraen 3 fichas sin reemplazo y sin orden, determinar la probabilidad de que:
1. Las 3 fichas sean blancas.
2. 2 sean rojas y 1 blanca.
3. Al menos 1 sea blanca.
4. Se extraiga una de cada color.
Considere solamente las observaciones que van desde la 132 hasta la 193. Supongamos que se seleccionan cuatro estudiantes al azar.
1. Defina como “datos132a193” al data frame con estas observaciones y verifique su tamaño.
2. Defina como “Financiacion” al objeto que represente el tipo de financianción utilizado por los estudiantes para pagar sus estudios. Conviértalo en factor.
3. Construya una tabla de frecuencias para la variable Financiación.
4. ¿Cuál es la probabilidad de seleccionar dos becados y dos, no becados?
5. Si seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionadas estén becados y los dos últimos, no becados.
6. ¿Cuál es la probabilidad de seleccionar cuatro estudiantes becados?
7. ¿Cuál es la probabilidad de seleccionar tres estudiantes no becados?
8. ¿Cuál es la probabilidad de seleccionar cuatro estudiantes becados y tres no becados?
9. ¿Cuál es la probabilidad de seleccionar cuatro estudiantes becados o tres no becados?
10. ¿Cuál es la probabilidad de que no seleccionemos estudiantes no becados?
11. ¿Cuál es la probabilidad de que seleccionemos un estudiante no becado?
12. ¿Cuál es la probabilidad de que seleccionemos dos estudiantes no becados?
13. ¿Cuál es la probabilidad de seleccionar máximo dos estudiantes no becados?
14. ¿Cuál es la probabilidad de seleccionar al menos tres estudiantes no becados?
15. ¿Cuál es la probabilidad de seleccionar máximo dos estudiantes becados?
16. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los tres primeros estudiantes seleccionados sean becados y el último, no becado?
17. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionados estén becados, el tercero, uno no becado y el último, uno becado?
18. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los cuatro estudiantes seleccionados estén becados?
19. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionados estén becados?
Considere solamente las primeras 40 observaciones. Supongamos que se seleccionan cinco estudiantes al azar.
1. Defina como “datos” al data frame con las 40 primeras observaciones y verifique su tamaño.
2. Defina como “Sexo” y “Fuma” a los objetos que representan el sexo de los estudiantes y los fumadores o no, respectivamente. Conviértalos en factores.
3. Construya una tabla de contingencia con estas dos variables y el diagrama de barras correspondiente.
4. ¿Cuál es la probabilidad de seleccionar cinco mujeres?
5. ¿Cuál es la probabilidad de seleccionar tres hombres?
6. ¿Cuál es la probabilidad de seleccionar cuatro mujeres y un hombre?
7. ¿Cuál es la probabilidad de seleccionar cuatro mujeres o un hombre?
8. ¿Cuál es la probabilidad de que seleccionemos tres mujeres?
9. ¿Cuál es la probabilidad de seleccionar máximo tres hombres?
10. ¿Cuál es la probabilidad de seleccionar al menos cuatro hombres?
11. ¿Cuál es la probabilidad de seleccionar máximo una mujer?
12. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y los dos últimos, hombres?
13. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres, el tercero un hombre y los dos últimos, mujeres?
14. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los cinco estudiantes seleccionados sean mujeres?
15. Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres?
16. ¿Cuál es la probabilidad de seleccionar dos mujeres y tres hombres?
17. Si seleccionan de uno en uno, ¿cuál es la probabilidad de que las tres primeras personas seleccionadas sean mujeres y las dos últimas, hombres.
18. ¿Cuál es la probabilidad de que no seleccionemos hombres?
19. ¿Cuál es la probabilidad de que seleccionemos una mujer?

Bibliografía

LLinás, H., Rojas, C. (2005); Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Editorial Universidad del Norte.
Consultar el documento RPubs :: Enlace y materiales de ayuda.

If you found any ERRORS or have SUGGESTIONS, please report them to my email. Thanks.

PROBABILIDAD EN R

Probabilidad clásica

Dr. rer. nat. Humberto LLinás Solano