26/07/25
Abstract
La teoría mencionada puede revisarse en el capítulo 2 de mis notas de clase que aparecen en el siguiente documento: 1.1. Estadística básica. En Rpubs:: toc se pueden ver otros documentos de posible interés.
En R podemos encontrar diversas funciones para ello:
expand.grid
en el paquete base
de R.combn
en el paquete combinat
.Para nuestros cálculos, utilizaremos la función
expand.grid
. En este caso, creamos la siguientes CINCO
funcione: tosscoin(n)
, rolldie(n)
,
isin()
, urnsamples()
y nsamp()
.
Se describirán a continuación.
tosscoin(n)
La idea de esta función es generar el espacio muestral de lanzar una
moneda exactamente \(n\) veces, con
valores cara (H
) y sello (T
):
tosscoin <- function(n) {
df <- expand.grid(replicate(n, c("H", "T"), simplify = FALSE),
KEEP.OUT.ATTRS = FALSE,
stringsAsFactors = FALSE)
names(df) <- paste0("X", seq_len(n))
return(df)
}
rolldie(n)
Con ella se genera el espacio muestral al lanzar un dado exactamente \(n\) veces, con valores de 1 a 6 por lanzamiento.
rolldie <- function(n, sides = 6, makespace = FALSE) {
df <- expand.grid(replicate(n, 1:sides, simplify = FALSE),
KEEP.OUT.ATTRS = FALSE)
names(df) <- paste0("X", seq_len(n))
if (makespace) {
df$prob <- rep(1 / nrow(df), nrow(df)) # Agrega la columna de probabilidad
}
return(df)
}
NOTA: En esta función, makespace = TRUE
agregará una
columna de probabilidades (prob = 1/n) al espacio muestral, para
convertirlo en un “objeto tipo espacio de probabilidad”.
isin()
Con ella se verifica si ciertos valores están presentes en cada fila de una matriz o data frame. Se puede usar con o sin tener en cuenta el orden.
isin <- function(x, table, ordered = FALSE) {
# Si x es un vector, lo convertimos en una matriz con una sola fila
if (is.vector(x)) {
x <- matrix(x, nrow = 1)
}
# Validación
if (!is.data.frame(x) && !is.matrix(x)) stop("x debe ser un vector, data.frame o matriz")
# Aplicar fila por fila
apply(x, 1, function(row) {
row_vals <- as.character(row)
tab_vals <- as.character(table)
if (ordered) {
# Buscar subsecuencia exacta
len_row <- length(row_vals)
len_tab <- length(tab_vals)
if (len_tab > len_row) return(FALSE)
for (i in 1:(len_row - len_tab + 1)) {
if (all(row_vals[i:(i + len_tab - 1)] == tab_vals)) return(TRUE)
}
return(FALSE)
} else {
# Verificar si todos los valores de 'table' están presentes (sin importar orden)
all(tab_vals %in% row_vals)
}
})
}
urnsamples()
Esta función genera todas las muestras posibles de una urna según estos cuatro escenarios:
urnsamples <- function(x, size, ordered = TRUE, replace = FALSE) {
if (ordered) {
# Producto cartesiano
expand.grid(replicate(size, x, simplify = FALSE),
KEEP.OUT.ATTRS = FALSE)
} else {
# Combinaciones sin orden
combn(x, size, simplify = FALSE) |>
do.call(what = rbind)
}
}
nsamp()
Esta función calcula cuántas formas distintas hay de tomar \(k\) elementos de una población de n elementos, bajo distintas condiciones:
n
: Tamaño de la población (elementos
disponibles).
k
: Tamaño de la muestra-
replace = FALSE
: Sin reemplazo (sin repetir
elementos).
ordered = TRUE
: Orden importa (permuta, no
combina).
nsamp <- function(n, k, replace = FALSE, ordered = TRUE) {
if (ordered) {
if (replace) {
return(n^k) # Producto cartesiano con repetición
} else {
return(factorial(n) / factorial(n - k)) # Permutaciones sin repetición
}
} else {
if (replace) {
return(choose(n + k - 1, k)) # Combinaciones con repetición
} else {
return(choose(n, k)) # Combinaciones sin repetición
}
}
}
Sea \(\Omega \ne \emptyset\) un espacio muestral finito y supongamos que todos los eventos elementales suceden con la misma probabilidad. Entonces, para cada evento \(A\) de \(\Omega\): \[P(A)\;= \; \frac{\mbox{Número de elementos de $A$}}{\mbox{Número de elementos de $\Omega$}}\]
Para eventos \(A\), \(B\), \(C\) de un espacio muestral \(\Omega \ne \emptyset\) se tiene:
\(0 \leq P(A)\leq 1\).
\(P(\emptyset)=0\).
\(P(\Omega)=1\).
Propiedad del complemento: Si \(\overline{A}\) es el complemento de \(A\), entonces, \[P(\overline {A})= 1- P(A)\]
Teorema de la partición de un conjunto: \[P(A)= P(A\cap B) + P(A\cap \overline{B})\] \[P(B)= P(A\cap B) + P(B\cap \overline{A})\]
Teorema de adición para 2 eventos mutuamente excluyentes (es decir, eventos con intersección vacía): \[P(A\cup B)= P(A) + P(B)\]
Teorema de adición para 2 eventos (no necesariamente mutuamente excluyentes): \[P(A\cup B)= P(A) + P(B) - P(A\cap B)\]
Teorema de adición para 3 eventos mutuamente excluyentes (es decir, eventos con intersección vacía, dos a dos): \[P(A \cup B \cup C) = P(A) + P(B) + P(C)\]
Teorema de adición para 3 eventos (no necesariamente mutuamente excluyentes): \[P(A\cup B\cup C)= P(A) + P(B) + P(C)- P(A\cap B) - P(A\cap C) - P(B\cap C) + P(A\cap B\cap C)\]
Supongamos que un dado se lanza 3 veces. Hallaremos la probabilidad de que salga el 2 delante del 1. Nuestro espacio muestral está dado por:
Omega <- rolldie(3); head(Omega) #A) Espacio muestral
## X1 X2 X3
## 1 1 1 1
## 2 2 1 1
## 3 3 1 1
## 4 4 1 1
## 5 5 1 1
## 6 6 1 1
Y el evento de interés:
A <- subset(Omega, isin(Omega, c(2, 1), ordered = TRUE)); A #B) Evento
## X1 X2 X3
## 2 2 1 1
## 7 1 2 1
## 8 2 2 1
## 9 3 2 1
## 10 4 2 1
## 11 5 2 1
## 12 6 2 1
## 38 2 1 2
## 74 2 1 3
## 110 2 1 4
## 146 2 1 5
## 182 2 1 6
Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene \(w= \#\Omega =216\) elementos, la muestra es de tamaño \(n=3\) y el evento \(A\) tiene \(a=\#A=16\) elementos.
w <- nrow(Omega) #C) Tamaño del espacio muestral
n <- dim(Omega)[2] #D) Tamaño de la muestra
di<- dim(Omega) #E) Tamaño del espacio muestral y de la muestra
a <- nrow(A) #F) Tamaño del evento
Por consiguiente, la probablidad pedida es \[P(A)=\frac{16}{216}=0.074\]
a/w #F) Probabilidad pedida
## [1] 0.05555556
Al lanzar 3 veces un dado, la probabilidad de que salga el 2 delante del 1 es aproximadamente 0.074.
Supongamos que un dado se lanza 3 veces. Hallaremos la probabilidad de que salga el 1 y el 2. En este caso, el espacio muestral es:
Omega <- rolldie(3); head(Omega) #A) Espacio muestral
## X1 X2 X3
## 1 1 1 1
## 2 2 1 1
## 3 3 1 1
## 4 4 1 1
## 5 5 1 1
## 6 6 1 1
Y el evento de interés:
B <- subset(Omega, isin(Omega, c(2, 1), ordered = FALSE)); B #B) Evento
## X1 X2 X3
## 2 2 1 1
## 7 1 2 1
## 8 2 2 1
## 9 3 2 1
## 10 4 2 1
## 11 5 2 1
## 12 6 2 1
## 14 2 3 1
## 20 2 4 1
## 26 2 5 1
## 32 2 6 1
## 37 1 1 2
## 38 2 1 2
## 39 3 1 2
## 40 4 1 2
## 41 5 1 2
## 42 6 1 2
## 43 1 2 2
## 49 1 3 2
## 55 1 4 2
## 61 1 5 2
## 67 1 6 2
## 74 2 1 3
## 79 1 2 3
## 110 2 1 4
## 115 1 2 4
## 146 2 1 5
## 151 1 2 5
## 182 2 1 6
## 187 1 2 6
Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene \(w= \#\Omega =216\) elementos, la muestra es de tamaño \(n=3\) y el evento \(B\) tiene \(b=\#B=30\) elementos.
w <- nrow(Omega) #C) Tamaño del espacio muestral
n <- dim(Omega)[2] #D) Tamaño de la muestra
di<- dim(Omega) #E) Tamaño del espacio muestral y de la muestra
b <- nrow(B) #F) Tamaño del evento
Por lo tanto, la probabilidad pedida es \[P(B)=\frac{30}{216}=0.139\]
b/w
## [1] 0.1388889
Al lanzar 3 veces un dado, la probabilidad de que salga el 1 y el 2 es aproximadamente 0.139.
Una moneda no falsa se lanza 3 veces. Hallaremos la probabilidad de que salgan por lo menos 2 caras (H). El espacio muestral y su tamaño son:
Omega<- tosscoin(4); Omega #A) Espacio muestral
## X1 X2 X3 X4
## 1 H H H H
## 2 T H H H
## 3 H T H H
## 4 T T H H
## 5 H H T H
## 6 T H T H
## 7 H T T H
## 8 T T T H
## 9 H H H T
## 10 T H H T
## 11 H T H T
## 12 T T H T
## 13 H H T T
## 14 T H T T
## 15 H T T T
## 16 T T T T
El evento de que salgan por lo menos 2 caras (H) es:
C <- subset(Omega, isin(Omega, c("H", "H"), ordered = FALSE)); C #B) Evento
## X1 X2 X3 X4
## 1 H H H H
## 2 T H H H
## 3 H T H H
## 4 T T H H
## 5 H H T H
## 6 T H T H
## 7 H T T H
## 8 T T T H
## 9 H H H T
## 10 T H H T
## 11 H T H T
## 12 T T H T
## 13 H H T T
## 14 T H T T
## 15 H T T T
Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene \(w= \#\Omega =16\) elementos, la muestra es de tamaño \(n=4\) y el evento \(C\) tiene \(c=\#C=11\) elementos.
w <- nrow(Omega) #C) Tamaño del espacio muestral
n <- dim(Omega)[2] #D) Tamaño de la muestra
di<- dim(Omega) #E) Tamaño del espacio muestral y de la muestra
c <- nrow(C) #F) Tamaño del evento
Entonces, la probabilidad de que salgan por lo menos 2 caras (H) es: \[P(C)=\frac{11}{16}=0.6875\]
c/w
## [1] 0.9375
Al lanzar 4 veces una moneda no falsa, la probabilidad de que salgan por lo menos 2 caras (H) es aproximadamente 0.6875.
Una moneda no falsa se lanza 4 veces. Hallaremos la probabilidad de que salgan por lo menos 3 caras (H). El espacio muestral es:
Omega<- tosscoin(4); Omega #A) Espacio muestral
## X1 X2 X3 X4
## 1 H H H H
## 2 T H H H
## 3 H T H H
## 4 T T H H
## 5 H H T H
## 6 T H T H
## 7 H T T H
## 8 T T T H
## 9 H H H T
## 10 T H H T
## 11 H T H T
## 12 T T H T
## 13 H H T T
## 14 T H T T
## 15 H T T T
## 16 T T T T
El evento de que salgan por lo menos 3 caras (H):
D <- subset(Omega, isin(Omega, c("H", "H", "H"), ordered = TRUE)); D #B) Evento
## X1 X2 X3 X4
## 1 H H H H
## 2 T H H H
## 9 H H H T
Con ayuda de los códigos siguientes, vemos que: el espacio muestral tiene \(w= \#\Omega =16\) elementos, la muestra es de tamaño \(n=4\) y el evento \(C\) tiene \(d=\#D=5\) elementos.
w <- nrow(Omega) #C) Tamaño del espacio muestral
n <- dim(Omega)[2] #D) Tamaño de la muestra
di<- dim(Omega) #E) Tamaño del espacio muestral y de la muestra
d <- nrow(D) #F) Tamaño del evento
Entonces, la probabilidad de que salgan por lo menos 3 caras (H) es: \[P(D)=\frac{5}{16}=0.3125\]
d/w
## [1] 0.1875
Al lanzar 4 veces una moneda no falsa, la probabilidad de que salgan por lo menos 2 caras (H) es aproximadamente 0.3125.
Los siguientes datos representan los resultados obtenidos al realizar una encuesta a 400 estudiantes universitarios. En este documento, se importará la base de datos desde una dirección web (dos opciones):
Opción A (web, desde github): Para esta opción, se necesita cargar la librería “repmis”:
library(repmis)
source_data("https://github.com/hllinas/DatosPublicos/blob/main/Estudiantes.Rdata?raw=false")
datosCompleto <- Estudiantes
Opción B (web, desde Google Drive):
url.dat<- "http://bit.ly/Database-Estudiantes"
datosCompleto <- read.delim(url.dat)
Recuérdense las otras opciones, si tienen las bases de datos descargadas en su sesión de trabajo (ya sea en extensiones en Rdata, en excel o en otros formatos). Para más detalles, véase el documento R básico. A manera de ejemplo:
Opción C (local, con archivo en Rdata):
load(file="Estudiantes.Rdata")
datosCompleto <- Estudiantes
Opción D (local, con archivo en excel):
datosCompleto <- read.delim('clipboard')
El objetivo es utilizar esta información para calcular probabilidades clásicas. Es decir, probablidades de la forma: \[P(A)\;= \; \frac{\mbox{Número de elementos de $A$}}{\mbox{Número de elementos de $\Omega$}}\]
Considere solamente las primeras 100 observaciones. Supongamos que se seleccionan cuatro estudiantes al azar.
a) Defina como "datos" al data frame con las 100 primeras observaciones y verifique su tamaño.
b) Defina como "Sexo" al objeto que represente el sexo de los estudiantes. Conviértalo en factor.
c) Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.
d) ¿Cuál es la probabilidad de seleccionar dos mujeres y dos hombres?
e) Si seleccionan de uno en uno, ¿cuál es la probabilidad de que las dos primeras personas
seleccionadas sean mujeres y las dos últimas, hombres.
f) ¿Cuál es la probabilidad de seleccionar cuatro mujeres?
g) ¿Cuál es la probabilidad de seleccionar tres hombres?
h) ¿Cuál es la probabilidad de seleccionar cuatro mujeres y tres hombres?
i) ¿Cuál es la probabilidad de seleccionar cuatro mujeres o tres hombres?
j) ¿Cuál es la probabilidad de que no seleccionemos hombres?
k) ¿Cuál es la probabilidad de que seleccionemos un hombre?
l) ¿Cuál es la probabilidad de que seleccionemos dos hombres?
m) ¿Cuál es la probabilidad de seleccionar máximo dos hombres?
n) ¿Cuál es la probabilidad de seleccionar al menos tres hombres?
o) ¿Cuál es la probabilidad de seleccionar máximo dos mujeres?
p) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los tres
primeros estudiantes seleccionados sean mujeres y el último, un hombre?
q) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos
primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer?
r) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los cuatro estudiantes
seleccionados sean mujeres?
s) Si se seleccionan de uno en uno, ¿cuál es la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres?
Filtramos y definimos como “datos” al data frame con las 100 primeras observaciones:
datos <- datosCompleto[1:100,] #A) La nueva base de datos
El número de observaciones es 100 y se obtiene así:
nrow(datos) #B) Número de observaciones
## [1] 100
Definimos la variable categórica y revisamos sus niveles:
Sexo <- as.factor(datos$Sexo) #C) La variable
levels(Sexo) #D) Sus niveles
## [1] "Femenino" "Masculino"
La tabla de frecuencia es:
Cuentas <- table(Sexo); Cuentas #F) Tabla de frecuencia
## Sexo
## Femenino Masculino
## 49 51
Observamos que, en la muestra de 100, hay 49 mujeres y 51 hombres.
El diagrama de barras:
barplot(Cuentas, main="Diagrama de barras", xlab="Sexo", ylab="Frecuencias", legend = rownames(Cuentas), col=c("pink","blue"), ylim = c(0, 80))
Nos piden hallar la probabilidad de seleccionar dos mujeres y dos hombres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica. Tenemos:
w <- choose(100, 4); w #G) Tamaño del espacio muestral
## [1] 3921225
Mujer <- choose(49, 2); Mujer #H) Combinaciones de las mujeres
## [1] 1176
Hombre <- choose(51,2); Hombre #I) Combinaciones de los hombres
## [1] 1275
La probabilidad de seleccionar dos mujeres y dos hombres es \[P(A)= \frac{(1176)(1275)}{3921225}= 0.3824\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{(1176)(1275)}{3921225}= 0.3824$$
Probabilidad_d <- (Mujer * Hombre)/w; Probabilidad_d #J) Probabilidad pedida
## [1] 0.3823805
Ahora se seleccionan de uno en uno. Nos piden hallar la probabilidad de que las dos primeras personas seleccionadas sean mujeres y las dos últimas, hombres. Como interesa el orden, utilizaremos permutaciones sin repetición de \(n\) objetos tomados de \(k\) en \(k\) (puede verse el punto 2 de la sección 3.0.1 en Rpubs):
w <- factorial(100)/factorial(100-4); w #K) Tamaño del espacio muestral
## [1] 94109400
Mujer <- factorial(49)/factorial(49-2); Mujer #L) Permutaciones de las mujeres
## [1] 2352
Hombre <- factorial(51)/factorial(51-2); Hombre #M) Permutaciones de los hombres
## [1] 2550
La probabilidad de que las dos primeras personas seleccionadas sean mujeres y las dos últimas, hombres, es \[P(A)= \frac{(2352)(2550)}{94109400}=0.0637\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{(2352)(2550)}{94109400}=0.0637$$
Probabilidad_e <- (Mujer * Hombre)/w; Probabilidad_e #N) Probabilidad pedida
## [1] 0.06373008
Nos piden hallar la probabilidad de seleccionar cuatro mujeres. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:
w <- choose(100, 4); w #O) Tamaño del espacio muestral
## [1] 3921225
Mujer <- choose(49, 4); Mujer #P) Combinaciones de las mujeres
## [1] 211876
La probabilidad de seleccionar cuatro mujeres es \[P(A)= \frac{211876}{3921225}=0.054\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{211876}{3921225}=0.054$$
Probabilidad_f <- Mujer/w; Probabilidad_f #Q) Probabilidad pedida
## [1] 0.05403311
Nos piden hallar la probabilidad de seleccionar tres hombres. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:
w <- choose(100, 4); w #R) Tamaño del espacio muestral
## [1] 3921225
Hombre <- choose(51,3); Hombre #S) Combinaciones de los hombres
## [1] 20825
Mujer <- choose(49, 1); Mujer #T) Combinaciones de las mujeres
## [1] 49
La probabilidad de seleccionar tres hombres es \[P(A)= \frac{(20825)(49)}{3921225}=0.2602\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{(20825)(49)}{3921225}=0.2602$$
Probabilidad_g <- (Hombre * Mujer)/w; Probabilidad_g #U) Probabilidad pedida
## [1] 0.2602312
La probabilidad de seleccionar cuatro mujeres y tres hombres es 0, ya que los eventos “seleccionar cuatro mujeres” y “seleccionar tres hombres” son disyuntos (intersecciones vacías):
Probabilidad_h <- 0; Probabilidad_h #V) Prob. pedida
## [1] 0
Nos piden hallar la probabilidad de seleccionar cuatro mujeres o tres hombres. Por el inciso (h), la probabilidad de la intersección de los eventos “seleccionar cuatro mujeres” y “seleccionar tres hombres” es cero. Por esta razón, se aplicará el teorema de adición para dos eventos (inciso (f) de la sección 3): \[P(A\cup B)= P(A) + P(B)\]
De los resultados encontrados en los incisos (f) y (g), la probabilidad de seleccionar cuatro mujeres o tres hombres es: \[P(A) = 0.0540 + 0.2602 = 0.3142\]
El código para escribir la expresión anterior es:
$$P(A) = 0.0540 + 0.2602 = 0.3142$$
Probabilidad_i <- Probabilidad_f +Probabilidad_g; Probabilidad_i #U) Prob. pedida
## [1] 0.3142643
Nos piden hallar la probabilidad de que no seleccionemos hombres. Entonces, si no se seleccionan hombres, entonces, hemos seleccionado cuatro mujeres. Por lo tanto, por la parte (f), la probabilidad de que no seleccionemos hombres es 0.0540.
Probabilidad_j <- Probabilidad_f; Probabilidad_j #A) Probabilidad pedida
## [1] 0.05403311
Nos piden hallar la probabilidad de que seleccionemos un hombre. Utilizaremos combinaciones y aplicaremos probabilidad clásica. Tenemos:
w <- choose(100, 4); w #B) Tamaño del espacio muestral
## [1] 3921225
Hombre <- choose(51,1); Hombre #C) Combinaciones de los hombres
## [1] 51
Mujer <- choose(49, 3); Mujer #D) Combinaciones de las mujeres
## [1] 18424
La probabilidad de seleccionar un hombre es \[P(A)= \frac{(51)(18424)}{3921225}=0.2396\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{(51)(18424)}{3921225}=0.2396$$
Probabilidad_k <- (Hombre * Mujer)/w; Probabilidad_k #E) Probabilidad pedida
## [1] 0.2396251
Nos piden hallar la probabilidad de que seleccionemos dos hombres. Entonces, al seleccionar dos hombres, también estaremos seleccionando dos mujeres. Por lo tanto, por la parte (d), la probabilidad de que seleccionemos dos hombres es 0.3824.
Probabilidad_l <- Probabilidad_d; Probabilidad_l #F) Probabilidad pedida
## [1] 0.3823805
Nos piden hallar la probabilidad de seleccionar máximo dos hombres. Para ello, solo debemos sumar las probabilidades de seleccionar 0, 1 y 2 hombres. Entonces, por las partes (j), (k) y (l), tenemos que \[P(A) = 0.0540 + 0.2396 + 0.3824 = 0.6760\]
El código para escribir la expresión anterior es:
$$P(A) = 0.0540 + 0.2396 + 0.3824 = 0.6760$$
Probabilidad_m <- Probabilidad_j + Probabilidad_k + Probabilidad_l; Probabilidad_m #G) Probabilidad pedida
## [1] 0.6760387
Nos piden hallar la probabilidad de seleccionar al menos tres hombres. Observe que el evento “seleccionar al menos tres hombres” es el complemento del evento “seleccionar máximo dos hombres”. Por lo tanto, por la parte (m), la probabilidad pedida es: \[P(\overline {A})= 1- P(A) = 1 - 0.6760 = 0.3239\]
El código para escribir la expresión anterior es:
$$P(\overline {A})= 1- P(A) = 1 - 0.6760 = 0.3239$$
Probabilidad_n <- 1 - Probabilidad_m; Probabilidad_n #H) Probabilidad pedida
## [1] 0.3239613
Nos piden hallar la probabilidad de seleccionar máximo dos mujeres. El evento “seleccionar máximo dos mujeres” es el complemento del evento “seleccionar al menos tres mujeres”. Y la probabilidad de este evento (“seleccionar al menos tres mujeres”) es igual a la suma de las probabilidades halladas en las partes (f) y (k). Por lo tanto, utilizando la propiedad del complemento (inciso (d) de la sección 3), la probabilidad pedida es: 0.7064.
Probabilidad_o <- 1- (Probabilidad_f + Probabilidad_k); Probabilidad_o #I) Probabilidad pedida
## [1] 0.7063418
Ahora, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último, un hombre. En este caso, utilizaremos permutaciones sin repetición de \(n\) objetos tomados de \(k\) en \(k\) (puede verse el punto 2 de la sección 3.0.1 en Rpubs):
w <- factorial(100)/factorial(100-4); w #K) Tamaño del espacio muestral
## [1] 94109400
Mujer <- factorial(49)/factorial(49-3); Mujer #L) Permutaciones de las mujeres
## [1] 110544
Hombre <- factorial(51)/factorial(51-1); Hombre #M) Permutaciones de los hombres
## [1] 51
La probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último, un hombre, es \[P(A)= \frac{(110544)(51)}{94109400}=0.0599\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{(110544)(51)}{94109400}=0.0599$$
Probabilidad_p <- (Mujer * Hombre)/w; Probabilidad_p #N) Probabilidad pedida
## [1] 0.05990628
Nuevamente, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer. Basicamente, en este inciso, se pide la misma probabilidad formulada en (p). Por lo tanto, la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres, el tercero un hombre y el último, una mujer es 0.0599.
Probabilidad_q <- Probabilidad_p; Probabilidad_q #O) Probabilidad pedida
## [1] 0.05990628
Otra vez, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los cuatro estudiantes seleccionados sean mujeres. Utilizaremos permutaciones sin repetición de \(n\) objetos tomados de \(k\) en \(k\) (puede verse el punto 2 de la sección 3.0.1 en Rpubs):
w <- factorial(100)/factorial(100-4); w #P) Tamaño del espacio muestral
## [1] 94109400
Mujer <- factorial(49)/factorial(49-4); Mujer #Q) Permutaciones de las mujeres
## [1] 5085024
La probabilidad de que los tres primeros estudiantes seleccionados sean mujeres y el último un hombre es \[P(A)= \frac{5085024}{94109400}=0.0540\]
El código para escribir la expresión anterior es:
$$P(A)= \frac{5085024}{94109400}=0.0540$$
Probabilidad_r <- Mujer/w; Probabilidad_r #R) Probabilidad pedida
## [1] 0.05403311
Nuevamente, se seleccionan de uno en uno y nos piden hallar la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres. Como en la dos primeras selecciones aparecen las mujeres, entonces, para en las dos últimas dos posiciones pueden ocurrir alguno de los eventos siguientes:
Por esta razón, la probabilidad de que los dos primeros estudiantes seleccionados sean mujeres es la suma de aquéllas halladas en esos incisos. Es decir, \[P(A) \; =\; 0.0637 + 0.0599 + 0.0599 + 0.0540 \; =\; 0.2376\]
El código para escribir la expresión anterior es:
$$P(A) \; =\; 0.0637 + 0.0599 + 0.0599 + 0.0540 \; =\; 0.2376$$
Probabilidad_s <- Probabilidad_e + Probabilidad_p + Probabilidad_q + Probabilidad_r #S) Cálculo
Probabilidad_s #T) El valor de la probabilidad
## [1] 0.2375758
Ejemplo 1 (Baloto)
Baloto es un juego novedoso de tipo loto en línea, de suerte y azar, donde el jugador, por 5.700 pesos, apuesta por un acumulado multimillonario eligiendo, de uno en uno, 5 números del 1 al 43 (sin repetición) y una súper balota con números del 1 al 16 a través de una terminal de venta.
El objetivo es determinar el número de posibilidades que tenemos en sacar las 6 balotas con las condiciones descritas anteriormente.
Solución.
Se deben escoger 6 números. Entonces:
Para el primer número, hay 43 opciones de elegir un número.
Para el segundo número, hay 42 opciones de escogencia, porque no pueden repetirse.
Para el tercer número, hay 41 opciones.
Para el cuarto, hay 40 opciones.
Para el quinto, hay 39 opciones.
Para el sexto 16 opciones.
Para conocer el número total de opciones se aplica el teorema fundamental del conteo: se multiplican las opciones por cada número. Es decir:
\[43 \cdot 42\cdot 41\cdot 40\cdot 39\cdot 16 \;=\; 1.848´188.160\]
Este resultado corresponde al número de casos posibles, el cual es muy grande, ya que debe seleccionar uno de esa cantidad. La probabilidad de ganarse el baloto es
\[P(\mbox{ganar el baloto}) = \frac{1}{1.848´188.160} = 5.410705\; \times\; 10^{-10} = 0.0005410705\]
Es una probabilidad muy pequeña, lo que muestra que es difícil ganarse el baloto, pero…. la esperanza es lo último que se pierde.
Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo. Interprete los resultados hallados.
NOTA: Al final de la sección 2.3 de la referencia 2 (ver abajo), se pueden revisar más ejercicios.
Dos dados no falsos se lanzan. Halle la probabilidad de que:
La suma de los números sea un 7.
La suma sea por lo menos un 11.
La suma sea a lo más un 2.
Se obtenga un doble.
No se obtenga un doble.
Cinco monedas no falsas se lanzan.
Halle el espacio muestral y su tamaño. Calcule la probabilidades de los eventos que se indican a continuación.
B: sale 1 cara.
C: salen 2 caras.
D: salen 2 sellos.
E: salen 4 caras.
F: salen 0 sellos.
Un estante tiene 6 libros de matemáticas y 4 de física. Halle la probabilidad de que 3 libros determinados de matemáticas estén juntos, si todos los libros de matemáticas son diferentes y los libros de física también.
Un director de personal tiene ocho candidatos para cubrir 4 puestos. De éstos, 5 son hombres y 3 mujeres. Si, de hecho, toda combinación de candidatos tiene las mismas probabilidades de ser elegido, ¿cuál es la probabilidad de que ninguna mujer sea contratada?
Una caja de doce lapiceros tiene dos defectuosos. Se extraen 10 lapiceros sin reemplazo. ¿Cuál es la probabilidad de que 4 salgan defectuosos?
Una caja contiene 8 fichas rojas, 3 blancas y 9 azules. Si se extraen 3 fichas sin reemplazo y sin orden, determinar la probabilidad de que:
Las 3 fichas sean blancas.
2 sean rojas y 1 blanca.
Al menos 1 sea blanca.
Se extraiga una de cada color.
Considere solamente las observaciones que van desde la 132 hasta la 193. Supongamos que se seleccionan cuatro estudiantes al azar.
Considere solamente las primeras 40 observaciones. Supongamos que se seleccionan cinco estudiantes al azar.
LLinás, H., Rojas, C. (2005); Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Editorial Universidad del Norte.
Consultar el documento RPubs :: Enlace y materiales de ayuda.
If you found any ERRORS or have SUGGESTIONS, please report them to my email. Thanks.