21/07/25
Abstract
La teoría mencionada puede revisarse en el capítulo 2 de mis notas de clase que aparecen en el siguiente documento: 1.1. Estadística básica. En Rpubs:: toc se pueden ver otros documentos de posible interés.
En R podemos encontrar diversas funciones para ello:
expand.grid
en el paquete base
de R.combn
en el paquete combinat
.Para nuestros cálculos, utilizaremos la función
expand.grid
. En este caso, creamos la siguientes CINCO
funcione: tosscoin(n)
, rolldie(n)
,
isin()
, urnsamples()
y nsamp()
.
Se describirán a continuación.
tosscoin(n)
La idea de esta función es generar el espacio muestral de lanzar una
moneda exactamente \(n\) veces, con
valores cara (H
) y sello (T
):
tosscoin <- function(n) {
df <- expand.grid(replicate(n, c("H", "T"), simplify = FALSE),
KEEP.OUT.ATTRS = FALSE,
stringsAsFactors = FALSE)
names(df) <- paste0("X", seq_len(n))
return(df)
}
rolldie(n)
Con ella se genera el espacio muestral al lanzar un dado exactamente \(n\) veces, con valores de 1 a 6 por lanzamiento.
rolldie <- function(n, sides = 6, makespace = FALSE) {
df <- expand.grid(replicate(n, 1:sides, simplify = FALSE),
KEEP.OUT.ATTRS = FALSE)
names(df) <- paste0("X", seq_len(n))
if (makespace) {
df$prob <- rep(1 / nrow(df), nrow(df)) # Agrega la columna de probabilidad
}
return(df)
}
NOTA: En esta función, makespace = TRUE
agregará una
columna de probabilidades (prob = 1/n) al espacio muestral, para
convertirlo en un “objeto tipo espacio de probabilidad”.
isin()
Con ella se verifica si ciertos valores están presentes en cada fila de una matriz o data frame. Se puede usar con o sin tener en cuenta el orden.
isin <- function(x, table, ordered = FALSE) {
# Si x es un vector, lo convertimos en una matriz con una sola fila
if (is.vector(x)) {
x <- matrix(x, nrow = 1)
}
# Validación
if (!is.data.frame(x) && !is.matrix(x)) stop("x debe ser un vector, data.frame o matriz")
# Aplicar fila por fila
apply(x, 1, function(row) {
row_vals <- as.character(row)
tab_vals <- as.character(table)
if (ordered) {
# Buscar subsecuencia exacta
len_row <- length(row_vals)
len_tab <- length(tab_vals)
if (len_tab > len_row) return(FALSE)
for (i in 1:(len_row - len_tab + 1)) {
if (all(row_vals[i:(i + len_tab - 1)] == tab_vals)) return(TRUE)
}
return(FALSE)
} else {
# Verificar si todos los valores de 'table' están presentes (sin importar orden)
all(tab_vals %in% row_vals)
}
})
}
urnsamples()
Esta función genera todas las muestras posibles de una urna según estos cuatro escenarios:
urnsamples <- function(x, size, ordered = TRUE, replace = FALSE) {
if (ordered) {
# Producto cartesiano
expand.grid(replicate(size, x, simplify = FALSE),
KEEP.OUT.ATTRS = FALSE)
} else {
# Combinaciones sin orden
combn(x, size, simplify = FALSE) |>
do.call(what = rbind)
}
}
nsamp()
Esta función calcula cuántas formas distintas hay de tomar \(k\) elementos de una población de n elementos, bajo distintas condiciones:
n
: Tamaño de la población (elementos
disponibles).
k
: Tamaño de la muestra-
replace = FALSE
: Sin reemplazo (sin repetir
elementos).
ordered = TRUE
: Orden importa (permuta, no
combina).
nsamp <- function(n, k, replace = FALSE, ordered = TRUE) {
if (ordered) {
if (replace) {
return(n^k) # Producto cartesiano con repetición
} else {
return(factorial(n) / factorial(n - k)) # Permutaciones sin repetición
}
} else {
if (replace) {
return(choose(n + k - 1, k)) # Combinaciones con repetición
} else {
return(choose(n, k)) # Combinaciones sin repetición
}
}
}
Recuerde una permutación es un arreglo ordenado de una cantidad finita de objetos distintos. El número de formas en que se puede seleccionar una permutación de k sujetos de una población que tiene n sujetos distinguibles depende el tipo de muestreo.
Si el muestreo es hecho con reemplazo, el número de permutaciones es: \[n^k\]
Si el muestreo es hecho sin reemplazo, el número de permutaciones es: \[\frac{n!}{(n-k)!}\]
Si el muestreo es hecho sin reemplazo y \(n=k\), el número de permutaciones es \[n!\]
El símbolo \(n!\) se lee “n factorial” y, en R, es computado is computed con el comando factorial(n). Algunos valores factoriales son los siguientes:
Si se le pide a un consumidor que ordene, por orden de preferencia, el sabor de cinco marcas de cerveza, entonces el número de permutaciones que resultan será \(5!=120\). Con R se puede calcular de dos maneras:
factorial(5) #A) Factorial
nsamp(n = 5, k = 5, replace = FALSE, ordered = TRUE) #B) Sin reemplazo, con orden
## [1] 120
Supongamos que se quiere seleccionar (con orden) una muestra de tamaño 2 de una urna con 3 elementos disponibles. Si es con reemplazo, tendríamos 9 posibilidades, pero, sin reemplazo, solo 6. Con R:
nsamp(n = 3, k = 2, replace = TRUE, ordered = TRUE) #C) Con reemplazo, con orden
nsamp(n = 3, k = 2, replace = FALSE, ordered = TRUE) #D) Sin reemplazo, con orden
## [1] 9
## [1] 6
El número de formas diferentes en que se pueden sentar 8 alumnos en una oficina con sólo 5 sillas es \(\frac{8!}{(8-5)!} =6720\). Con R:
nsamp(n = 8, k = 5, replace = FALSE, ordered = TRUE) #E) Sin reemplazo, con orden
## [1] 6720
Recuerde una combinación es un arreglo no ordenado de una cantidad finita de objetos distintos. El número de formas en que se puede seleccionar una combinación de k sujetos de una población que tiene n sujetos distinguibles es:
Muestreo | ordered = FALSE |
---|---|
replace=TRUE | \({n+k-1\choose k}\) |
replace=FALSE | \({n\choose k}\) |
El símbolo \({n\choose k}\) se llama coeficiente binomial y, en R, es computado con el comando choose(n,k). Se define como
Un comité, de 3 mujeres de un grupo de 8, se puede escoger de \({8\choose 3}= 56\) maneras. En R se puede calcular de dos maneras:
choose(8,3) #A) Coeficiente binomial
nsamp(n = 8, k = 3, replace = FALSE, ordered = FALSE) #B) Sin reemplazo, sin orden
## [1] 56
Supongamos que se quiere seleccionar (sin orden) una muestra de tamaño 2 de una urna con 3 elementos disponibles. Si es sin reemplazo, tendríamos 3 posibilidades, pero, con reemplazo, solo 6. Con R:
nsamp(n = 3, k = 2, replace = FALSE, ordered = FALSE) #C) Sin reemplazo, sin orden
nsamp(n = 3, k = 2, replace = TRUE, ordered = FALSE) #D) Con reemplazo, sin orden
## [1] 3
## [1] 6
Un beneficio de “nsamp” es podemos obtener un vector de respuestas numéricas (en vez de un solo número) cuando asignamos un vector de valores a \(n\), \(k\), replace, and ordered.
Cuatro libros distintos de matemáticas, seis diferentes de física y dos diferentes de química se colocan en un estante. Determinar el número de formas distintas de ordenar los 12 libros si los libros de cada asignatura deben estar todos juntos.
SOLUCIÓN:
Los libros de matemáticas pueden ordenarse de \(4!=24\) formas, los de física de \(6!=720\) formas y los de química de \(2!=2\) formas. En R:
M <- factorial(4) #A) Matemática
f <- factorial(6) #B) Física
Q <- factorial(2) #C) Química
Los tres grupos se pueden ordenar de \(3!=6\) formas. En R:
G <- factorial(3) #D) Los tres grupos de libros
Por consiguiente, por el teorema fundamental del conteo, el número posible de maneras de ordenar los libros es (los libros de cada asignatura deben estar todos juntos): \[ 4!\, 6! \, 2! \, 3! \;= \; 207.360\]
En R:
M*f*Q*G #E) Permutación buscada
## [1] 207360
De un total de 5 matemáticos y 7 físicos se forma un comité de 2 matemáticos y 3 físicos. El objetivo ahora es determinar el número de posible maneras puede formarlo si un físico determinado debe pertenecer al comité. Entonces:
SOLUCIÓN:
Tenemos que 2 matemáticos (de un total de 5) pueden elegirse de \({5\choose 2}=10\) maneras y que 2 físicos restantes (de un total de 6) pueden elegirse de \({6\choose 2}=15\) maneras. En R:
M<- choose(5,2) #A) Matemáticos
F<- choose(6,2) #B) Físicos
Por consiguiente, el número total de selecciones posibles es \(10 \cdot 15 = 150\). En R:
M*F #C) Combinación buscada
## [1] 150
Dado el experimento aleatorio, encuentre los elementos de \(\Omega\) (el espacio muestral), el número de elementos que contiene y el tamaño de la muestra. Debe utilizar las funciones de esta sección. Crear un nuevo documento R Markdown. Explique siempre sus afirmaciones y los códigos utilizados. Interprete los resultados hallados.
NOTA: Al final de la sección 2.2 de la referencia 2 (ver abajo), se pueden revisar más ejercicios.
Una caja tiene 10 bolas. Se sacan 2 bolas:
Sin orden y sin reemplazo.
Con orden y sin reemplazo.
Sin orden y con reemplazo.
Con orden y con reemplazo.
De un total de 8 facturas diferentes, un gerente selecciona 5 con el fin de:
Ordenarlas en un lugar especifico de su escritorio.
Colocarlas en un lugar especifico de su escritorio.
Una urna contiene 7 fichas. ¿Cuáles y cuántas son las distintas maneras de seleccionar 2 fichas:
Sin orden y sin reemplazo.
Con orden y sin reemplazo.
Sin orden y con reemplazo.
Con orden y con reemplazo.
Formar un grupo de tamaño 5 de entre 12 personas.
Sentar 6 personas en un sofá que sólo tiene disponible 3 puestos.
Un consumidor ordena, por orden de preferencia, el sabor de 5 marcas de cerveza.
Formar números de 3 cifras sin repetición con los dígitos 8, 2, 5, 4 y 7.
Una pieza de un radio puede ser comprado de cualquiera de 6 proveedores. Se escogen 3 de los 6 proveedores.
Cuatro libros distintos de matemáticas, seis diferentes de física y dos diferentes de química se colocan en un estante. ¿De cuántas formas distintas es posible ordenarlos si:
Los libros de cada asignatura deben estar todos juntos?
Solamente los libros de matemáticas deben estar juntos?
En un reinado mundial de la belleza, el jurado debe elegir, de un total de cinco finalistas, a la nueva reina. ¿De cuántas formas se pueden seleccionar:
Reina y virreina?
Reina, virreina y primera princesa?
Dos candidatas para ser reina?
En un estudio médico, los pacientes se clasifican de acuerdo a su peso (liviano, normal, pesado) y estatura (medio bajo, bajo, alto y medio alto). Enumere las diferentes posibilidades en las que un paciente se puede clasificar. ¿Cuántas posibilidades hay?
Si un experimento consiste en lanzar un dado, luego, lanzar una moneda y después escoger al azar una letra de nuestro alfabeto, ¿cuántos elementos tiene el espacio muestral correspondiente? (Suponga que nuestro alfabeto tiene 27 letras).
Los estudiantes de un curso de estadística se clasifican como estudiantes de administración, economía o ingeniería; como repitente o no repitente y también como hombre o mujer. Encuentre el número total de clasificaciones posibles para los estudiantes de dicho curso.
Una persona ha visto un accidente de tránsito cuyo culpable huyó. A pesar de esto le dice a la Policía que la placa del carro en el que viajaba el culpable tenía tres letras (de las cuales las dos primeras eran C y A) y tres dígitos (de los cuales el último era 0). Encuentre el número máximo de placas de carro que la Policía debe verificar bajo cada una de las siguientes condiciones (nuestro alfabeto tiene 27 letras):
Las tres letras son diferentes y los tres dígitos también.
Las tres letras son diferentes y los dos dígitos que faltan son diferentes entre sí.
La letra que hace falta es diferente de la A y los dígitos que hacen falta son diferentes e impares.
De un total de 6 matemáticos y 8 físicos se forma un comité de 2 matemáticos y 3 físicos. ¿De cuántas maneras puede formarse si:
Puede pertenecer a él cualquier matemático y físico?
Un físico determinado debe pertenecer al comité?
Dos matemáticos determinados no pueden pertenecer al comité?
IPSUR (Introduction to Probability and Statistics Using R): https://www.nongnu.org/ipsur/
LLinás, H.; Rojas, C., Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Ediciones Uninorte, 2005.
If you found any ERRORS or have SUGGESTIONS, please report them to my email. Thanks.