Desarrollar ejercicios de probabilidad
Construir ejercicios de probabilidad conforme a partir de datos conforme la teoría de probabilidad
En un espacio muestral de los números del 1 al 50, empezando en 1 y con saltos de tres en tres \(S=1,4,7,10,13,16,19...\)
¿Cuál es la probabilidad de elegir un número primo?
¿Cuál es la probabilidad de elegir un número par?
¿Cuál es la probabilidad de elegir un número impar o non?
S <- seq(1, 70, 5)
primos <- c(11, 31, 41, 61)
pares <- c(6, 16, 26, 36, 46, 56, 66)
nones <- c(1, 11, 21, 31, 41, 51, 61)
S
## [1] 1 6 11 16 21 26 31 36 41 46 51 56 61 66
primos
## [1] 11 31 41 61
pares
## [1] 6 16 26 36 46 56 66
nones
## [1] 1 11 21 31 41 51 61
La probabilidad de elegir un número primo
La función length(primos %in% S) que utiliza el operador %in% devuelve valor booleano TRUE o FALSE para saber si un valor está contenido en un conjunto y combinado con length() determina la cantidad de ocasiones.
n.primos <- length(primos %in% S)
N <- length(S) #
n.primos
## [1] 4
N
## [1] 14
prob <- n.primos/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de que elegir un número primo es : ", prob, "%")
## [1] "La probabilidad de que elegir un número primo es : 28.57 %"
La probabilidad de elegir un número par
n.pares <- length(pares %in% S)
N <- length(S) #
n.pares
## [1] 7
N
## [1] 14
prob <- n.pares/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de que elegir un número par es : ", prob, "%")
## [1] "La probabilidad de que elegir un número par es : 50 %"
La probabilidad de elegir un número non o impar
n.nones <- length(nones %in% S)
N <- length(S) #
n.nones
## [1] 7
N
## [1] 14
prob <- n.nones/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de que elegir un número non es : ", prob, "%")
## [1] "La probabilidad de que elegir un número non es : 50 %"
Una bolsa contiene canicas 35 canicas, 28 rojas y 7 canicas negras,
¿cuál es la probabilidad de extraer de la bolsa una canica de color negra? 7/35
o una canica de color roja? 28/35
o una canica de color blanca? CERO
S <- c(rep("NEGRA", 7), rep("ROJA", 28))
S
## [1] "NEGRA" "NEGRA" "NEGRA" "NEGRA" "NEGRA" "NEGRA" "NEGRA" "ROJA" "ROJA"
## [10] "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA"
## [19] "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA"
## [28] "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA" "ROJA"
N <- length(S) #
N
## [1] 35
negras <- rep("NEGRA", 7)
rojas <- rep("ROJA", 28)
n.negras <- length(negras %in% S)
n.rojas <- length(rojas %in% S)
n.negras
## [1] 7
n.rojas
## [1] 28
Probabilidad de canicas negras
prob <- n.negras / N
prob
## [1] 0.2
Probabilidad de canicas rojas
prob <- n.rojas /N
prob
## [1] 0.8
En un espacio muestral de una lista de 70 nombres, algunos se repiten?, cual es la probabilidad de elegir a un nombre en particular?
SS es el espacio muestral que contiene una lista de nombres de personas.
NN El total de nombres en la lista.
n la cantidad de ocasiones que aparece un nombre en la lista.
probprob es la probabilidad de elegir aleatoriamente a un nombre de la lista.
Con la función sample() se genera un nombre aleatorio a partir del espacio muestral SS
Se utiliza length(which(S == nombre )) para determinar en cuántas veces existe en S el valor del nombre que ha sido generado aleatoriamente.
S <- c("Juan", "Paty", "Pedro", "Joaquín", "Lourdes", "Agustín", "Manuel", "Olga",
"Lucy", "José", "Rubén", "Pedro",
"Olga", "Luis", "Fernando", "Oscar",
"María", "Esmeralda", "Ernesto", "Saúl", "José", "María", "Pedro", "Saúl", "Ernesto", "María", "Luis", "Gerardo", "Héctor", "Saúl", "María", "Luis", "Lourdes", "Saúl", "Luis", "Fernando", "Rubén", "Agustín", "Joaquín", "Agustín", "Lucy", "José", "Juan", "Lucy", "Olga", "María", "Paty", "Olga", "María", "Paty", "Luis", "Rubén", "Oscar", "Gerardo", "Lucy", "Luis", "María", "José", "Juan", "Luis", "Lucy", "María", "Juan", "José", "Saúl", "María", "Fernando", "Oscar", "José", "Luis")
S
## [1] "Juan" "Paty" "Pedro" "Joaquín" "Lourdes" "Agustín"
## [7] "Manuel" "Olga" "Lucy" "José" "Rubén" "Pedro"
## [13] "Olga" "Luis" "Fernando" "Oscar" "María" "Esmeralda"
## [19] "Ernesto" "Saúl" "José" "María" "Pedro" "Saúl"
## [25] "Ernesto" "María" "Luis" "Gerardo" "Héctor" "Saúl"
## [31] "María" "Luis" "Lourdes" "Saúl" "Luis" "Fernando"
## [37] "Rubén" "Agustín" "Joaquín" "Agustín" "Lucy" "José"
## [43] "Juan" "Lucy" "Olga" "María" "Paty" "Olga"
## [49] "María" "Paty" "Luis" "Rubén" "Oscar" "Gerardo"
## [55] "Lucy" "Luis" "María" "José" "Juan" "Luis"
## [61] "Lucy" "María" "Juan" "José" "Saúl" "María"
## [67] "Fernando" "Oscar" "José" "Luis"
N <- length(S)
N
## [1] 70
nombre <- sample(x = S,size = 1 )
nombre
## [1] "María"
n <- length(which(S == nombre ))
n
## [1] 9
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a ", nombre, " de la lista de pesonas es del:" , prob, "%")
## [1] "La probabilidad de elegir a María de la lista de pesonas es del: 12.86 %"
En un espacio muestral en donde existen 6500 alumnos en una institución educativa de nivel superior que cursan diferentes carreras cada uno de ellos ¿cual es la probabilidad de elegir aleatoriamente a un estudiante una carrera en particular?
Se crea por medio de una simulación un conjunto de datos semejante al utilizado en el caso 2. El data.frame contiene dos variables: un identificador de número de alumno y la carrera que cursa.
La variable carrera contiene las carreras profesionales de una institución educativa de nivel superior.
La variable distribuyen contiene la cantidad de alumnos por cada carrera.
carreras <- c("Arquitectura", "Civil", "Sistemas", "TIC", "Gestión")
distribuyen <- c(2000, 1800, 650, 150, 1800)
carreras
## [1] "Arquitectura" "Civil" "Sistemas" "TIC" "Gestión"
distribuyen
## [1] 2000 1800 650 150 1800
Generando los datos o el espacio muestral \(S\)
En la variable S.datos se crea un conjunto de datos aleatorio de 6500 alumnos distribuidos en distintas carreras, conorme y de acuerdo a la distribución.
Dentro de la función sample() que genera valores aleatorios, existe el atributo prob que se usa prob = c(distribuyen/N) para determinar las proporciones de alumnos por carrera.
NN es el total de elementos del espacio muestral 6500
Se utiliza la semilla set.seed(2021) para que salgan los mismos resultados en la generación de alumnos.
head() y tail() indican que sólo se presenten los primeros y últimos diez registros.
N = 6500
set.seed(2021)
S.datos <- data.frame(numero = 1:N, carrera = sample(x = carreras, size = N, replace = TRUE, prob = c(distribuyen/N)))
head(S.datos, 10)
## numero carrera
## 1 1 Gestión
## 2 2 Civil
## 3 3 Civil
## 4 4 Gestión
## 5 5 Civil
## 6 6 Civil
## 7 7 Civil
## 8 8 Arquitectura
## 9 9 Civil
## 10 10 TIC
tail(S.datos, 10)
## numero carrera
## 6491 6491 Civil
## 6492 6492 Sistemas
## 6493 6493 Sistemas
## 6494 6494 Arquitectura
## 6495 6495 Sistemas
## 6496 6496 Gestión
## 6497 6497 TIC
## 6498 6498 Civil
## 6499 6499 Civil
## 6500 6500 Gestión
Generando una tabla de distribución para conocer cantidad de alumnos que se generaron o simulados por cada carrera utilizando precisamente la variable carrera del data.frame o del espacio meustral S.Datos.
tabla.distribucion <- table(S.datos$carrera)
tabla.distribucion
##
## Arquitectura Civil Gestión Sistemas TIC
## 2050 1787 1827 662 174
¿Cuál es la probabilidad de elegir a un alumno de TIC?
Se utiliza which(S.datos$carrera == “TIC”) para determinar la cantidad de nn, o sea el número de alumnos de esa carrera y debe concordar con la tabla de distribución
Luego se determina de manera natural la probabilidad de que sea elegido un alumno de esa carrera.
n <- length(which(S.datos$carrera == "TIC"))
n
## [1] 174
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a un alumno de TIC es:" , prob, "%")
## [1] "La probabilidad de elegir a un alumno de TIC es: 2.68 %"
¿Cuál es la probabilidad de elegir a un alumno de Arquitectura?
n <- length(which(S.datos$carrera == "Arquitectura"))
n
## [1] 2050
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a un alumno de Arquitectura es:" , prob, "%")
## [1] "La probabilidad de elegir a un alumno de Arquitectura es: 31.54 %"
¿Cuál es la probabilidad de elegir a un alumno de Sistemas?
n <- length(which(S.datos$carrera == "Sistemas"))
n
## [1] 662
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a un alumno de Sistemas es:" , prob, "%")
## [1] "La probabilidad de elegir a un alumno de Sistemas es: 10.18 %"
¿Cuál es la probabilidad de elegir a un alumno de Civil?
n <- length(which(S.datos$carrera == "Civil"))
n
## [1] 1787
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a un alumno de Civil es:" , prob, "%")
## [1] "La probabilidad de elegir a un alumno de Civil es: 27.49 %"
¿Cuál es la probabilidad de elegir a un alumno de Gestión?
n <- length(which(S.datos$carrera == "Gestión"))
n
## [1] 1827
prob <- n/N #
prob <- round(prob * 100,2)
paste ("La probabilidad de elegir a un alumno de Gestión es:" , prob, "%")
## [1] "La probabilidad de elegir a un alumno de Gestión es: 28.11 %"
El presente caso, el caso número 9, nos habla sobre distintos experimentos relacionados a la probabilidad, pero, ¿qué tenemos como definición de dicho término, siendo que, lo hemos escuchado muchas veces a lo largo de nuestra vida? Justo como el mismo término lo dice, la probabilidad es qué tan posible es que cierto fenómeno pase, qué tan posible es que cierta respuesta aparezca, las posibilidades de un suceso. Se suele relacionar con juegos de azar, como las apuestas de dinero con la probabilidad de que caigan ciertos números en los dados. Si bien es un concepto fácil de comprender, muchas veces podemos estar presentes en un evento de probabilidad y ni siquiera nos damos cuenta. Ya enterados de la definición, y esperando que haya quedado lo suficientemente comprendido, podemos hablar sobre el caso. Se nos presentan 4 situaciones diferentes que son cotidianas y tan simples que no llegamos a pensar que pertenecen a un evento de la probabilidad. El primer evento involucra un conjunto de números previamente elegidos, con la ayuda del software R podemos crear vectores con este conjunto así como otras diversas funciones. Lo que se nos pide en dicha situación es saber la probabilidad en que puede tocar un número primo, uno par y uno non, los resultados fueron los siguientes: iniciando el conteo en 1 hasta 70, avanzando de 5 en 5, la probabilidad de que cayera un número primo fue del 28.57 %. La probabilida de que cayera un número par fue del 50%, la probabilidad de que cayera un número non fue del 50%. En el siguiente evento nos traen 35 canicas, de ellas, 28 son rojas y 7 son negras, siendo los resultados: 28/35 de las rojas (0.8) y 7/35 de las negras (0.2), por lo tanto, hacernos la pregunta de ¿cuál sería la probabilidad de que salga una canica de cualquier otro color? su respuesta sería 0. Continuamos con el siguiente experimento el cual recaba una lista con 70 nombres, donde, probablemente se repitan más de una vez cada uno. Dado a que la herramienta que usamos en R es sample() esta escoge un nombre aleatorio cada vez que se ejecuta, puede ser Agustín con 3 veces, Luis con 8 veces y 0.12% de probabilidad que aparezca, Paty con 3 apariciones y una probabilida de 0.05% o María con 9 veces y 0.14% de probabilidad. Si algo es certero con este experimento es por lo menos saldrá más de una vez el nombre. Por último, hacemos una simulación de un conjunto de 6500 estudiantes de una institución de nivel superior. Cabe recalcar que con la herramienta R es muy fácil manejar conjuntos de datos de tan grandes tamaños. Se crea una tabla de distribución para conocer cantidad de alumnos que se generaron o simulados por cada carrera, con set.seed() evitamos que los datos cambien cada que ejecutamos el código, dándonos los siguientes resultados: Arquitectura con 2050 alumnos, siendo su probabilidad de 2.68%, civil con 1787 alumnos, probabilidad de 27.49%, gestión con 1827 alumnos, probabilidad de 28.11%, sistemas con 662 alumnos, probabilidad de 10.18% y TIC con 174 alumnos con una probabilidad de que aparezca un alumno del 2.68%. Como conclusión del caso, podemos decir que la probabilidad la podemos encontrar en las cosas más simples de la vida. Lo que me deja este caso es el concepto de probabilidad mucho más claro, reafirmar el uso de algunas herramientas de R y como de útil es dicho software.
Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.