Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.
📋 Se cargan las librerías necesarias para ejecutar funciones.
📋 Generar conjuntos de datos.
📋 Construir todo el espacio muestral llamado S.muestra
📋 Realizar operaciones de conjuntos.
📋 Estimar probabilidades con los conjuntos.
📋 Interpretar probabilidades.
El conjunto de todos los elementos que pertenecen a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.
En la unión si hay elementos repetidos sólo se deja uno de ellos.
El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩ B.
El conjunto que consiste en todos los elementos de A que no pertenecen a B se llama la diferencia de A y B y se escribe A – B.
Son todos los conjuntos con los elementos que no están en A y se escribe A’ ó C A. Son todos los elementos que faltan y que no están en A para complementar todo el espacio muestral.
Cargar librerías
# install.packages("dplyr")
library(dplyr)
Crear vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.
Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.
🏀 B Basquetbol ️⚽️ F Futbol 🥋 K Karate 💃 D Danza 🎷 R Rondalla
B <- c("Marnie", "Yuuta", "Falco", "Gwen","Cynthia","Aaron","Fernando","Juja","Rubén")
F <- c("Rubén", "Juja", "Fernando", "Aaron", "Marnie","Scarlett","Mina","Erick","Pepe","Yumi")
K <- c("Yumi", "Marnie", "Cynthia","Raúl","Yuuta","Juja","Gwen","Ezreal")
D <- c("Marnie", "Gwen","Rubén","Melany","Erick","Raúl","Falco")
R <- c("Erick", "Marnie","Yumi","Scarlett","Raúl","Mina","Pepe","Ezreal")
# Ejemplo de nuevos conjuntos ....
# B <- c("Hugo", "Paty", "Paco", "Luis", "Javier", "Rubén", "Carlos", "Lola", "Lidia")
# F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio", "Carlos", "Lola", "Luisa", "Andrea", "Mayra")
# K <- c("Marco", "Mary", "Lucy", "Lola", "Rubén", "Aurelio")
# D <- c("Lucy", "Mary", "Carlos", "Marco", "Andrea", "Mayra")
# R <- c("Carlos", "Lola", "José", "Ernesto", "Andrea", "Sergio", "Lucy", "Luis")
Mostrar los vectores a manera de conjuntos
B
## [1] "Marnie" "Yuuta" "Falco" "Gwen" "Cynthia" "Aaron" "Fernando"
## [8] "Juja" "Rubén"
F
## [1] "Rubén" "Juja" "Fernando" "Aaron" "Marnie" "Scarlett"
## [7] "Mina" "Erick" "Pepe" "Yumi"
K
## [1] "Yumi" "Marnie" "Cynthia" "Raúl" "Yuuta" "Juja" "Gwen"
## [8] "Ezreal"
D
## [1] "Marnie" "Gwen" "Rubén" "Melany" "Erick" "Raúl" "Falco"
R
## [1] "Erick" "Marnie" "Yumi" "Scarlett" "Raúl" "Mina" "Pepe"
## [8] "Ezreal"
Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.
S.muestral <- unique(c(B, F, K, D))
S.muestral
## [1] "Marnie" "Yuuta" "Falco" "Gwen" "Cynthia" "Aaron"
## [7] "Fernando" "Juja" "Rubén" "Scarlett" "Mina" "Erick"
## [13] "Pepe" "Yumi" "Raúl" "Ezreal" "Melany"
N <- length(S.muestral)
N
## [1] 17
La unión entre conjuntos se representa por la literal U.
BUK <- union(B, K)
BUK
## [1] "Marnie" "Yuuta" "Falco" "Gwen" "Cynthia" "Aaron"
## [7] "Fernando" "Juja" "Rubén" "Yumi" "Raúl" "Ezreal"
BUK es a unión de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.
n <- length(BUK)
n
## [1] 12
Determinando la probabilidad de BUK.
P.BUK <- n/N
paste("Existen ", n, " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 12 elementos de BUK, lo que representa la probabilidad de 70.59 %"
KUD es la unión de Karate con Danza y n es la cantidad de eventos de ese conjunto
KUD <- union(K, D)
n <- length(KUD)
n
## [1] 12
Determinando la probabilidad
P.KUD <- n/N
paste("Existen ", n, " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 12 elementos de KUD, lo que representa la probabilidad de 70.59 %"
La intersección entre conjuntos representa por el símbolo matemático ∩ y con la letra I de instersección.
¿Cuáles y cuántas personas juegan Basquetbol y Futbol y que probabilidad representan?
BIF <- intersect(B, F)
BIF
## [1] "Marnie" "Aaron" "Fernando" "Juja" "Rubén"
n <- length(BIF)
n
## [1] 5
Determinando la probabilidad del conjunto BIF
paste ("Hay ", n, " personas que juegan Basquetbl y Futbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 5 personas que juegan Basquetbl y Futbol, de un total de 17 lo que representa el 29.41 %"
¿Cuáles y cuántas personas practican Krate y Danza y que probabilidad representan?
KID <- intersect(K, D)
KID
## [1] "Marnie" "Raúl" "Gwen"
n <- length(KID)
n
## [1] 3
Determinando la probabilidad del conjunto KID
paste ("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 3 personas que juegan Karate y Danza, de un total de 17 lo que representa el 17.65 %"
La operación de diferencia se representa matemáticamente con el símbolo de “-” y en código de R se usarán la frase símbolo “dif” como parte de la variable.
BdifF <- setdiff(B, F)
BdifF
## [1] "Yuuta" "Falco" "Gwen" "Cynthia"
n <- length(BdifF)
n
## [1] 4
Determinando la probabilidad del conjunto BdifF
paste ("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 4 personas están en Basquetbol y que no están en Futbol de un total de 17 lo que representa el 23.53 %"
BdifK <- setdiff(B, K)
BdifK
## [1] "Falco" "Aaron" "Fernando" "Rubén"
n <- length(BdifK)
n
## [1] 4
Determinando la probabilidad del conjunto BdifK
paste ("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 4 personas están en Basquetbol y que no están en Karate de un total de 17 lo que representa el 23.53 %"
Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.
En R se rerpesentará con la letra C
Todos los que no están en Basquetbol CB. Para encontrar el complemento se reutiliza la función setdiff() que en realidad encuentra aquellos que no están en otro subconjunto.
CB <- setdiff(S.muestral, B)
CB
## [1] "Scarlett" "Mina" "Erick" "Pepe" "Yumi" "Raúl" "Ezreal"
## [8] "Melany"
n <- length(CB)
n
## [1] 8
paste ("El complemento de Basquetbol tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")
## [1] "El complemento de Basquetbol tiene 8 elementos que representan 47.06 %"
La probabilidad de complemento de un conjunto es restar su probabilidad a 1:
\[ Complemento.Basquetbol = 1 - P(Basquetbol) \]
paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol)", 1 - length(B) / N, " representando el ", (1 - length(B) / N) * 100, "%")
## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.470588235294118 representando el 47.0588235294118 %"
La operación union significa juntar los elementos de un conjunto con los elementos de otro conjunto de datos, aquellos elementos que están repetidos, es decir que pertenecen a ambos conjuntos sólo se toma en cuenta uno de ellos.
La operación Intersección tiene que ver con los elementos que se repiten en uno y otro conjunto.
La operación diferencia son los elementos que pertenecen a un conjunto y que no pertenecen al segundo conjunto.
La operación complemento son los elementos que le faltan para complementar o completar un conjunto mas grande.
Para identificar con el resultado de las operaciones la cantidad de sucesos o eventos que existe y con ello poder determinar en razón de la cantidad total del espacio muestral su probabilidad \(\frac{n}{N}\)
Se tiene que determinar ambas probabilidades y aquella que sea mayor es la respuesta
n <- length(union(K, F))
PKUF <- n/N
PKUF
## [1] 0.8823529
n <- length(setdiff(F, D))
PFdifD<- n/N
PFdifD
## [1] 0.4117647
paste("Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza.")
## [1] "Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza."
CD <- setdiff(S.muestral, D)
pi <- length(CB)
paste ("El complemento de Danza tiene", pi , " elementos que representan ", round(pi/N * 100, 2), "%")
## [1] "El complemento de Danza tiene 8 elementos que representan 47.06 %"
DUK <- union(D, K)
n <- length(DUK)
P.DUK <- n/N
paste("Existen ", n, " elementos de DUK ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 12 elementos de DUK lo que representa la probabilidad de 70.59 %"
paste("Es mayor la probabilidad de que exista una persona en la unión de DUK")
## [1] "Es mayor la probabilidad de que exista una persona en la unión de DUK"
BIK <- intersect(B, K)
n <- length(BIK)
paste ("Hay ", n, " persona que juegan Basquetbol y Karate, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 5 persona que juegan Basquetbol y Karate, de un total de 17 lo que representa el 29.41 %"
RID <- intersect(R, D)
n <- length(RID)
paste ("Hay ", n, " persona que juegan Rondalla y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 3 persona que juegan Rondalla y Danza, de un total de 17 lo que representa el 17.65 %"
DIR <- intersect(D, R)
n <- length(DIR)
paste ("Hay ", n, " persona que practica Danza y Rondalla, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 3 persona que practica Danza y Rondalla, de un total de 17 lo que representa el 17.65 %"
BIK <- intersect(B,K)
BIKID <- intersect(BIK,D)
n <- length(BIKID)
paste ("Hay ", n, " persona que practica Basquetbol y Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 2 persona que practica Basquetbol y Karate y Danza, de un total de 17 lo que representa el 11.76 %"
paste ("Es mas probable personas que practiquen danza y rondalla.")
## [1] "Es mas probable personas que practiquen danza y rondalla."