Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.
Se cargan las librerías necesarias para ejecutar funciones
Generar conjuntos de datos
Construir todo el espacio muestral llamado S.muestra
Realizar operaciones de conjuntos
Estimar probabilidades con los conjuntos.
Interpretar probabilidades
El conjunto de todos los elementos que pertenecen a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.
En la unión si hay elementos repetidos sólo se deja uno de ellos.
El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩ B.
El conjunto que consiste en todos los elementos de A que no pertenecen a B se llama la diferencia de A y B y se escribe A – B.
Son todos los conjuntos con los elementos que no están en A y se escribe A’ ó C A. Son todos los elementos que faltan y que no están en A para complementar todo el espacio muestral.
CARGAR LIBRERÍAS
library(dplyr)
Crear vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.
Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.
B Basquetbol
F Futbol
K Karate
D Danza
R Rondalla
B <- c("Hugo", "Paty", "Paco", "Luis", "Cristina", "Juan", "Denise", "Sergio", "Cynthia", "Lluvia")
F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio", "Elio", "Martha", "Cynthia", "Dibanhi","Carlos")
K <- c("Marco", "Mary", "Lucy", "José", "Guadalupe", "Víctor", "Isaac", "Martha", "Cynthia")
D <- c("Lucy", "Mary", "Carolina", "Hugo", "Diego", "Alejandro", "José")
R <- c("Lluvia", "José", "Hugo", "Paco", "Luis", "Marco", "Lucy", "Joshua", "Miguel")
Mostrar los vectores a manera de conjuntos
B
## [1] "Hugo" "Paty" "Paco" "Luis" "Cristina" "Juan"
## [7] "Denise" "Sergio" "Cynthia" "Lluvia"
F
## [1] "Guadalupe" "Luis" "Javier" "Marco" "Aurelio" "Elio"
## [7] "Martha" "Cynthia" "Dibanhi" "Carlos"
K
## [1] "Marco" "Mary" "Lucy" "José" "Guadalupe" "Víctor"
## [7] "Isaac" "Martha" "Cynthia"
D
## [1] "Lucy" "Mary" "Carolina" "Hugo" "Diego" "Alejandro"
## [7] "José"
R
## [1] "Lluvia" "José" "Hugo" "Paco" "Luis" "Marco" "Lucy" "Joshua"
## [9] "Miguel"
Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.
S.muestral <- unique(c(B,F,K,D))
S.muestral
## [1] "Hugo" "Paty" "Paco" "Luis" "Cristina" "Juan"
## [7] "Denise" "Sergio" "Cynthia" "Lluvia" "Guadalupe" "Javier"
## [13] "Marco" "Aurelio" "Elio" "Martha" "Dibanhi" "Carlos"
## [19] "Mary" "Lucy" "José" "Víctor" "Isaac" "Carolina"
## [25] "Diego" "Alejandro"
N <- length(S.muestral)
N
## [1] 26
La unión entre conjuntos se representa por la literal U.
BUK <- union(B, K)
BUK
## [1] "Hugo" "Paty" "Paco" "Luis" "Cristina" "Juan"
## [7] "Denise" "Sergio" "Cynthia" "Lluvia" "Marco" "Mary"
## [13] "Lucy" "José" "Guadalupe" "Víctor" "Isaac" "Martha"
BUK es a unión de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.
n<-length(BUK)
n
## [1] 18
Determinando la probabilidad de BUK.
P.BUK <- n/N
paste("Existen ", n, " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 18 elementos de BUK, lo que representa la probabilidad de 69.23 %"
KUD es la unión de Karate con Danza y n es la cantidad de eventos de ese conjunto
KUD <- union(K, D)
KUD
## [1] "Marco" "Mary" "Lucy" "José" "Guadalupe" "Víctor"
## [7] "Isaac" "Martha" "Cynthia" "Carolina" "Hugo" "Diego"
## [13] "Alejandro"
n <- length(KUD)
n
## [1] 13
Determinar probabilidad
P.KUD <- n/N
paste("Existen ", n, " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 13 elementos de KUD, lo que representa la probabilidad de 50 %"
La intersección entre conjuntos representada pro el símbolo matemático ∩ y con la letra I de instersección.
¿Cuáles y cuántas personas juegan Basquetbol y Futbol y que probabilidad representan?
BIF <- intersect(B, F)
BIF
## [1] "Luis" "Cynthia"
n <- length(BIF)
n
## [1] 2
Determinando la probabilidad del conjunto BIF
paste ("Hay ", n, " personas que juegan Basquetbol y Futbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 2 personas que juegan Basquetbol y Futbol, de un total de 26 lo que representa el 7.69 %"
¿Cuáles y cuántas personas practican Krate y Danza y que probabilidad representan?
KID <- intersect(K, D)
KID
## [1] "Mary" "Lucy" "José"
n <- length(KID)
n
## [1] 3
Determinando la probabilidad del conjunto KID
paste ("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 3 personas que juegan Karate y Danza, de un total de 26 lo que representa el 11.54 %"
La operación de diferencia se representa matemáticamente con el símbolo de “-” y en código de R se usarán la frase símbolo “dif” como parte de la variable.
BdifF <- setdiff(B, F)
BdifF
## [1] "Hugo" "Paty" "Paco" "Cristina" "Juan" "Denise" "Sergio"
## [8] "Lluvia"
n <- length(BdifF)
n
## [1] 8
Determinando la probabilidad del conjunto BdifF
paste ("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 8 personas están en Basquetbol y que no están en Futbol de un total de 26 lo que representa el 30.77 %"
BdifK <- setdiff(B, K)
BdifK
## [1] "Hugo" "Paty" "Paco" "Luis" "Cristina" "Juan" "Denise"
## [8] "Sergio" "Lluvia"
n <- length(BdifK)
n
## [1] 9
Determinando la probabilidad del conjunto BdifK
paste ("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 9 personas están en Basquetbol y que no están en Karate de un total de 26 lo que representa el 34.62 %"
Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.
En R se rerpesentará con la letra C
Todos los que no están en Basquetbol CB. Para encontrar el complemento se reutiliza la función setdiff() que en realidad encuentra aquellos que no están en otro subconjunto.
CB <- setdiff(S.muestral, B)
CB
## [1] "Guadalupe" "Javier" "Marco" "Aurelio" "Elio" "Martha"
## [7] "Dibanhi" "Carlos" "Mary" "Lucy" "José" "Víctor"
## [13] "Isaac" "Carolina" "Diego" "Alejandro"
n <- length(CB)
n
## [1] 16
paste ("El complemento de Basquetbol tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")
## [1] "El complemento de Basquetbol tiene 16 elementos que representan 61.54 %"
La probabilidad de complemento de un conjunto es restar su probabilidad a 1:
\[ Complemento.Basquetbol = 1 - P(Basquetbol) \]
paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol)", 1 - length(B) / N, " representando el ", (1 - length(B) / N) * 100, "%")
## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.615384615384615 representando el 61.5384615384615 %"
La operación de unión, suma de ambos conjuntos de datos, a excepción de los datos repetidos, esto quiere decir que toma uno solo de los datos, sin embargo el nuevo conjunto contiene los datos de los dos conjuntos.
La operación de intersección, toma los datos que se repiten en cada conjunto, es decir, los datos que tienen en común.
La operación de diferencia, son los datos de un conjunto pero que no son parte del segundo conjunto
Por ultimo la operación complemento son los datos que le hacen falta a un conjunto para crear uno más grande.
Con estas operaciones se puede identificar la cantidad de sucesos o eventos que existen y con ello determinar la frecuencia de conjuntos, esto puede ayudar en la toma de decisiones para mercadotecnia o para mantener al cliente, por ejemplo, viendo el conjunto de productos que usualmente son comprados por ellos, etc.
n <- length(union(K, F))
PKUF <- round(n/N * 100,2)
PKUF
## [1] 57.69
n <- length(setdiff(F, D))
PFdifD<- round(n/N * 100,2)
PFdifD
## [1] 38.46
paste("Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza.")
## [1] "Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza."
CD <- setdiff(S.muestral, D)
n <- length(CD)
Prob <- round((1 - length(D) / N) * 100,2)
Prob
## [1] 73.08
n <- length(union(D, K))
PKUF <- round(n/N * 100,2)
PKUF
## [1] 50
paste("Es más probable que exista una persona en el complemento de Danza a que exista una persona en la unión de Danza y Karate")
## [1] "Es más probable que exista una persona en el complemento de Danza a que exista una persona en la unión de Danza y Karate"
n <- length(intersect(B, K))
PBIK <- round(n/N * 100,2)
PBIK
## [1] 3.85
paste("Si, existe una probabilidad de", PBIK, "%, de que haya personas que practiquen Basquetbol y Karate")
## [1] "Si, existe una probabilidad de 3.85 %, de que haya personas que practiquen Basquetbol y Karate"
n <- length(intersect(R, D))
n
## [1] 3
PRID <- round(n/N * 100,2)
PRID
## [1] 11.54
paste("Existen", n, "personas que practiquen Rondalla y Danza y representan una probabilidad de ", PRID, "%")
## [1] "Existen 3 personas que practiquen Rondalla y Danza y representan una probabilidad de 11.54 %"
n <- length(intersect(D, R))
PDIR <- round(n/N * 100,2)
PDIR
## [1] 11.54
n <- length(intersect(B, K))
n2 <- length(intersect(n,D))
PBIKID <- round(n2/N * 100,2)
PBIKID
## [1] 0
paste("Personas que practiquen Danza y Rondalla, ya que tienen una probabilidad de ", PDIR, "%, en cambio, la probabilidad que una persona practique Basquetbol, Karete y Danza es de ", PBIKID ,"%.")
## [1] "Personas que practiquen Danza y Rondalla, ya que tienen una probabilidad de 11.54 %, en cambio, la probabilidad que una persona practique Basquetbol, Karete y Danza es de 0 %."