Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.
Se cargan las librerías necesarias para ejecutar funciones
Generar conjuntos de datos
Construir todo el espacio muestral llamado S.muestra
Realizar operaciones de conjuntos
Estimar probabilidades con los conjuntos.
Interpretar probabilidades
El conjunto de todos los elementos que pretenecesn a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.
En la unión si hay elementos repetidos sólo se deja uno de ellos.
El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escriben A ∩ B.
El conjunto que consiste en todos los elementos A que no pertenecesn a B se llama la diferencia de A y b y se escribe A - B.
Son todos los conjuntos con los elementos que no están en A y se escribe A´ ó C A. Son todos los elementos que falnta y que no están en A para completar todo el espacio muestral.
Cargar librerías
# install.packages("dplyr")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Crear vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.
Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.
B Basquetbol
F Futbol
K Karate
D Danza
R Rondalla
B <- c("Hugo", "Paty", "Paco", "Luis", "Andrés", "Cristiano", "Gerard", "Leonel", "Neymar")
F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio", "Ana", "Enzo", "Eric", "Eva", "Hugo")
K <- c("Marco", "Mary", "Lucy", "Iván", "Juan", "Lara", "Leo", "Luz")
D <- c("Lucy", "Mary", "Mar", "Nora", "Raúl", "Sara", "Helena")
R <- c("Carlos", "Lola", "José", "Ernesto", "Andrea", "Sergio", "Lucy", "Luis")
Mostrar los vectores a manera de conjuntos
B
## [1] "Hugo" "Paty" "Paco" "Luis" "Andrés" "Cristiano"
## [7] "Gerard" "Leonel" "Neymar"
F
## [1] "Guadalupe" "Luis" "Javier" "Marco" "Aurelio" "Ana"
## [7] "Enzo" "Eric" "Eva" "Hugo"
K
## [1] "Marco" "Mary" "Lucy" "Iván" "Juan" "Lara" "Leo" "Luz"
D
## [1] "Lucy" "Mary" "Mar" "Nora" "Raúl" "Sara" "Helena"
R
## [1] "Carlos" "Lola" "José" "Ernesto" "Andrea" "Sergio" "Lucy"
## [8] "Luis"
Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.
S.muestral <- unique(c(B, F, K, D))
S.muestral
## [1] "Hugo" "Paty" "Paco" "Luis" "Andrés" "Cristiano"
## [7] "Gerard" "Leonel" "Neymar" "Guadalupe" "Javier" "Marco"
## [13] "Aurelio" "Ana" "Enzo" "Eric" "Eva" "Mary"
## [19] "Lucy" "Iván" "Juan" "Lara" "Leo" "Luz"
## [25] "Mar" "Nora" "Raúl" "Sara" "Helena"
N <- length(S.muestral)
N
## [1] 29
La unión entre conjuntos se representa por la literal U.
BUK <- union(B, K)
BUK
## [1] "Hugo" "Paty" "Paco" "Luis" "Andrés" "Cristiano"
## [7] "Gerard" "Leonel" "Neymar" "Marco" "Mary" "Lucy"
## [13] "Iván" "Juan" "Lara" "Leo" "Luz"
BUK es la uni[on de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.
n <- length(BUK)
n
## [1] 17
Determinando la probabilidad de BUK
P.BUK <- n/N
paste("Existen ", n, " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 17 elementos de BUK, lo que representa la probabilidad de 58.62 %"
KUD es la unión de Karate con Danza y n es la cnatidad de eventos de ese conjunto.
KUD <- union(K, D)
n <- length(KUD)
n
## [1] 13
Determinando la probabilidad
P.KUD <- n/N
paste("Existen ", n, " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen 13 elementos de KUD, lo que representa la probabilidad de 44.83 %"
La intersección entre conjuntos representa por el símbolo matemático ∩ y con la letra I de instersección.
¿Cuáles y cuántas personas juegan basquetbol y Futbol y que probabilidad representan?
BIF <- intersect(B, F)
BIF
## [1] "Hugo" "Luis"
n <- length(BIF)
n
## [1] 2
Determinando la probabilidad del conjunto BIF
paste("Hay ", n, " personas que juegan Basquetbol y Fútbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 2 personas que juegan Basquetbol y Fútbol, de un total de 29 lo que representa el 6.9 %"
¿Cuáles y cuántas personas practican Karate y Danza y que probabilidad representan?
KID <- intersect(K, D)
KID
## [1] "Mary" "Lucy"
n <- length(KID)
n
## [1] 2
Determinando la probabilidad del conjunto KID
paste("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 2 personas que juegan Karate y Danza, de un total de 29 lo que representa el 6.9 %"
La operación de diferencia se representa matemáticamente con el símbolo de “-” y en código de R se usarán la frase símbolo “dif” como parte de la variable.
BdifF <- setdiff(B, F)
BdifF
## [1] "Paty" "Paco" "Andrés" "Cristiano" "Gerard" "Leonel"
## [7] "Neymar"
n <- length(BdifF)
n
## [1] 7
Determinando la probabilidad del conjunto BdifF
paste("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 7 personas están en Basquetbol y que no están en Futbol de un total de 29 lo que representa el 24.14 %"
BdifK <- setdiff(B, K)
BdifK
## [1] "Hugo" "Paty" "Paco" "Luis" "Andrés" "Cristiano"
## [7] "Gerard" "Leonel" "Neymar"
n <- length(BdifK)
n
## [1] 9
Determinando la probabilidad del conjunto BdifK
paste("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay 9 personas están en Basquetbol y que no están en Karate de un total de 29 lo que representa el 31.03 %"
Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.
En R se rerpesentará con la letra C
Todos los que no están en Basquetbol CB. Para encontrar el complemento se reutilizar la función setdiff() que en realidad encuentra a quellos que no están en otro subconjunto.
CB <- setdiff(S.muestral, B)
CB
## [1] "Guadalupe" "Javier" "Marco" "Aurelio" "Ana" "Enzo"
## [7] "Eric" "Eva" "Mary" "Lucy" "Iván" "Juan"
## [13] "Lara" "Leo" "Luz" "Mar" "Nora" "Raúl"
## [19] "Sara" "Helena"
n <- length(CB)
n
## [1] 20
paste("El complemento de Basquetbol tiene ", n, " elementos que representan ", round(n/N * 100, 2), "%")
## [1] "El complemento de Basquetbol tiene 20 elementos que representan 68.97 %"
La probabilidad de complemento de un conjunto es resetar su probabilidad a 1:
\[ Comlemento.Basquetbol = 1 - P(Basquetbol) \]
paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) ", 1 - length(B) / N, " representando el ", (1 - length(B) / N ) * 100, "%")
## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.689655172413793 representando el 68.9655172413793 %"
La operación union significa juntar los elementos de un conjunto con los elementos de otro conjunto de datos, aquellos elementos que están repetidos, es decir que pertenecen a ambos conjuntos sólo se toma en cuenta uno de ellos.
La operación Intersección tiene que ver con los elementos que se repiten en uno y otro conjunto.
La operación diferencia son los elementos que pertenecen a un conjunto y que no pertenecen al segundo conjunto.
La operación complemento son los elementos que le faltan para complementar o completar un conjunto mas grande.
Para identificar con el resultado de las operaciones la cantidad de sucesos o eventos que existe y con ello poder determinar en razón de la cantidad total del espacio muestral su probabilidad \(\frac{n}{N}\)
Se tiene que determinar ambas probabilidades y aquella que sea mayor es la respuesta.
n <- length(union(K, F))
PKUF <- n/N
PKUF
## [1] 0.5862069
n <- length(setdiff(F, D))
PFdifD<- n/N
PFdifD
## [1] 0.3448276
paste("Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza.
")
## [1] "Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza. \n\n"
n <- length(setdiff(S.muestral, D))
CD <- n/N
paste("Probabilidad complemento de danza ", CD)
## [1] "Probabilidad complemento de danza 0.758620689655172"
n <- length(union(K, D))
KUD <- n/N
paste("Probabilidad de union Danza y Karate ", KUD)
## [1] "Probabilidad de union Danza y Karate 0.448275862068966"
print("Es mas probable que exista una persona dentro del complmento de Danza a que haya una entre Danza y Karate")
## [1] "Es mas probable que exista una persona dentro del complmento de Danza a que haya una entre Danza y Karate"
n <- length(intersect(B, K))
BIK <- n/N
paste("Probabilidad que haya una persona que practique Basquetbol y Karate es de: ", BIK, " lo cual representa ", round(BIK *100, 2), "%")
## [1] "Probabilidad que haya una persona que practique Basquetbol y Karate es de: 0 lo cual representa 0 %"
n <- length(intersect(R, D))
RUD <- n/N
paste("Probabilidad de que una persona practique Rondalla y Danza es de ", RUD, " lo que reperesenta el ", round(RUD*100,2),"%")
## [1] "Probabilidad de que una persona practique Rondalla y Danza es de 0.0344827586206897 lo que reperesenta el 3.45 %"
n <- length(intersect(R, D))
RUD <- n/N
paste("Probabilidad de que una persona practique Danza y rondalla: ", RUD, " lo que repesenta ", round(RUD *100,2),"%")
## [1] "Probabilidad de que una persona practique Danza y rondalla: 0.0344827586206897 lo que repesenta 3.45 %"
n <- length(intersect(B, intersect(K, D)))
Bikid <- n/N
paste("Probabilidad de que haya una intersección entre Basquetbol, Karate y Danza es de ", Bikid, " lo que representa ", round(Bikid * 100,2), "%")
## [1] "Probabilidad de que haya una intersección entre Basquetbol, Karate y Danza es de 0 lo que representa 0 %"
print("Las probabilidades de que una persona practique Danza y rondalla son mas altas que el caso en que una persona practique Basquetbol, Karate y Danza")
## [1] "Las probabilidades de que una persona practique Danza y rondalla son mas altas que el caso en que una persona practique Basquetbol, Karate y Danza"
print("Las probabilidades de que una persona practique Basquetbol, Karate y Danza son básicamente nulas")
## [1] "Las probabilidades de que una persona practique Basquetbol, Karate y Danza son básicamente nulas"