1 Objetivo

Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.

2 Descripción

  • Se cargan las librerías necesarias para ejecutar funciones

  • Generar conjuntos de datos

  • Construir todo el espacio muestral llamado S.muestra

  • Realizar operaciones de conjuntos

  • Estimar probabilidades con los conjuntos.

  • Interpretar probabilidades

3 Marco teórico

3.1 Operación Union U.

El conjunto de todos los elementos que pertenecen a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.

En la unión si hay elementos repetidos sólo se deja uno de ellos.

3.2 Operación intersección ∩

El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩ B.

3.3 Operación diferencia -

El conjunto que consiste en todos los elementos de A que no pertenecen a B se llama la diferencia de A y B y se escribe A – B.

3.4 Operación complemento [C o ’]

Son todos los conjuntos con los elementos que no están en A y se escribe A’ ó C A. Son todos los elementos que faltan y que no están en A para complementar todo el espacio muestral.

4 Desarrollo

Cargar librerías

# install.packages("dplyr")
library(dplyr)

Crear vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.

Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.

  • B Basquetbol

  • F Futbol

  • K Karate

  • D Danza

  • R Rondalla

B <- c("Hugo", "Paty", "Paco", "Luis", "Leonardo", "Sebastián", "Lucy")
F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio", "Sebastián")
K <- c("Marco", "Mary", "Lucy", "Yariel", "Leonardo", "Andrés")
D <- c("Lucy", "Mary", "Fani", "Paty")
R <- c("Sebastián", "Yariel", "Andrés")
# Ejemplo de nuevos conjuntos ....
# B <- c("Hugo", "Paty", "Paco", "Luis", "Javier", "Rubén", "Carlos", "Lola", "Lidia")
# F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio", "Carlos", "Lola", "Luisa", "Andrea", "Mayra")
# K <- c("Marco", "Mary", "Lucy", "Lola", "Rubén", "Aurelio")
# D <- c("Lucy", "Mary", "Carlos", "Marco", "Andrea", "Mayra")
# R <- c("Carlos", "Lola", "José", "Ernesto", "Andrea", "Sergio", "Lucy", "Luis")

Mostrar los vectores a manera de conjuntos

B
## [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Leonardo"  "Sebastián"
## [7] "Lucy"
F
## [1] "Guadalupe" "Luis"      "Javier"    "Marco"     "Aurelio"   "Sebastián"
K
## [1] "Marco"    "Mary"     "Lucy"     "Yariel"   "Leonardo" "Andrés"
D
## [1] "Lucy" "Mary" "Fani" "Paty"
R
## [1] "Sebastián" "Yariel"    "Andrés"

4.1 Construir el espacio muestral

Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.

S.muestral <- unique(c(B, F, K, D, R))
S.muestral
##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Leonardo"  "Sebastián"
##  [7] "Lucy"      "Guadalupe" "Javier"    "Marco"     "Aurelio"   "Mary"     
## [13] "Yariel"    "Andrés"    "Fani"
N <- length(S.muestral)
N
## [1] 15

4.2 Unión entre conjuntos

La unión entre conjuntos se representa por la literal U.

4.2.1 Union Basquetbol y Karate

BUK <- union(B, K)
BUK
##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Leonardo"  "Sebastián"
##  [7] "Lucy"      "Marco"     "Mary"      "Yariel"    "Andrés"

BUK es a unión de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.

n <- length(BUK)
n
## [1] 11

Determinando la probabilidad de BUK.

P.BUK <- n/N
paste("Existen ", n,  " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen  11  elementos de BUK,   lo que representa la probabilidad de  73.33 %"

4.2.2 Karate union con Danza

KUD es la unión de Karate con Danza y n es la cantidad de eventos de ese conjunto

KUD <- union(K, D)
n <- length(KUD)
n
## [1] 8

Determinando la probabilidad

P.KUD <- n/N
paste("Existen ", n,  " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen  8  elementos de KUD,   lo que representa la probabilidad de  53.33 %"

4.3 Intersección entre conjuntos

La intersección entre conjuntos representa por el símbolo matemático y con la letra I de instersección.

4.3.1 Intersección de Basquetbol con Futbol

¿Cuáles y cuántas personas juegan Basquetbol y Futbol y que probabilidad representan?

BIF <- intersect(B, F)
BIF
## [1] "Luis"      "Sebastián"
n <- length(BIF)
n
## [1] 2

Determinando la probabilidad del conjunto BIF

paste ("Hay ", n, " personas que juegan Basquetbl y Futbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  2  personas que juegan Basquetbl y Futbol, de un total de  15  lo que representa el  13.33 %"

4.3.2 Intersección de Karate con Danza

¿Cuáles y cuántas personas practican Krate y Danza y que probabilidad representan?

KID <- intersect(K, D)
KID
## [1] "Mary" "Lucy"
n <- length(KID)
n
## [1] 2

Determinando la probabilidad del conjunto KID

paste ("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  2  personas que juegan Karate y Danza, de un total de  15  lo que representa el  13.33 %"

4.4 Diferencia entre conjuntos

La operación de diferencia se representa matemáticamente con el símbolo de “-” y en código de R se usarán la frase símbolo “dif” como parte de la variable.

4.4.1 Basquetbol menos Futbol

BdifF <- setdiff(B, F)
BdifF
## [1] "Hugo"     "Paty"     "Paco"     "Leonardo" "Lucy"
n <- length(BdifF)
n
## [1] 5

Determinando la probabilidad del conjunto BdifF

paste ("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  5  personas están en Basquetbol y que no están en Futbol de un total de  15  lo que representa el  33.33 %"

4.4.2 Basquetbol menos Karate

BdifK <- setdiff(B, K)
BdifK
## [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Sebastián"
n <- length(BdifK)
n
## [1] 5

Determinando la probabilidad del conjunto BdifK

paste ("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  5  personas están en Basquetbol y que no están en Karate de un total de  15  lo que representa el  33.33 %"

4.5 Complemento entre conjuntos

Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.

En R se representará con la letra C

4.5.1 Completo de Básquetbol

Todos los que no están en Básquetbol CB. Para encontrar el complemento se reutiliza la función setdiff() que en realidad encuentra aquellos que no están en otro subconjunto.

CB <- setdiff(S.muestral, B)
CB
## [1] "Guadalupe" "Javier"    "Marco"     "Aurelio"   "Mary"      "Yariel"   
## [7] "Andrés"    "Fani"
n <- length(CB)
n
## [1] 8
paste ("El complemento de Basquetbol tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")
## [1] "El complemento de Basquetbol tiene 8  elementos que representan  53.33 %"

La probabilidad de complemento de un conjunto es restar su probabilidad a 1:

\[ Complemento.Basquetbol = 1 - P(Basquetbol) \]

paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol)", 1 - length(B) / N, " representando el ", (1 - length(B) / N) * 100, "%") 
## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.533333333333333  representando el  53.3333333333333 %"

5 Interpretación

5.1 ¿Qué representa cada operación de las vistas en el caso?

La Unión es una operación que dicta unir a los elementos de ambos conjuntos, y en caso de que ambos tengan elementos en común, solo tomando a uno de ellos para el nuevo conjunto que resulte de ello.

La Intersección es una operación que dicta buscar a los elementos en común que tengan los conjuntos.

La Diferencia es una operación que dicta buscar a los elementos de un segundo conjunto y quitarlos, dejando únicamente a los elementos únicos del primer conjunto.

El complemento es una operación que dicta quitar de los elementos de un universo (o bien un conjunto mayor), los de un conjunto dado.

5.2 ¿Para qué usar operaciones de conjuntos en términos de probabilidad?

Como una manera más sencilla de encontrar en qué casos los eventos pueden cumplirse, permitiéndonos representarlo de manera gráfica con diagramas de Venn, también podemos contar cuántas veces se pudo cumplir el evento y calcular la probabilidad de que ocurra.

5.3 Qué es mas probable:

5.3.1 ¿Que exista una persona que participe en Karate o Fútbol (unión) o que exista una persona de la diferencia entre Fútbol menos Danza?.

Se tiene que determinar ambas probabilidades y aquella que sea mayor es la respuesta

KUF = union(K, F)
n = length(KUF)
PKUF = n / N * 100
KUF # Personas en Karate o Fútbol
##  [1] "Marco"     "Mary"      "Lucy"      "Yariel"    "Leonardo"  "Andrés"   
##  [7] "Guadalupe" "Luis"      "Javier"    "Aurelio"   "Sebastián"
paste("Probabilidad de encontrar una persona que participe en Karate o Fútbol: ", round(PKUF, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que participe en Karate o Fútbol: 73.33%"
FdifD = setdiff(F, D)
n = length(FdifD)
PFdifD = n / N * 100
FdifD # Personas en Fútbol menos Danza
## [1] "Guadalupe" "Luis"      "Javier"    "Marco"     "Aurelio"   "Sebastián"
paste("Probabilidad de encontrar una persona que participe en Fútbol pero no en danza: ", round(PFdifD, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que participe en Fútbol pero no en danza: 40%"

Es más probable encontrar una persona que participe en Karate o Fútbol, con un 73.33% de probabilidad a encontrar una persona que participe en Fútbol pero no en Danza, este con un 40% de probabilidad.

5.3.2 ¿Que existe una persona en el complemento de Danza o que exista una persona en la unión de Danza y Karate?

CD = setdiff(S.muestral, D)
n = length(CD)
PCD = n / N * 100
CD # Personas que no están en Danza
##  [1] "Hugo"      "Paco"      "Luis"      "Leonardo"  "Sebastián" "Guadalupe"
##  [7] "Javier"    "Marco"     "Aurelio"   "Yariel"    "Andrés"
paste("Probabilidad de encontrar una persona que no participe Danza: ", round(PCD, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que no participe Danza: 73.33%"
DUK = union(D, K)
n = length(DUK)
PDUK = n / N * 100
DUK # Personas en Danza y Karate
## [1] "Lucy"     "Mary"     "Fani"     "Paty"     "Marco"    "Yariel"   "Leonardo"
## [8] "Andrés"
paste("Probabilidad de encontrar una persona que participe en Danza o Karate: ", round(PDUK, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que participe en Danza o Karate: 53.33%"

Es más probable encontrar una persona que no participe Danza, con un 73.33% de probabilidad a encontrar una persona que participe en Danza o Karate, este con un 53.33% de probabilidad.

5.3.3 ¿Existe probabilidad de que hay personas que practiquen Básquetbol y Karate?, de cuánto?

BIK = intersect(B, K)
n = length(BIK) 
PBIK = n / N * 100
BIK # Personas en Básquetbol y Karate
## [1] "Leonardo" "Lucy"
paste("Probabilidad de encontrar una persona que partipe en Básquetbol y Karate: ", round(PBIK, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que partipe en Básquetbol y Karate: 13.33%"

Sí, existe posibilidad de encontrar a alguien en Básquetbol y Karate, y es de 13.33%

5.3.4 ¿Cuántos y cuál es la probabilidad de personas que practiquen Rondalla y Danza?

RID = intersect(R, D)
n = length(RID)
PRID = n / N * 100
RID # Personas en Rondalla y Danza
## character(0)
paste("Probabilidad de encontrar una persona que partipe en Rondalla y Danza: ", round(PRID, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que partipe en Rondalla y Danza: 0%"

No hay nadie que practique Rondalla y Danza, por tanto, la probabilidad es de 0%.

5.3.5 ¿Qué es más probable: personas que practiquen Danza y Rondalla o Básquetbol y Karate y Danza?

DR = intersect(D, R)
n = length(DR)
PRD = n / N * 100
DR # Personas Rondalla y Danza
## character(0)
paste("Probabilidad de encontrar una persona que partipe en Danza y Rondalla: ", round(PRD, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que partipe en Danza y Rondalla: 0%"
BIKID = intersect(intersect(B, K), D)
n = length(BIKID)
PBIKID = n / N * 100
BIKID # Personas en Básquetbol, Karate y Danza
## [1] "Lucy"
paste("Probabilidad de encontrar una persona que participe en Básquetbol, Karate y Danza: ", round(PBIKID, 2), "%", sep = "")
## [1] "Probabilidad de encontrar una persona que participe en Básquetbol, Karate y Danza: 6.67%"

La probabilidad de encontrar a alguien en Danza y Rondalla es de 0% debido a que no hay nadie que practique ambas, por tanto, mientras que la probabilidad de encontrar a alguien en Básquetbol, Karate y Danza es de 6.67%.