Objetivo

Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.

Descripción

Se cargan las librerías necesarias para ejecutar funciones
Generar conjuntos de datos
Construir todo el espacio muestral llamado S.muestra
Realizar operaciones de conjuntos
Estimar probabilidades con los conjuntos.
Interpretar probabilidades

Marco teórico

Operación Union U.

El conjunto de todos los elementos que pertenecen a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.

En la unión si hay elementos repetidos sólo se deja uno de ellos.

Operación intersección ∩

El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩ B.

Operación diferencia -

El conjunto que consiste en todos los elementos de A que no pertenecen a B se llama la diferencia de A y B y se escribe A – B.

Operación complemento [C ó ´]

Son todos los conjuntos con los elementos que no están en A y se escribe A’ ó C A. Son todos los elementos que faltan y que no están en A para complementar todo el espacio muestral.

Desarrollo

Cargar librerías

library(dplyr)

Crear vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.

Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.

B Basquetbol
F Futbol
K Karate
D Danza
R Rondalla
FS Futbol de Salon

B <- c("Hugo", "Paty", "Paco", "Luis")
F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio")
K <- c("Marco", "Mary", "Lucy")
D <- c("Lucy", "Mary")
R <- c("Misaki", "Carlos","Ana","Lorenzo","Eduardo")
FS <-c("Paty","Mary","Marco","Carlos")

Mostrar los vectores a manera de conjuntos

## [1] "Hugo" "Paty" "Paco" "Luis"

## [1] "Guadalupe" "Luis"      "Javier"    "Marco"     "Aurelio"

## [1] "Marco" "Mary"  "Lucy"

## [1] "Lucy" "Mary"

## [1] "Misaki"  "Carlos"  "Ana"     "Lorenzo" "Eduardo"

FS

## [1] "Paty"   "Mary"   "Marco"  "Carlos"

Construir el espacio muestral

Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.

S.muestral <- unique(c(B, F, K, D, R, FS))
S.muestral

##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Guadalupe" "Javier"   
##  [7] "Marco"     "Aurelio"   "Mary"      "Lucy"      "Misaki"    "Carlos"   
## [13] "Ana"       "Lorenzo"   "Eduardo"

N <- length(S.muestral)
N

## [1] 15

Unión entre conjuntos

La unión entre conjuntos se representa por la literal U.

Union Basquetbol y Karate

BUK <- union(B, K)
BUK

## [1] "Hugo"  "Paty"  "Paco"  "Luis"  "Marco" "Mary"  "Lucy"

BUK es a unión de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.

n <- length(BUK)
n

## [1] 7

Determinando la probabilidad de BUK.

P.BUK <- n/N

paste("Existen ", n,  " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  7  elementos de BUK,   lo que representa la probabilidad de  46.67 %"

Karate union con Danza

KUD es la unión de Karate con Danza y n es la cantidad de eventos de ese conjunto

KUD <- union(K, D)
n <- length(KUD)
n

## [1] 3

Determinando la probabilidad

P.KUD <- n/N

paste("Existen ", n,  " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  3  elementos de KUD,   lo que representa la probabilidad de  20 %"

Intersección entre conjuntos

La intersección entre conjuntos representa por el símbolo matemático ∩ y con la letra I de instersección.

Intersección de Basquetbol con Futbol

¿Cuáles y cuántas personas juegan Basquetbol y Futbol y que probabilidad representan?

BIF <- intersect(B, F)
BIF

## [1] "Luis"

n <- length(BIF)
n

## [1] 1

Determinando la probabilidad del conjunto BIF

paste ("Hay ", n, " personas que juegan Basquetbl y Futbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")

## [1] "Hay  1  personas que juegan Basquetbl y Futbol, de un total de  15  lo que representa el  6.67 %"

Intersección de Karate con Danza

¿Cuáles y cuántas personas practican Krate y Danza y que probabilidad representan?

KID <- intersect(K, D)
KID

## [1] "Mary" "Lucy"

n <- length(KID)
n

## [1] 2

Determinando la probabilidad del conjunto KID

paste ("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")

## [1] "Hay  2  personas que juegan Karate y Danza, de un total de  15  lo que representa el  13.33 %"

Diferencia entre conjuntos

La operación de diferencia se representa matemáticamente con el símbolo de “-” y en código de R se usarán la frase símbolo “dif” como parte de la variable.

Basquetbol menos Futbol

BdifF <- setdiff(B, F)
BdifF

## [1] "Hugo" "Paty" "Paco"

n <- length(BdifF)
n

## [1] 3

Determinando la probabilidad del conjunto BdifF

paste ("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")

## [1] "Hay  3  personas están en Basquetbol y que no están en Futbol de un total de  15  lo que representa el  20 %"

Basquetbol menos Karate

BdifK <- setdiff(B, K)
BdifK

## [1] "Hugo" "Paty" "Paco" "Luis"

n <- length(BdifK)
n

## [1] 4

Determinando la probabilidad del conjunto BdifK

paste ("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")

## [1] "Hay  4  personas están en Basquetbol y que no están en Karate de un total de  15  lo que representa el  26.67 %"

Complemento entre conjuntos

Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.

En R se rerpesentará con la letra C

Completo de Basquetbol

Todos los que no están en Basquetbol CB. Para encontrar el complemento se reutiliza la función setdiff() que en realidad encuentra aquellos que no están en otro subconjunto.

CB <- setdiff(S.muestral, B)
CB

##  [1] "Guadalupe" "Javier"    "Marco"     "Aurelio"   "Mary"      "Lucy"     
##  [7] "Misaki"    "Carlos"    "Ana"       "Lorenzo"   "Eduardo"

n <- length(CB)
n

## [1] 11

paste ("El complemento de Basquetbol tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")

## [1] "El complemento de Basquetbol tiene 11  elementos que representan  73.33 %"

La probabilidad de complemento de un conjunto es restar su probabilidad a 1:

\[ Complemento.Basquetbol = 1 - P(Basquetbol) \]

paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol)", 1 - length(B) / N, " representando el ", (1 - length(B) / N) * 100, "%")

## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.733333333333333  representando el  73.3333333333333 %"

Interpretación

¿Qué representa cada operación de las vistas en el caso?

La operación union significa juntar los elementos de un conjunto con los elementos de otro conjunto de datos, aquellos elementos que están repetidos, es decir que pertenecen a ambos conjuntos sólo se toma en cuenta uno de ellos.

La operación Intersección tiene que ver con los elementos que se repiten en uno y otro conjunto.

La operación diferencia son los elementos que pertenecen a un conjunto y que no pertenecen al segundo conjunto.

La operación complemento son los elementos que le faltan para complementar o completar un conjunto mas grande.

¿Para qué usar operaciones de conjuntos en términos de probabilidad?

Para identificar con el resultado de las operaciones la cantidad de sucesos o eventos que existe y con ello poder determinar en razón de la cantidad total del espacio muestral su probabilidad \(\frac{n}{N}\)
Qué es mas probable:

¿Que exista una persona que participe en Karate o Fútbol (union) o que exista una persona de la diferencia entre Fútbol menos Danza?.

Se tiene que determinar ambas probabilidades y aquella que sea mayor es la respuesta

n <- length(union(K, F)) 
PKUF <- n/N
PKUF

## [1] 0.4666667

n <- length(setdiff(F, D))
PFdifD<- n/N
PFdifD

## [1] 0.3333333

paste("Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza. 

")

## [1] "Es mas probable que haya una persona que participe en Karate o Futbol que una persona que participe en Futbol y no esté en Danza. \n\n"

¿Que existe una persona en el complemento de Danza o que exista una persona en la unión de Danza y Karate?

CD <- setdiff(S.muestral, D)
CD

##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Guadalupe" "Javier"   
##  [7] "Marco"     "Aurelio"   "Misaki"    "Carlos"    "Ana"       "Lorenzo"  
## [13] "Eduardo"

n <- length(CD)
n

## [1] 13

n <- length(union(D, K)) 
DUK <- n/N
DUK

## [1] 0.2

paste("Es mas probable que haya una persona en el complemento de Danza que una persona en la union de Danza y Karate ya que esta ultima representa el 0.2%. 

")

## [1] "Es mas probable que haya una persona en el complemento de Danza que una persona en la union de Danza y Karate ya que esta ultima representa el 0.2%. \n\n"

¿Existe probabilidad de que hay personas que practiquen Basquetbol y Karate?, de cuánto?

BUK <- union(B, K)
n <- length(BUK)
n

## [1] 7

P.BUK <- n/N

paste("Existen ", n,  " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  7  elementos de KUD,   lo que representa la probabilidad de  46.67 %"

¿Cuántos y cuál es la probabilidad de personas que practiquen Rondalla y Danza?

RUD <- union(R, D)
n <- length(RUD)
n

## [1] 7

P.RUD <- n/N

paste("Existen ", n,  " elementos de RUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  7  elementos de RUD,   lo que representa la probabilidad de  46.67 %"

¿Qué es más probable: personas que practiquen Danza y Rondalla o Basquetbol y Karate y Danza?

DUR <- union(D, R)
n <- length(DUR)
n

## [1] 7

P.DUR <- n/N

paste("Existen ", n,  " elementos de DUR, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  7  elementos de DUR,   lo que representa la probabilidad de  46.67 %"

BUK <- union(B, K)
n <- length(BUK)
n

## [1] 7

P.BUK <- n/N

paste("Existen ", n,  " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  7  elementos de BUK,   lo que representa la probabilidad de  46.67 %"

DUB <- union(D, B)
n <- length(DUB)
n

## [1] 6

P.DUB <- n/N

paste("Existen ", n,  " elementos de DUB, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  6  elementos de DUB,   lo que representa la probabilidad de  40 %"

paste("Son las mismas probabilidades de que practiquen Danza y Rondalla que son de un 46.67% y que practiquen Danza, Basquetball y Karate que son de un mismo 46.67%")

## [1] "Son las mismas probabilidades de que practiquen Danza y Rondalla que son de un 46.67% y que practiquen Danza, Basquetball y Karate que son de un mismo 46.67%"

Preguntas Extras “Personales” añadidas al caso

¿Cuántos y cuál es la probabilidad de personas que practiquen Rondalla y Futbol de Sala?

RUFS <- union(R, FS)
n <- length(RUFS)
n

## [1] 8

P.RUFS <- n/N

paste("Existen ", n,  " elementos de RUFS, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")

## [1] "Existen  8  elementos de RUFS,   lo que representa la probabilidad de  53.33 %"

¿Cuál es la Interseccion de Rondalla y Futbol de Sala y cual es su probabilidad?

RIFS <- intersect(R, FS)
RIFS

## [1] "Carlos"

n <- length(RIFS)
n

## [1] 1

paste ("Hay ", n, " personas que practican Rondalla y Futbol de Sala, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")

## [1] "Hay  1  personas que practican Rondalla y Futbol de Sala, de un total de  15  lo que representa el  6.67 %"

¿Cuáles son los Complementos de Rondalla y Futbol de Sala y cual es la probabilidad de cada uno?

Complemento Rondalla

CR <- setdiff(S.muestral, R)
CR

##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Guadalupe" "Javier"   
##  [7] "Marco"     "Aurelio"   "Mary"      "Lucy"

n <- length(CR)
n

## [1] 10

paste ("El complemento de Rondalla tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")

## [1] "El complemento de Rondalla tiene 10  elementos que representan  66.67 %"

paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 10-P(Rondalla)", 1 - length(R) / N, " representando el ", (1 - length(R) / N) * 100, "%")

## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 10-P(Rondalla) 0.666666666666667  representando el  66.6666666666667 %"

Complemento Futbol de Sala

FS <- setdiff(S.muestral, FS)
FS

##  [1] "Hugo"      "Paco"      "Luis"      "Guadalupe" "Javier"    "Aurelio"  
##  [7] "Lucy"      "Misaki"    "Ana"       "Lorenzo"   "Eduardo"

n <- length(FS)
n

## [1] 11

paste ("El complemento de Futbol de Sala tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")

## [1] "El complemento de Futbol de Sala tiene 11  elementos que representan  73.33 %"

paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 11-P(Futbol de Sala)", 1 - length(FS) / N, " representando el ", (1 - length(FS) / N) * 100, "%")

## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 11-P(Futbol de Sala) 0.266666666666667  representando el  26.6666666666667 %"

Operaciones de conjuntos

Carlos David Bustamante Pacheco

10/3/2022