Objetivo

Realizar operaciones de conjunto y con el resultado estimar e interpretar probabilidades.

Descripción

  • Se cargan las librerías necesarias para ejecutar funciones

  • Generar conjuntos de datos

  • Construir todo el espacio muestral llamado S.muestra

  • Realizar operaciones de conjuntos

  • Estimar probabilidades con los conjuntos.

  • Interpretar probabilidades

Marco teórico

Operación Union U.

El conjunto de todos los elementos que pertenecen a A o a B, o tanto a A como a B, se llama la unión de A y B y se escribe A ∪ B.

En la unión si hay elementos repetidos sólo se deja uno de ellos.

Operación intersección ∩

El conjunto de todos los elementos que pertenecen simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩ B.

Operación diferencia -

El conjunto que consiste en todos los elementos de A que no pertenecen a B se llama la diferencia de A y B y se escribe A – B.

Operación complemento [C ó ´]

Son todos los conjuntos con los elementos que no están en A y se escribe A’ ó C A. Son todos los elementos que faltan y que no están en A para complementar todo el espacio muestral.

Desarrollo

Cargar librerías

# install.packages("dplyr")
library(dplyr)

Crear uno vectores en R con los conjuntos de datos de nombres de personas que participan en actividades deportivas y culturales.

Los vectores en R, representan los conjuntos, luego, se hacen operaciones sobre los mismos, finalmente se determina probabilidades que representan probabilidades de acuerdo a los resultados de las operaciones con los conjuntos.

  • B Basquetbol

  • F Futbol

  • K Karate

  • D Danza

B <- c("Hugo", "Paty", "Paco", "Luis")
F <- c("Guadalupe", "Luis", "Javier", "Marco", "Aurelio")
K <- c("Marco", "Mary", "Lucy")
D <- c("Lucy", "Mary")

Mostrar los vectores a manera de conjuntos

B
## [1] "Hugo" "Paty" "Paco" "Luis"
F
## [1] "Guadalupe" "Luis"      "Javier"    "Marco"     "Aurelio"
K
## [1] "Marco" "Mary"  "Lucy"
D
## [1] "Lucy" "Mary"

Construir el espacio muestral

Con todos los elementos de todos los conjuntos determinar el espacio muestral. Con la función unique() se eliminan los repetidos y con la función c() de concatenar se integran todos los nombres a un solo conjunto de datos.

S.muestral <- unique(c(B, F, K, D))
S.muestral
##  [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Guadalupe" "Javier"   
##  [7] "Marco"     "Aurelio"   "Mary"      "Lucy"
N <- length(S.muestral)
N
## [1] 10

Unión entre conjuntos

La unión entre conjuntos se representa por la literal U.

Union Basquetbol y Karate

BUK <- union(B, K)
BUK
## [1] "Hugo"  "Paty"  "Paco"  "Luis"  "Marco" "Mary"  "Lucy"

BUK es a unión de los conjuntos Basquetbol con Karate y n es la cantidad de eventos de ese conjunto resultante.

n <- length(BUK)
n
## [1] 7

Determinando la probabilidad de BUK.

P.BUK <- n/N
paste("Existen ", n,  " elementos de BUK, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen  7  elementos de BUK,   lo que representa la probabilidad de  70 %"

Karate Unión con Danza

KUD es la unión de Karate con Danza y n es la cantidad de eventos de ese conjunto

KUD <- union(K, D)
n <- length(KUD)
n
## [1] 3

Determinando la probabilidad

P.KUD <- n/N
paste("Existen ", n,  " elementos de KUD, ", " lo que representa la probabilidad de ", round(n/N * 100, 2), "%")
## [1] "Existen  3  elementos de KUD,   lo que representa la probabilidad de  30 %"

Intersección entre conjuntos

La intersección entre conjuntos representa por el símbolo matemático y con la letra I de intersección.

Intersección de Básquetbol con Fútbol

¿Cuáles y cuántas personas juegan Básquetbol y Fútbol y que probabilidad representan?

BIF <- intersect(B, F)
BIF
## [1] "Luis"
n <- length(BIF)
n
## [1] 1

Determinando la probabilidad del conjunto BIF

paste ("Hay ", n, " personas que juegan Basquetbl y Futbol, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  1  personas que juegan Basquetbl y Futbol, de un total de  10  lo que representa el  10 %"

Intersección de Karate con Danza

¿Cuáles y cuántas personas practican Karate y Danza y que probabilidad representan?

KID <- intersect(K, D)
KID
## [1] "Mary" "Lucy"
n <- length(KID)
n
## [1] 2

Determinando la probabilidad del conjunto KID

paste ("Hay ", n, " personas que juegan Karate y Danza, de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  2  personas que juegan Karate y Danza, de un total de  10  lo que representa el  20 %"

Diferencia entre conjuntos

La operación de diferencia se representa matemáticamente con el símbolo de - y en código de R se usarán la frase símbolo ‘dif’ como parte de la variable.

Básquetbol menos Fútbol

BdifF <- setdiff(B, F)
BdifF
## [1] "Hugo" "Paty" "Paco"
n <- length(BdifF)
n
## [1] 3

Determinando la probabilidad del conjunto BdifF

paste ("Hay ", n, " personas están en Basquetbol y que no están en Futbol de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  3  personas están en Basquetbol y que no están en Futbol de un total de  10  lo que representa el  30 %"

Básquetbol menos Karate

BdifK <- setdiff(B, K)
BdifK
## [1] "Hugo" "Paty" "Paco" "Luis"
n <- length(BdifK)
n
## [1] 4

Determinando la probabilidad del conjunto BdifK

paste ("Hay ", n, " personas están en Basquetbol y que no están en Karate de un total de ", N, " lo que representa el ", round(n/N * 100, 2), "%")
## [1] "Hay  4  personas están en Basquetbol y que no están en Karate de un total de  10  lo que representa el  40 %"

Complemento entre conjuntos

Significa determinar los elementos que no están en un conjunto para complementar otro conjunto o de todo el espacio muestral.

En R se repesentará con la letra C

Complemento de Básquetbol

Todos los que no están en Básquetbol CB. Para encontrar el complemento se reutiliza la función setdiff() que en realidad encuentra aquellos que no están en otro subconjunto.

CB <- setdiff(S.muestral, B)
CB
## [1] "Guadalupe" "Javier"    "Marco"     "Aurelio"   "Mary"      "Lucy"
n <- length(CB)
n
## [1] 6
paste ("El complemento de Basquetbol tiene", n , " elementos que representan ", round(n/N * 100, 2), "%")
## [1] "El complemento de Basquetbol tiene 6  elementos que representan  60 %"

La probabilidad de complemento de un conjunto es restar su probabilidad a 1:

\[ Complemento.Basquetbol = 1 - P(Basquetbol) \]

paste("Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol)", 1 - length(B) / N, " representando el ", (1 - length(B) / N) * 100, "%") 
## [1] "Matemáticamente de acuerdo a fórmula de complemento es lo mismo que 1-P(Basquetbol) 0.6  representando el  60 %"

Interpretación

  • ¿Qué representa cada operación de las vistas en el caso?

Todas las operaciones con conjuntos vistas anteriormente representan la correlación entre los datos y su comportamiento en función de los demás. Cada una tiene un objetivo en particular; la unión entrelaza los elementos de dos o más conjuntos, mientras que la intersección determina cuáles elementos coinciden en dos conjuntos específicos. La diferencia separa cuáles elementos aparecen en un conjunto pero no en el otro; y finalmente el complemento, como se puede inferir de su nombre, determina los elementos faltantes de un conjunto para completar el espacio muestral.

  • ¿Para qué usar operaciones de conjuntos en términos de probabilidad?

Analizar el comportamiento de los datos en relación a otros y a partir de ello establecer probabilidades aplicables en diferentes contextos.

  • Qué es mas probable:

    • ¿Que exista una persona que de la unión de Karate y Fútbol o que exista una persona de la diferencia entre Fútbol menos Danza?
    KUD=union(K, D)
    KUD
    ## [1] "Marco" "Mary"  "Lucy"
    n.KUD=length(KUD)
    n.KUD
    ## [1] 3
    paste ("Hay ", n.KUD, " personas que están en Karate y en Fútbol, de un total de ", N, ", lo que representa el ", round(n.KUD/N * 100, 2), "%")
    ## [1] "Hay  3  personas que están en Karate y en Fútbol, de un total de  10 , lo que representa el  30 %"
    FdifD=setdiff(F, D)
    FdifD
    ## [1] "Guadalupe" "Luis"      "Javier"    "Marco"     "Aurelio"
    n.FdifD=length(FdifD)
    paste ("Hay ", n.FdifD, " personas que están en Fútbol y que no están en Danza, de un total de ", N, ", lo que representa el ", round(n.FdifD/N * 100, 2), "%")
    ## [1] "Hay  5  personas que están en Fútbol y que no están en Danza, de un total de  10 , lo que representa el  50 %"

    Comparando los resultados, es más probable el caso de las personas que están en fútbol más no en danza, con un 50%; en comparación con la unión de los de fútbol y karate, que tienen una probabilidad del 30%

    • ¿Que existe una persona en el complemento de Danza o que exista una persona en la unión de Danza y Karate?
    CD=setdiff(S.muestral, D)
    CD
    ## [1] "Hugo"      "Paty"      "Paco"      "Luis"      "Guadalupe" "Javier"   
    ## [7] "Marco"     "Aurelio"
    n.CD=length(CD)
    n.CD
    ## [1] 8
    paste ("El complemento de Danza tiene ", n.CD, " elementos que representan el", (1 - length(D) / N) * 100, "%")
    ## [1] "El complemento de Danza tiene  8  elementos que representan el 80 %"
    DUK=union(D, K)
    DUK
    ## [1] "Lucy"  "Mary"  "Marco"
    n.DUK=length(DUK)
    n.DUK
    ## [1] 3
    paste ("Hay ", n.DUK, " personas que están en Danza y Karate, de un total de ", N, ", lo que representa el ", round(n.DUK/N * 100, 2), "%")
    ## [1] "Hay  3  personas que están en Danza y Karate, de un total de  10 , lo que representa el  30 %"

    Al conjunto de danza le faltan 8 personas para abarcar el espacio muestral, es decir un 80%, mientras que es 50% probable que un a persona esté en danza y karate; con lo anterior se entiende que es más probable pertenecer al complemento de danza que a DUK.

    • ¿Existe probabilidad de que hay personas que practiquen Basquetbol y Karate?, de cuánto?
    BUK=union(B, K)
    BUK
    ## [1] "Hugo"  "Paty"  "Paco"  "Luis"  "Marco" "Mary"  "Lucy"
    n.BUK=length(BUK)
    n.BUK
    ## [1] 7
    paste ("Hay ", n.BUK, " personas que están en básquetbol y karate, de un total de ", N, ", lo que representa el ", round(n.BUK/N * 100, 2), "%")
    ## [1] "Hay  7  personas que están en básquetbol y karate, de un total de  10 , lo que representa el  70 %"