Obetivo:

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripcion:

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación. Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas. Los casos son identificados de la literatura relacionada con variables aleatorias discretas.

Paso 1. Cargar librerias

library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
library(knitr)

Paso 2. Identificar ejercicios de la literatura

Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

  • Tabla de probabilidad
discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0  4997   0.9994   0.9994
## 2 1    50   0.0100   1.0094

Valor esperado

valor.esperado <- sum(tabla$x * tabla$f.prob.x)

valor.esperado
## [1] 0.01

Varianza

tabla <- cbind(tabla, 'valor.esperado' = valor.esperado, 'x-valor.esperado.cuad.f.prob.x' = (tabla$x - valor.esperado)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla probabilidad con valor esperado y columnas para varianza")
Tabla probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x valor.esperado x-valor.esperado.cuad.f.prob.x
0 4997 0.9994 0.9994 0.01 0.0000999
1 50 0.0100 1.0094 0.01 0.0098010
varianza <- sum((tabla$x - valor.esperado)^2 * tabla$f.prob.x)
varianza
## [1] 0.00990094

Desviacion

desviacion <- sqrt(varianza)
desviacion
## [1] 0.09950347
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point(color="black") + 
  geom_line(color="red")

Ejercicio 2

Lanzamos un dado perfecto 240 veces, anotamos el resultado obtenido en la cara superior obteniendo los siguientes resultados: 40, 39, 42, 38, 42, 39. Las probabilidades de que le primer tiro sea 2 y los demas tiros sean 4 y 6.

  • Tabla de probabilidad
lanzadas <- c(1,2,3,4,5,6)
n <- 240
casos <- c(40, 39, 42, 38, 42, 39)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)

tabla <- data.frame(x=lanzadas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos  f.prob.x  F.acum.x
## 1 1    40 0.1666667 0.1666667
## 2 2    39 0.1625000 0.3291667
## 3 3    42 0.1750000 0.5041667
## 4 4    38 0.1583333 0.6625000
## 5 5    42 0.1750000 0.8375000
## 6 6    39 0.1625000 1.0000000

Valor esperado

valor.esperado <- sum(tabla$x * tabla$f.prob.x)

paste("El  valor de la media de la distribución es: ", valor.esperado, "%")
## [1] "El  valor de la media de la distribución es:  3.5 %"

Varianza

varianza <- sum((tabla$x - valor.esperado)^2 * tabla$f.prob.x)

paste("El valor de la varianza de la distribución es: ", varianza,"%")
## [1] "El valor de la varianza de la distribución es:  2.9 %"

Desviacion

desviacion <- sqrt(varianza)

paste("El valor de desviación de la distribución es: ", desviacion,"%")
## [1] "El valor de desviación de la distribución es:  1.70293863659264 %"
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point(color="black") + 
  geom_line(color="red")

Ejercicio 3

Se lanza 3 moneda al aire. numero de caras obtenidas al lanzarlas

lanzadas <- c(0,1,2,3)
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)

tabla <- data.frame(x=lanzadas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0     1    0.125    0.125
## 2 1     3    0.375    0.500
## 3 2     3    0.375    0.875
## 4 3     1    0.125    1.000

Valor esperado

valor.esperado <- sum(tabla$x * tabla$f.prob.x)

paste("El  valor de la media de la distribución es: ", valor.esperado, "%")
## [1] "El  valor de la media de la distribución es:  1.5 %"

Varianza

varianza <- sum((tabla$x - valor.esperado)^2 * tabla$f.prob.x)

paste("El valor de la varianza de la distribución es: ", varianza,"%")
## [1] "El valor de la varianza de la distribución es:  0.75 %"

Desviacion

desviacion <- sqrt(varianza)

paste("El valor de desviación de la distribución es: ", desviacion,"%")
## [1] "El valor de desviación de la distribución es:  0.866025403784439 %"
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point(color="black") + 
  geom_line(color="red")

Paso 3. Interpretacion

En este caso retomaremos lo que es el caso 14 ya realizado anterior mente para poder sacar lo que es la media de cada uno de los ejercicios al igual que sacaremos lo que es la varianza y la desviacion de cada una. Al igual que en el caso anterior contestaremos algunas preguntas las cuales son las que podremos ver a continuacion.

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

Las variables aleatorias nos permiten sacar los posibles resultados de un experimento que aun no esta realizado o los posibles valores de una cantidad cuyo valor actualmente es incierto.

  • Ejercicio 1: 4997, 50
  • Ejercicio 2: 40, 39, 42, 38, 42, 39
  • Ejercicio 3: 1,3,3,1

3.2. ¿Qué valores puede tomar la variable aleatoria?

Suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones o cualquier tipo de elementos (de un espacio medible).

  • Ejercicio 1: toma los valores: 4997, 50
  • Ejercicio 2: toma los valores: 40, 39, 42, 38, 42, 39
  • Ejercicio 3: toma los valores: 1, 3, 3, 1

3.3. ¿Cuál es el espacio muestral?, todos los elementos

  • Ejercicio 1: 5000 boletos
  • Ejercicio 2: 240 lanzamientos
  • Ejercicio 3: 3 lanzamientos

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

Ejercicio 1: 2 elementos Ejercicio 2: 6 elementos Ejercicio 3: 4 elementos

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

Ejercicio 1: 2 casos Ejercicio 2: 6 casos Ejercicio 3: 4 casos

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

Ejercicio 1: 99.94%, 0.0100% Ejercicio 2: 16.66%, 16.25%, 17.5%, 15.83%, 17.5%, 16.25% Ejercicio 3: 12.5%, 37.5%, 37.5%, 12.5%

3.8. ¿Que significado tiene el gráfico de barra?

Es la forma de representar gráficamente el conjunto de datos mediante barras rectangulares de longitud proporcional a los valores representados.

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

Con este grafico podemos comprobar rápidamente el cambio de tendencia de los datos.

3.10. ¿Cual es el valor de la media de la distribucion y que significa?

Esta nos indica el valor medio de un fenómeno aleatorio y la podemos calcular con la siguiente fórmula:

\[\mu =n\cdot p\] * Ejercicio 1: 0.01% * Ejercicio 2: 3.5% * Ejercicio 3: 1.5%

3.11. ¿Cual es el valor de la varianza de la distribucion y que significa?

Es una medida de dispersión que nos indica qué tan lejos se encuentran los cuadrados de la desviación de la media. * Ejercicio 1: 0.00990094% * Ejercicio 2: 2.9% * Ejercicio 3: 0.75%

3.12. ¿Cual es el valor de la desviacion de la distribucion y que significa?

La desviación es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución. * Ejercicio 1: 0.09950347 * Ejercicio 2: 1.70293863659264% * Ejercicio 3: 0.866025403784439%