Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

  1. Cargar Librerias
library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)

2. Ejercicios

2.1 Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

Fuente: https://campusvirtual.ull.es/ocw/pluginfile.php/6033/mod_resource/content/1/tema8/PR8.2-valeatorias.pdf

  • Tabla de probabilidad
discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0  4997   0.9994   0.9994
## 2 1     3   0.0006   1.0000
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point(color="black") + 
  geom_line(color="red")

2.2 Ejercicio 2

Durante los últimos 300 días de operación, los datos de ventas muestran que hubo54 días en los que no se vendió ningún automóvil,117 días en los que se vendió 1 automóvil,72 días en los que se vendieron 2 automóviles,42 días en los que se vendieron 3 automóviles,12 días en los que se vendieron 4 automóviles y3 días en los que se vendieron 5 automóviles. ¿Cuál es la probabilida de que se venda exactamente un automoviles? ¿Cuál es la la probabilidad de que se venda al menos 2 automóviles? discretas <- 0:5 # c(0,1,2,3,4,5) n <- 300

Fuente: https://www.academia.edu/19264480/Estadistica_Distribucion_discreta

  • Tabla de probabilidad
casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)  

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0    54   0.0108   0.0108
## 2 1   117   0.0234   0.0342
## 3 0    72   0.0144   0.0486
## 4 1    42   0.0084   0.0570
## 5 0    12   0.0024   0.0594
## 6 1     3   0.0006   0.0600
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  #geom_bar(stat="identity")
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line() 

Ejercicio 3

Se lanza 3 moneda al aire. numero de caras obtenidas al lanzarlas

Fuente: http://www.mat.uda.cl/hsalinas/cursos/2010/eyp/tema4-variables-aleatorias.pdf

lanzadas <- c(0,1,2,3)
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)

tabla <- data.frame(x=lanzadas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0     1    0.125    0.125
## 2 1     3    0.375    0.500
## 3 2     3    0.375    0.875
## 4 3     1    0.125    1.000
  • Grafica de barra
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

  • Grafica lineal acumulada
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point(color="black") + 
  geom_line(color="red")

Interpretación del caso

Con este caso estamos trabajando con las variables aleatorias discretas, trabajamos con muchas gráficas, más que nada para poder tener una vista un tanto diferente y poder interpretar de mejor manera los resultados y sobre todo poder observar lo más importante del caso, se nos hizo las siguientes preguntas en las cuales plasmamos los resultados de nuestro caso:

  • 3.1. ¿Cuál es la variable aleatoria y su significado en el contexto? Una variable aleatoria discreta es aquella cuya función de distribución es escalonada y en este caso son: Ejercicio 1: 4997, 3 Ejercicio 2: 40, 39, 42, 38, 42, 39 Ejercicio 3: 1,3,3,1

  • 3.2. ¿Qué valores puede tomar la variable aleatoria? Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones o cualquier tipo de elementos, y en este caso serian: Ejercicio 1: toma los valores: 4997, 3 Ejercicio 2: toma los valores: 40, 39, 42, 38, 42, 39 Ejercicio 3: toma los valores: 1, 3, 3, 1

  • 3.3. ¿Cuál es el espacio muestral?, todos los elementos Ejercicio 1: 5000 boletos Ejercicio 2: 240 lanzamientos Ejercicio 3: 3 lanzamientos

  • 3.4. ¿Cuántos elementos hay en espacio muestral (S)? Ejercicio 1: 2 elementos Ejercicio 2: 6 elementos Ejercicio 3: 4 elementos

  • 3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria? Ejercicio 1: 2 casos Ejercicio 2: 6 casos Ejercicio 3: 4 casos

  • 3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria? Ejercicio 1: 99.94%, 0.06% Ejercicio 2: 16.66%, 16.25%, 17.5%, 15.83%, 17.5%, 16.25% Ejercicio 3: 12.5%, 37.5%, 37.5%, 12.5%

  • 3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias.

  • 3.7.1. Que sea exactamente igual a un valor de variable aleatoria: La probabilidad de que se vendan 3 juegos es 0.26

  • 3.7.2 Que sea menor o igual La probabilidad de que se vendan 5 juegos es 0.01

  • 3.7.3 Que sea mayor o igual La probabilidad de que la moneda caiga en cara es 0.125

  • 3.8. ¿Qué significado tiene el gráfico de barra? Es la forma de representar gráficamente el conjunto de datos mediante barras rectangulares de longitud proporcional a los valores representados.

  • 3.9. ¿Qué significado tiene el gráfico lineal acumulado? Con este grafico podemos comprobar rápidamente el cambio de tendencia de los datos.