Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificacion de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviacion estandar de distribuciones de variables discretas; visualizacion grafica relacionada con variables discretas.

Descripcion

Identificar casos relacionados con variables discretas para elaborar mediante programacion R y markdown las variables discretas, las funciones de probabilidad de cada variable, la funcion acumulada, su visualizacion grafica para su correcta implementacion.

Se incluye en el caso, media, varianza y desviacion estandar de distribuciones de variables discretas.

Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.

1. Cargar librerias

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)

options(scipen = 999) # Notacion normal

2. Ejercicios

Para cada ejercicio, se describe y define el contexo Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la funcion de probabilidad y su funcion acumulada, la grafica de barra de los valores de las variables aleatoria y la grafica lineal de la funcion acumulada. Se determina el valor esperado de cada ejercicio Se determina la varianza y la descviacion estandar de la distribucion de las vaiables discretas

2.1. Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un unico premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

Tabla de probabilidad

discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
0 4997 0.9994 0.9994 0.00
1 50 0.0100 1.0094 0.01

Valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 0.01

Varianza

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
0 4997 0.9994 0.9994 0.00 0.01 0.0000999
1 50 0.0100 1.0094 0.01 0.01 0.0098010

varianza de la distribucion

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.00990094

Desviacion estandar de una distribucion discreta

desv.std <- sqrt(varianza)
desv.std
## [1] 0.09950347

2.2 Ejercicio

Las ventas de automoviles de una empresa

Durante los algoritmos 300 dias de operacion, los datos de ventas muestran que hubo

54 dias en los que no se vendias ningun automovil,

117 dias en los que se vendias 1 automovil,

72 dias en los que se vendieron 2 automoviles,

42 dias en los que se vendieron 3 automoviles,

12 dias en los que se vendieron 4 automoviles y

3 dias en los que se vendieron 5 automoviles.

discretas <- 0:5   # c(0,1,2,3,4,5)
n <- 300
casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
0 54 0.18 0.18 0.00
1 117 0.39 0.57 0.39
2 72 0.24 0.81 0.48
3 42 0.14 0.95 0.42
4 12 0.04 0.99 0.16
5 3 0.01 1.00 0.05

Valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 1.5

Varianza

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
0 54 0.18 0.18 0.00 1.5 0.4050
1 117 0.39 0.57 0.39 1.5 0.0975
2 72 0.24 0.81 0.48 1.5 0.0600
3 42 0.14 0.95 0.42 1.5 0.3150
4 12 0.04 0.99 0.16 1.5 0.2500
5 3 0.01 1.00 0.05 1.5 0.1225

varianza de la distribucion

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.25
desv.std <- sqrt(varianza)
desv.std
## [1] 1.118034

Ejercicio 3

En Estados Unidos un porcentaje de los ni