Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.

Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.

1. Cargar Librerias

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)

options(scipen = 999) # Notación normal

2. Identificar ejercicios de la literatura.

2.1 Una variable aleatoria X puede tomar los valores 30,40,50 y 60 con probabilidades 0.4,0.2,0.1 y 0.3. Represente en una tabla la función de probabilidad, P(X=x).

discretas <- 1:4
casos <- c(30, 40, 50, 60)
probabilidades <- c(0.4, 0.2, 0.1, 0.3)
acumulada <- cumsum(probabilidades) 

p.30 <- 0.4
p.40 <- 0.2
p.50 <- 0.1
p.60 <- 0.3

tabla.funcion <- data.frame(x=discretas,
                    casos = casos,
                    p.x = probabilidades,
                    f.x = acumulada)
tabla.funcion
##   x casos p.x f.x
## 1 1    30 0.4 0.4
## 2 2    40 0.2 0.6
## 3 3    50 0.1 0.7
## 4 4    60 0.3 1.0

Valor esperado.

Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

VE <- sum(tabla.funcion$x * tabla.funcion$p.x)

VE
## [1] 2.3

El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

  • Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.
tabla <- cbind(tabla.funcion, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos p.x f.x VE x-VE.cuad.f.prob.x
1 30 0.4 0.4 2.3 0.676
2 40 0.2 0.6 2.3 0.018
3 50 0.1 0.7 2.3 0.049
4 60 0.3 1.0 2.3 0.867

Varianza.

α2=∑(x−μ)2 P(x)

varianza <- sum((tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
varianza
## [1] 1.61

Desviación estándard de una distribución discreta.

La raiz cuadrada de la varianza.

α=√α2

desv.std <- sqrt(varianza)
desv.std
## [1] 1.268858

2.2 Calcular la función de probabilidad del número de caras obtenidas al lanzar dos monedas siendo X la variable aleatoria.

discretas <- 1:3
casos <- c(0,1,2) # Numero de caras posibles
probabilidades <- c(0.25, 0.5, 0.25)
acumulada <- cumsum(probabilidades) 

p.0 <- 0.25
p.1 <- 0.5
p.2 <- 0.25

tabla.funcion <- data.frame(x=discretas,
                    casos = casos,
                    p.x = probabilidades,
                    f.x = acumulada)
tabla.funcion
##   x casos  p.x  f.x
## 1 1     0 0.25 0.25
## 2 2     1 0.50 0.75
## 3 3     2 0.25 1.00

Valor esperado.

Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

VE <- sum(tabla.funcion$x * tabla.funcion$p.x)

tabla <- cbind(tabla.funcion, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos p.x f.x VE x-VE.cuad.f.prob.x
1 0 0.25 0.25 2 0.25
2 1 0.50 0.75 2 0.00
3 2 0.25 1.00 2 0.25

Varianza.

α2=∑(x−μ)2P(x)

varianza <- sum((tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
varianza
## [1] 0.5

Desviación estándard de una distribución discreta.

La raiz cuadrada de la varianza.

α=√α2

desv.std <- sqrt(varianza)
desv.std
## [1] 0.7071068

2.3 Calcular la función de probabilidad de las puntuaciones al lanzar un dado de seis caras siendo X la variable aleatoria.

casos <- 1:6 # Numero de puntos posibles #en este caso tambien cuentan como la variable discreta
probabilidades <- c((1/6), (1/6), (1/6), (1/6), (1/6), (1/6))
acumulada <- cumsum(probabilidades) 

p.1 <- 1/6
p.2 <- 1/6
p.3 <- 1/6
p.4 <- 1/6
p.5 <- 1/6
p.6 <- 1/6

tabla.funcion <- data.frame(x=casos, 
                    p.x = probabilidades,
                    f.x = acumulada)
tabla.funcion
##   x       p.x       f.x
## 1 1 0.1666667 0.1666667
## 2 2 0.1666667 0.3333333
## 3 3 0.1666667 0.5000000
## 4 4 0.1666667 0.6666667
## 5 5 0.1666667 0.8333333
## 6 6 0.1666667 1.0000000

Valor esperado.

Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

VE <- sum(tabla.funcion$x * tabla.funcion$p.x)

tabla <- cbind(tabla.funcion, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x p.x f.x VE x-VE.cuad.f.prob.x
1 0.1666667 0.1666667 3.5 1.0416667
2 0.1666667 0.3333333 3.5 0.3750000
3 0.1666667 0.5000000 3.5 0.0416667
4 0.1666667 0.6666667 3.5 0.0416667
5 0.1666667 0.8333333 3.5 0.3750000
6 0.1666667 1.0000000 3.5 1.0416667

Varianza.

α2=∑(x−μ)2P(x)

varianza <- sum((tabla.funcion$x - VE)^2 * tabla.funcion$p.x)
varianza
## [1] 2.916667

Desviación estándard de una distribución discreta.

La raiz cuadrada de la varianza.

α=√α2

desv.std <- sqrt(varianza)
desv.std
## [1] 1.707825

Intrepretación del caso

En el primer ejemplo tenemos los datos del problema ya casi resueltos, solo nos faltaría delimitar el espacio muestral que en este caso al ser cuatro valores los que puede tomar nos da un espacio muestral de 4 (de 1 a 4), este valor es necesario para poder continuar determinando el valor esperado, así como la varianza y la desviación estándar.

En el segundo ejemplo tenemos todos los datos a nuestra disposición, por lo cual sacar el valor esperado en este ejemplo es sencillo, solo debemos hacer una sumatoria de nuestro espacio muestral multiplicado por las probabilidades, lo que nos da un resultado de 2 como valor esperado.

En el tercer ejemplo para determinar su varianza y desviación estándar es necesario seguir los pasos que estuvimos haciendo en los casos anteriores y con los valores obtenidos tenemos que hacer una sumatoria del espacio muestral menos el valor a obtener esto elevado al cuadrado para luego ser multiplicado por la probabilidad del evento, y con ello obtendremos la varianza, para la desviación estándar es necesario sacar la raíz cuadrada de la varianza.