CASO 15. Variable aleatoria discreta 2

Caso 15. Variables aleatorias discretas. Media, varianza y desviación estándar de distribuciones de variables discretas

Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.

Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.

Marco de referencia

Una variable aleatoria es una descripción numérica del resultado de un experimento (Anderson et al., 2008).

Las variables aleatorias deben tomar valores numéricos. En efecto, una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.

El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma. (Anderson et al., 2008). Para este documento se tratan únicamente variables del tipo discreto.

En cualquier experimento aleatorio, los resultados se presentan al azar; así, a este se le denomina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento: puede ocurrir cualquiera de los seis resultados posibles. Cada valor de la variabl aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado determinado(Lind et al., 2015)

En su libro (Walpole et al., 2012) define que una variable aleatoria es una función que asocia un número real con cada elemento del espacio muestral.

Una función de probabilidad, una función de masa de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada resultado x posible.

Toda función de probabilidad debe ser mayor o igual que 0.
f(x)≥0
La suma de las probabilidad de todas las variables x debe ser igual a 1 o la suma de los valores de cada función de probabildiad con respecto a x debe ser 1
∑xf(x)=1
La probabilidad de cada variable x es igual a la función de probabilidad con respeto a x
P(X=x)=f(x)

(Walpole et al., 2012)

Por otra parte, la función de la distribución acumulativa F(x) ó probabilidad acumulada de una variable aleatoria discreta X con distribución de probabilidad f(x) está dada por la suma de sus probabilidades de t siendo t menor o igual a x. Es decir, la probabilidad acumulada suma los valores de las funciones de probabilidad a partir del valor inicia de x. El valor final con respecto a valor final de x debe ser igual a 1.

F(x)=P(X≤x)=∑t≤xf(t)

(Walpole et al., 2012)

La media de una distribución discreta es también recibe el nombre de valor esperado. Se trata de un promedio ponderado de los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrencia (Lind et al., 2015)

La fórmula para el valor esperado es:

μ=∑xP(x)

La varianza de una distribución discreta constituye un valor típico para resumir una distribución de probabilidad discreta, describe el grado de dispersión (variación) en una distribución (Lind et al., 2015)

Su fórmula es:

α2=∑(x−μ)2P(x)

La media se resta de cada valor de la variable aleatoria y la diferencia se eleva al cuadrado.
Cada diferencia al cuadrado se multiplica por su probabilidad.
Se suman los productos resultantes para obtener la varianza.

La desviación estándar, α, se determina al extraer la raíz cuadrada positiva de α2; es decir, α=α2−−√ (Lind et al., 2015)

1. Cargar librerías

Posiblemente se utilicen algunas de ellas

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
library(knitr)
options(scipen = 999) # Notación normal

2. Ejercicios

Para cada ejercicio, se describe y define el contexo
Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
Se determina el valor esperado de cada ejercicio
Se determina la varianzay la descviación estándar de la distribución de las vaiables discretas

2.1. Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

Tabla de probabilidad

discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")

Tabla de probabilidad con la columna para valor esperado
x	casos	f.prob.x	F.acum.x	x.f.prob.x
0	4997	0.9994	0.9994	0.00
1	50	0.0100	1.0094	0.01

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

## [1] 0.01

El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

Significa muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos 0.01

Varianza

Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	casos	f.prob.x	F.acum.x	x.f.prob.x	VE	x-VE.cuad.f.prob.x
0	4997	0.9994	0.9994	0.00	0.01	0.0000999
1	50	0.0100	1.0094	0.01	0.01	0.0098010

α2=∑(x−μ)2P(x)

var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

## [1] 0.00990094

Desviación estándard de una distribución discreta

La raiz cuadrada de la varianza
α=α2−−√

desv.std <- sqrt(varianza)
desv.std

## [1] 0.09950347

2.2 Ejercicio 2

Las ventas de automóviles de una empresa

Durante los últimos 300 días de operación, los datos de ventas muestran que hubo

54 días en los que no se vendió ningún automóvil,
117 días en los que se vendió 1 automóvil,
72 días en los que se vendieron 2 automóviles,
42 días en los que se vendieron 3 automóviles,
12 días en los que se vendieron 4 automóviles y
3 días en los que se vendieron 5 automóviles.
¿Cuál es la probabilida de que se venda exactamente un automoviles?
¿Cuál es la la probabilidad de que se venda al menos 2 automóviles?

Tabla de probabilidad o Contingencia

discretas <- 0:5   # c(0,1,2,3,4,5)
n <- 300

casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada,
                     x.f.prob.x= (discretas*probabilidades))
kable(tabla)

x	casos	f.prob.x	F.acum.x	x.f.prob.x
0	54	0.18	0.18	0.00
1	117	0.39	0.57	0.39
2	72	0.24	0.81	0.48
3	42	0.14	0.95	0.42
4	12	0.04	0.99	0.16
5	3	0.01	1.00	0.05

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

## [1] 1.5

VARIANZA

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	casos	f.prob.x	F.acum.x	x.f.prob.x	VE	x-VE.cuad.f.prob.x
0	54	0.18	0.18	0.00	1.5	0.4050
1	117	0.39	0.57	0.39	1.5	0.0975
2	72	0.24	0.81	0.48	1.5	0.0600
3	42	0.14	0.95	0.42	1.5	0.3150
4	12	0.04	0.99	0.16	1.5	0.2500
5	3	0.01	1.00	0.05	1.5	0.1225

var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

## [1] 1.25

desv.std <- sqrt(varianza)
desv.std

## [1] 1.118034

2.3 Ejercicio 3

En Estados Unidos un porcentaje de los niños de cuarto grado no pueden leer un libro adecuado a su edad. La tabla siguiente muestra, de acuerdo con las edades de entre 6 y 14 años, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.(Anderson et al., 2008)

¿Cuál es la probabilida de elegir alumnos que tienen problemas de exactamente 10 años?
¿Cuál es la probabilidad de encontrar alumnos por de 11 años o menos? Tabla de probabilidad o Contingencia

discretas <- 6:14
#n <- '?'

casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada,
                    x.f.prob.x= (discretas*probabilidades))
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	casos	f.prob.x	F.acum.x	x.f.prob.x
6	37369	0.0184888	0.0184888	0.1109325
7	87436	0.0432600	0.0617487	0.3028199
8	160840	0.0795775	0.1413262	0.6366198
9	239719	0.1186038	0.2599300	1.0674340
10	286719	0.1418576	0.4017876	1.4185758
11	306533	0.1516608	0.5534484	1.6682687
12	310787	0.1537655	0.7072139	1.8451861
13	302604	0.1497169	0.8569307	1.9463193
14	289168	0.1430693	1.0000000	2.0029696

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

## [1] 10.99913

VARIANZA

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	casos	f.prob.x	F.acum.x	x.f.prob.x	VE	x-VE.cuad.f.prob.x
6	37369	0.0184888	0.0184888	0.1109325	10.99913	0.4620571
7	87436	0.0432600	0.0617487	0.3028199	10.99913	0.6918572
8	160840	0.0795775	0.1413262	0.6366198	10.99913	0.7157799
9	239719	0.1186038	0.2599300	1.0674340	10.99913	0.4740005
10	286719	0.1418576	0.4017876	1.4185758	10.99913	0.1416097
11	306533	0.1516608	0.5534484	1.6682687	10.99913	0.0000001
12	310787	0.1537655	0.7072139	1.8451861	10.99913	0.1540345
13	302604	0.1497169	0.8569307	1.9463193	10.99913	0.5993912
14	289168	0.1430693	1.0000000	2.0029696	10.99913	1.2883739

var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

## [1] 4.527104

desv.std <- sqrt(varianza)
desv.std

## [1] 2.127699

PASO 3. INTERPRETACIÓN DEL CASO

Al estar realizando este cao me di cuenta de que su propósito es que seamos capaces de identificar cuáles son las variables discretas que nos permiten calcular la media, la varianza y la desviación estándar, y de esta manera visualizamos cuál es la importancia de cada una de las variables.

CASO 15. Variable aleatoria discreta 2

Myriam Velazquez Franco

11/12/2020

Caso 15. Variables aleatorias discretas. Media, varianza y desviación estándar de distribuciones de variables discretas

Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.

Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.

Marco de referencia

Una variable aleatoria es una descripción numérica del resultado de un experimento (Anderson et al., 2008).

Las variables aleatorias deben tomar valores numéricos. En efecto, una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.

El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma. (Anderson et al., 2008). Para este documento se tratan únicamente variables del tipo discreto.

En su libro (Walpole et al., 2012) define que una variable aleatoria es una función que asocia un número real con cada elemento del espacio muestral.

Una función de probabilidad, una función de masa de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada resultado x posible.

f(x)≥0

∑xf(x)=1

P(X=x)=f(x)

(Walpole et al., 2012)

F(x)=P(X≤x)=∑t≤xf(t)

(Walpole et al., 2012)

La media de una distribución discreta es también recibe el nombre de valor esperado. Se trata de un promedio ponderado de los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrencia (Lind et al., 2015)

La fórmula para el valor esperado es:

μ=∑xP(x)

La varianza de una distribución discreta constituye un valor típico para resumir una distribución de probabilidad discreta, describe el grado de dispersión (variación) en una distribución (Lind et al., 2015)

Su fórmula es:

α2=∑(x−μ)2P(x)

La desviación estándar, α, se determina al extraer la raíz cuadrada positiva de α2; es decir, α=α2−−√ (Lind et al., 2015)

1. Cargar librerías

Posiblemente se utilicen algunas de ellas

2. Ejercicios

2.1. Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

Tabla de probabilidad

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

Significa muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos 0.01

Varianza

α2=∑(x−μ)2P(x)

Desviación estándard de una distribución discreta

α=α2−−√

2.2 Ejercicio 2

Las ventas de automóviles de una empresa

Durante los últimos 300 días de operación, los datos de ventas muestran que hubo

Tabla de probabilidad o Contingencia

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

VARIANZA

2.3 Ejercicio 3

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

VARIANZA

PASO 3. INTERPRETACIÓN DEL CASO

Al estar realizando este cao me di cuenta de que su propósito es que seamos capaces de identificar cuáles son las variables discretas que nos permiten calcular la media, la varianza y la desviación estándar, y de esta manera visualizamos cuál es la importancia de cada una de las variables.

Sin duda alguna, este tipo de variables son de suma importancia y nos sirve para calcular varias cosas.