Caso 15.- Variables aleatorias discretas, media, varianza y desviacion estandar

Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación. Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas. Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.

1.- Cargar librerias.

library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
library(knitr)

2.- Ejercicios.

Para cada ejercicio realizar lo siguiente:

Describir y definir el contexo del ejercicio, poner la referencia (enlace) del mismo.
Elaborar su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
En algunos ejercicios trae consigo el espacio muestral de preferencia incorporarlo en el documento
Identificar a diferencia del caso 14:
- ¿Cuál es el valor de la media de la distribución?
- ¿Cuál es el valor de la varianza de la distribución?
- ¿Cuál es el valor de desviación de la distribución?

2.1 Ejercicio 1 (ejemplo)

Ejercicio de ejemplo proporcionado por el profesor.
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")

Tabla de probabilidad con la columna para valor esperado
x	casos	f.prob.x	F.acum.x	x.f.prob.x
0	4997	0.9994	0.9994	0.00
1	50	0.0100	1.0094	0.01

VA Valor esperado (Media de la distribucion)

Su formula es:

VE <- sum(tabla$x * tabla$f.prob.x)

VE

## [1] 0.01

Varianza

Su formula es: \[\alpha^2 = \sum(x-\mu)^2P(x)\]
Agregamos tabla con sus datos previamente generados.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	casos	f.prob.x	F.acum.x	x.f.prob.x	VE	x-VE.cuad.f.prob.x
0	4997	0.9994	0.9994	0.00	0.01	0.0000999
1	50	0.0100	1.0094	0.01	0.01	0.0098010

Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza

## [1] 0.00990094

Desviacion Estandar

\[\sqrt{ \alpha^2}\]

desEstandar <- sqrt(Varianza)
desEstandar

## [1] 0.09950347

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )

Tabla de datos final
x	casos	f.prob.x	F.acum.x	x.f.prob.x	VE	x-VE.cuad.f.prob.x	DesEstandar
0	4997	0.9994	0.9994	0.00	0.01	0.0000999	0.0995035
1	50	0.0100	1.0094	0.01	0.01	0.0098010	0.0995035

2.2 Ejercicio 2

https://www.superprof.es/apuntes/escolar/matematicas/probabilidades/distribucion-binomial/ejercicios-de-distribuciones-discretas.html
Si una persona compra una papeleta en una rifa, en la que puede ganar de 5000 € ó un segundo premio de 2000 € y un tercer premio de 1000 € con probabilidades de: 0.001 y 0.003 y 0.010. ¿Cuál sería el precio justo a pagar por la papeleta?

discretas <- c(1,2,3)  ## o nada  1 primer premio  2 segundo
n <- c(3000, 2000, 1000)
casos <- c(0.001,0.003,0.01)
probabilidades <- casos / n * 100
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    Casos = casos,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla

##   x Casos     f.prob.x     f.acum.x
## 1 1 0.001 3.333333e-05 3.333333e-05
## 2 2 0.003 1.500000e-04 1.833333e-04
## 3 3 0.010 1.000000e-03 1.183333e-03

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$x * tabla$f.prob.x)

VE

## [1] 0.003333333

Varianza

Agregamos tabla con sus datos previamente generados.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	Casos	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x
1	0.001	3.33e-05	0.0000333	0.0033333	3.31e-05
2	0.003	1.50e-04	0.0001833	0.0033333	5.98e-04
3	0.010	1.00e-03	0.0011833	0.0033333	8.98e-03

Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza

## [1] 0.009611124

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar

## [1] 0.09803634

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )

Tabla de datos final
x	Casos	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x	DesEstandar
1	0.001	3.33e-05	0.0000333	0.0033333	3.31e-05	0.0980363
2	0.003	1.50e-04	0.0001833	0.0033333	5.98e-04	0.0980363
3	0.010	1.00e-03	0.0011833	0.0033333	8.98e-03	0.0980363

2.3 Ejercicio 3

https://www.superprof.es/apuntes/escolar/matematicas/probabilidades/distribucion-binomial/ejercicios-de-distribuciones-discretas.html
determinamos el ejercicio con la tabla que se menciona a continuacion, determinamos probabilidad acumulativa con sus respectivas tablas.

dato <- data.frame(X = c(0,1,2,3,4,5), probabilidades = c(0.1,0.2,0.1,0.4,0.1,0.1))
kable(dato, caption = "Tabla de datos del ejercicio")

Tabla de datos del ejercicio
X	probabilidades
0	0.1
1	0.2
2	0.1
3	0.4
4	0.1
5	0.1

Solucion y procedimientos

discretas <- 0:5  ## o nada  1 primer premio  2 segundo
casos <- c(0.1,0.2,0.1,0.4,0.1,0.1)
probabilidades <- casos 
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla

##   x f.prob.x f.acum.x
## 1 0      0.1      0.1
## 2 1      0.2      0.3
## 3 2      0.1      0.4
## 4 3      0.4      0.8
## 5 4      0.1      0.9
## 6 5      0.1      1.0

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$x * tabla$f.prob.x)

VE

## [1] 2.5

Varianza

Agregamos tabla con sus datos previamente generados.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
x	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x
0	0.1	0.1	2.5	0.625
1	0.2	0.3	2.5	0.450
2	0.1	0.4	2.5	0.025
3	0.4	0.8	2.5	0.100
4	0.1	0.9	2.5	0.225
5	0.1	1.0	2.5	0.625

Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza

## [1] 2.05

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar

## [1] 1.431782

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )

Tabla de datos final
x	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x	DesEstandar
0	0.1	0.1	2.5	0.625	1.431782
1	0.2	0.3	2.5	0.450	1.431782
2	0.1	0.4	2.5	0.025	1.431782
3	0.4	0.8	2.5	0.100	1.431782
4	0.1	0.9	2.5	0.225	1.431782
5	0.1	1.0	2.5	0.625	1.431782

2.4 Ejercicio 4

https://ieszaframagon.com/matematicas/estadistica/var_aleatoria/tema5_2.html
Obtener la función de probabilidad de la variable “número de caras obtenidas al lanzar tres monedas” E = {(c,c,c); (c,x,c); (x,c,c); (c,c,x); (c,x,x,); (x,c,x); (x,x,c); (x,x,x)}

discretas <- 0:3  ## o nada  1 primer premio  2 segun
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(Caras_X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla

##   Caras_X f.prob.x f.acum.x
## 1       0    0.125    0.125
## 2       1    0.375    0.500
## 3       2    0.375    0.875
## 4       3    0.125    1.000

Grafica de barra

ggplot(data = tabla, aes(x = Caras_X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = Caras_X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$Caras_X * tabla$f.prob.x)

VE

## [1] 1.5

Varianza

Agregamos tabla con sus datos previamente generados.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$Caras_X - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
Caras_X	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x
0	0.125	0.125	1.5	0.28125
1	0.375	0.500	1.5	0.09375
2	0.375	0.875	1.5	0.09375
3	0.125	1.000	1.5	0.28125

Varianza <- sum((tabla$Caras_X - VE) ^ 2 * tabla$f.prob.x)
Varianza

## [1] 0.75

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar

## [1] 0.8660254

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )

Tabla de datos final
Caras_X	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x	DesEstandar
0	0.125	0.125	1.5	0.28125	0.8660254
1	0.375	0.500	1.5	0.09375	0.8660254
2	0.375	0.875	1.5	0.09375	0.8660254
3	0.125	1.000	1.5	0.28125	0.8660254

2.5 Ejercicio 5

https://ieszaframagon.com/matematicas/estadistica/var_aleatoria/tema5_2.html
En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100 parejas:

dato <- data.frame(hijos = c(0,1,2,3,4,5,7), Parejas = c(15,40,23,10,7,4,1))
kable(dato, caption = "Datos iniciales")

Datos iniciales
hijos	Parejas
0	15
1	40
2	23
3	10
4	7
5	4
7	1

Solucion y procedimiento

discretas <- c(0,1,2,3,4,5,7)  ## o nada  1 primer premio  2 segun
n <- 100
casos <- c(15,40,23,10,7,4,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla

##   X f.prob.x f.acum.x
## 1 0     0.15     0.15
## 2 1     0.40     0.55
## 3 2     0.23     0.78
## 4 3     0.10     0.88
## 5 4     0.07     0.95
## 6 5     0.04     0.99
## 7 7     0.01     1.00

Grafica de barra

ggplot(data = tabla, aes(x = X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$X * tabla$f.prob.x)

VE

## [1] 1.71

Varianza

Agregamos tabla con sus datos previamente generados.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$X - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Tabla de probabilidad con valor esperado y columnas para varianza
X	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x
0	0.15	0.15	1.71	0.438615
1	0.40	0.55	1.71	0.201640
2	0.23	0.78	1.71	0.019343
3	0.10	0.88	1.71	0.166410
4	0.07	0.95	1.71	0.367087
5	0.04	0.99	1.71	0.432964
7	0.01	1.00	1.71	0.279841

Varianza <- sum((tabla$X - VE) ^ 2 * tabla$f.prob.x)
Varianza

## [1] 1.9059

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar

## [1] 1.380543

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )

Tabla de datos final
X	f.prob.x	f.acum.x	VE	x-VE.cuad.f.prob.x	DesEstandar
0	0.15	0.15	1.71	0.438615	1.380543
1	0.40	0.55	1.71	0.201640	1.380543
2	0.23	0.78	1.71	0.019343	1.380543
3	0.10	0.88	1.71	0.166410	1.380543
4	0.07	0.95	1.71	0.367087	1.380543
5	0.04	0.99	1.71	0.432964	1.380543
7	0.01	1.00	1.71	0.279841	1.380543

3.- Interpretacion del caso

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

La variable aleatoria se define por el numero de eventos que hay en el ejercicio.

3.2. ¿Qué valores puede tomar la variable aleatoria?

Culaquier valor numerico

3.3. ¿Cuál es el espacio muestral?

Una pequeña parte de todas los datos disponibles.

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

puede varia dependiendo de cada quien, pero lo mas normar seria un 10% de todo la poblacion.

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

En total hay 5 casos.

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

la probabilidad mas grande de la variable aleatoria es de 40%

3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias.

3.7.1. Que sea exactamente igual a un valor de variable aleatoria

hay graficasos podemos identificar facilmente el porcentaje al momento de elegir exactamente una variable como en el ejemplo 3, la probabilidad de que salga cara en 2 monedas es del 37.5%

3.7.2. Qué sea menor o igual

Para este pregunta que sea menor o igual a cierto numero o porcentaje, saldria un porsenataje mayor ya que son en grupos. *por ejemplo en el ejercicio 5 la probabilidad de tener 2 o menos hijos es del 78%

3.7.3. Que sea mayor o igual

lo mismo que en lo anterior tomando de ejemplo el ejercicio 5 la probabilidad de tener 4 o mas hijos es del 5%.

3.7.4. Alguna otra pregunta del caso.

tomando como referencia el ejercicio 4 Cual seria la probabilidad de no obtener caras es del 12.5%

3.8. ¿Qué significado tiene el gráfico de barra?

En el podemos identificar cual caso o opciones que tenemos es la mas probable de todos o menos probable.

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

Aqui podemos ver si las probabilidades estan correctas y ver cual tiene mas probabilidad de todas en forma lineal.

3.10. ¿Cuál es el valor de de la media de la distribución y qué significa?

Es el valor promedio de un conjunto de datos numéricos. El valor de la media de la distribucion es la suma de los casos por la probabilidad de estos mismos como en el ejemplo 5 nos da resultado un 1.7.

3.11. ¿Cuál es el valor de la varianza de la distribución y qué significa?

calcula la suma de los residuos elevados al cuadrado y divididos entre el total de observaciones, y esta es una medida de dispersion.

3.12. ¿Cuál es el valor de desviación de la distribución y qué significa?

Mide la dispersión, entre más dispersa está una distribución de datos, más grande es su desviación estándar. por ejemplo en el caso 3 tenemos una desviacion de 1.4 la mas grande en nuestros ejercicios.

Caso 15.- Variables aleatorias discretas, media, varianza y desviacion estandar

Guadiana Aguirre Christian

9/11/2020

Objetivo

Descripción

1.- Cargar librerias.

2.- Ejercicios.

Para cada ejercicio realizar lo siguiente:

2.1 Ejercicio 1 (ejemplo)

VA Valor esperado (Media de la distribucion)

Varianza

Desviacion Estandar

Tabla de datos final

2.2 Ejercicio 2

Grafica de barra

Grafica lineal acumulada

VA Valor esperado (Media de la distribucion)

Varianza

Desviacion Estandar

Tabla de datos final

2.3 Ejercicio 3

Solucion y procedimientos

Grafica de barra

Grafica lineal acumulada

VA Valor esperado (Media de la distribucion)

Varianza

Desviacion Estandar

Tabla de datos final

2.4 Ejercicio 4

Grafica de barra

Grafica lineal acumulada

VA Valor esperado (Media de la distribucion)

Varianza

Desviacion Estandar

Tabla de datos final

2.5 Ejercicio 5

Solucion y procedimiento

Grafica de barra

Grafica lineal acumulada

VA Valor esperado (Media de la distribucion)

Varianza

Desviacion Estandar

Tabla de datos final

3.- Interpretacion del caso

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

3.2. ¿Qué valores puede tomar la variable aleatoria?

3.3. ¿Cuál es el espacio muestral?

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias.

3.7.1. Que sea exactamente igual a un valor de variable aleatoria

3.7.2. Qué sea menor o igual

3.7.3. Que sea mayor o igual

3.7.4. Alguna otra pregunta del caso.

3.8. ¿Qué significado tiene el gráfico de barra?

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

3.10. ¿Cuál es el valor de de la media de la distribución y qué significa?

3.11. ¿Cuál es el valor de la varianza de la distribución y qué significa?

3.12. ¿Cuál es el valor de desviación de la distribución y qué significa?