Caso 15 extra - Valor Esperado Varianza y Desviación Estándar de variables aleatorias continuas

Alejandro Fernández

Objetivo

Determinar función de probabilidad, valor esperado, varianza, desviación estándar del número de celulares adquiridos dados los datos de 100 estudiantes.

Descripción

Se cargan librerias necesarias. Se inicializan variables. Se construye la tabla de probabilidad. Se visualiza variables de la tabla de probabilidad. Se calcula el valor esperado. Se calcula la desviación estándar. Se interpreta el caso.

Fórmula de valor esperado

\[ VE=\mu = \sum x \cdot f(x) \]

Fórmula de la varianza para una distribución de una variable discreta

\[ \alpha^2 = \sum(x-\mu)^2\cdot f(x) \]

Fórmula de la desviación estándar de una variable discreta

\[ \alpha=\sqrt{\alpha^{2}} \]

Cargar librerias

library(ggplot2)

Inicializar variables

discretas <- c(0, 1, 2, 3, 4, 5, 6)
casos <- c(5, 10, 20, 30, 15, 12, 8)
n <- sum(casos)
probabilidades <- casos / n

Construir la tabla de distribución

acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))

Mostrar tabla

tabla
  x casos f.prob.x F.acum.x x.f.prob.x
1 0     5     0.05     0.05       0.00
2 1    10     0.10     0.15       0.10
3 2    20     0.20     0.35       0.40
4 3    30     0.30     0.65       0.90
5 4    15     0.15     0.80       0.60
6 5    12     0.12     0.92       0.60
7 6     8     0.08     1.00       0.48

Diagrama de barra con frecuencias

g <- ggplot(data = tabla, aes(x = x, y = casos)) + 
  geom_bar(stat="identity")
g

Barras con la función de probabilidad

g <- ggplot(data = tabla, aes(x = x, y = f.prob.x)) + 
  geom_bar(stat="identity")
g

Visualizar función acumulada

g= ggplot(data = tabla,aes(x = x,y =F.acum.x))+
  geom_line()
g

Función acumulada con barras

g= ggplot(data = tabla,aes(x = x,y =F.acum.x))+
  geom_bar(stat="identity")
g

Calcular el valor esperado VE

VE=sum(tabla$x.f.prob.x )
paste("El valor esperado es: ",VE)
[1] "El valor esperado es:  3.08"

Diagrama de barras con el valor esperado con VE

g= ggplot(data = tabla,aes(x = x,y =f.prob.x))+
  geom_bar(stat="identity")+
  geom_vline(xintercept =VE, color="red")
g

Calcular la varianza

Varianza=sum((tabla$x - VE)^2 * tabla$f.prob.x)
paste("La varianza de esta tabla de distribucion es: ",Varianza)
[1] "La varianza de esta tabla de distribucion es:  2.3936"

Calcular desviación estándar

Desviacion=round(sqrt(Varianza), 4)
paste("La desviacion estandar es: ",Desviacion)
[1] "La desviacion estandar es:  1.5471"

Interpretar

Acorde a la simulación de datos de una encuesta sobre el número de celulares adquiridos por estudiante, existe una probabilidad del 30 % que hayan adquirido 3 celulares en un cuerpo de 100 muestras.

La tabla de distribución representa la variable discreta, sus probabilidades y valor acumulado.

El valor esperado del número de celulares promedio es de: 3.08 celulares adquiridos.

Puede variar al rededor del 1.54 celulares respecto al valor esperado.