Objetivo

Determinar función de probabilidad, valor esperado, varianza, desviación estándar del número de celulares adquiridos dados los datos de 100 estudiantes.

Descripción

Se cargan librerias necesarias. Se inicializan variables. Se construye la tabla de probabilidad. Se visualiza variables de la tabla de probabilidad. Se calcula el valor esperado. Se calcula la desviación estándar. Se interpreta el caso.

Fórmula de valor esperado

\[ VE=\mu = \sum x \cdot f(x) \]

Fórmula de la varianza para una distribución de una variable discreta

\[ \alpha^2 = \sum(x-\mu)^2\cdot f(x) \]

Fórmula de la desviación estándar de una variable discreta

\[ \alpha=\sqrt{\alpha^{2}} \]

Cargar librerias

library(ggplot2)

Inicializar variables

discretas <- c(0, 1, 2, 3, 4, 5, 6)
casos <- c(5, 10, 20, 30, 15, 12, 8)
n <- sum(casos)
probabilidades <- casos / n

Construir la tabla de distribución

acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))

Mostrar tabla

tabla
##   x casos f.prob.x F.acum.x x.f.prob.x
## 1 0     5     0.05     0.05       0.00
## 2 1    10     0.10     0.15       0.10
## 3 2    20     0.20     0.35       0.40
## 4 3    30     0.30     0.65       0.90
## 5 4    15     0.15     0.80       0.60
## 6 5    12     0.12     0.92       0.60
## 7 6     8     0.08     1.00       0.48

Diagrama de barra con frecuencias

g <- ggplot(data = tabla, aes(x = x, y = casos)) + 
  geom_bar(stat="identity")
g

Barras con la función de probabilidad

g <- ggplot(data = tabla, aes(x = x, y = f.prob.x)) + 
  geom_bar(stat="identity")
g

Visualizar función acumulada

g= ggplot(data = tabla,aes(x = x,y =F.acum.x))+
  geom_line()
g

Función acumulada con barras

g= ggplot(data = tabla,aes(x = x,y =F.acum.x))+
  geom_bar(stat="identity")
g

Calcular el valor esperado VE

VE=sum(tabla$x.f.prob.x )
paste("El valor esperado es: ",VE)
## [1] "El valor esperado es:  3.08"

Diagrama de barras con el valor esperado con VE

g= ggplot(data = tabla,aes(x = x,y =f.prob.x))+
  geom_bar(stat="identity")+
  geom_vline(xintercept =VE, color="blue")
g

Calcular la varianza

Varianza=sum((tabla$x - VE)^2 * tabla$f.prob.x)
paste("La varianza de esta tabla de distribucion es: ",Varianza)
## [1] "La varianza de esta tabla de distribucion es:  2.3936"

Calcular desviación estándar

Desviacion=round(sqrt(Varianza), 4)
paste("La desviacion estandar es: ",Desviacion)
## [1] "La desviacion estandar es:  1.5471"

Interpretar

De acuerdo a la somulación de un estudio de una encuesta de acuerdo al número de celulares adquiridos por estudiante existe una probabilidad del 30 % que hayan adquirido tres celulares dentro de 100 encuestados.

La tabla de distribución representa la distribución de la variable discreta, sus probabilidades y valor acumulado.

El valor esperado del número de celulares promedio es de: 3.08 celulares adquiridos (promedio).

Puede variar al rededor de 1.54 celulares respecto al valor esperado.