Variables aleatorias discretas

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

Caso

En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.

La tabla siguiente muestra, de acuerdo con las edades, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.

Edad Número de niños 6 37369 7 87436 8 160840 9 239719 10 286719 11 306533 12 310787 13 302604 14 289168

Objetivos

  • Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años?

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años?

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años?

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años?

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años?

  • ¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años?

  • Determinar valor esperado ∑xp(x)

  • Determinar la probabilidad acumulada F(X) de x (6 a 14)

  • Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)

  • Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

  • Visualizar la gráfica de la probabilidad acumulada F(x)

  • Determinar varianza σ2=∑(x−μ)2p(x)

  • Determinar desviación std σ=σ2−−√ ### Cálculo de probabilidades

  • ¿Cual es la probabilidad para seleccionar un niño de siete años o menor?

  • ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?

  • ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?

  • ¿Cuál es la probabilidad de seleccionar un niño menor que once años?

  • ¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve?

Librerías necesarias

library(knitr)  # Para kable()

1. Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14

x <- c(6,7,8,9,10,11,12,13,14)
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n = sum(ninios)

prob.x <- ninios/ n

x
## [1]  6  7  8  9 10 11 12 13 14

2. Determinar valor esperado ∑xp(x)

v.e <- sum(x * prob.x)
v.e
## [1] 10.99913

3. Determinar la probabilidad acumulada F(X) de x (6 a 14)

El valor de la posición de un vetor en R empieza en 1 El valor de la variable aleatoria empieza en 6 Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6 La posición 9 del vector prob.acum.x será para el valor de la variable x=14

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
                 sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
                 sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x
## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000

4. Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)

tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
pos x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
1 6 0.0184888 0.0184888 0.1109325 24.9912583 0.4620571
2 7 0.0432600 0.0617487 0.3028199 15.9930068 0.6918572
3 8 0.0795775 0.1413262 0.6366198 8.9947553 0.7157799
4 9 0.1186038 0.2599300 1.0674340 3.9965038 0.4740005
5 10 0.1418576 0.4017876 1.4185758 0.9982523 0.1416097
6 11 0.1516608 0.5534484 1.6682687 0.0000008 0.0000001
7 12 0.1537655 0.7072139 1.8451861 1.0017493 0.1540345
8 13 0.1497169 0.8569307 1.9463193 4.0034977 0.5993912
9 14 0.1430693 1.0000000 2.0029696 9.0052462 1.2883739

5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

barplot(height = tabla$prob.x, names.arg = tabla$x)

### 6. Visualizar la gráfica de la probabilidad acumulada F(x)

plot(x,prob.acum.x, type = 'b')

### 7. Determinar varianza σ2=∑(x−μ)2p(x)

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 4.527104

8. Determinar desviación std σ=σ2−−√

desv.std <- sqrt(var)
desv.std
## [1] 2.127699

Cálculo de probabilidades

A partir de la tabla de distribuciónde proabilidad…

kable(tabla[,1:4])
pos x prob.x prob.acum.x
1 6 0.0184888 0.0184888
2 7 0.0432600 0.0617487
3 8 0.0795775 0.1413262
4 9 0.1186038 0.2599300
5 10 0.1418576 0.4017876
6 11 0.1516608 0.5534484
7 12 0.1537655 0.7072139
8 13 0.1497169 0.8569307
9 14 0.1430693 1.0000000

9. ¿Cual es la probabilidad para seleccionar un niño de siete años o menor?

p(x≤7) entonces: ∑p(x=6),p(x=7)=p(6)+p(7)

F(x=7)

Se identifica la prob.acum.x[7-5] para identificar la fila 2 de la columna A través de variable i para identificar la diferencia entre el valor inciial de la variable discreta y la posición de la primera fila… Se utiliza cat para desplegar dos valores concatentando “%”

i=5 # o sea min(tabla$) - 1  
#
i = min(tabla$x) - 1 # Todas las filas y/o vectores en R empiezan en 1
i
## [1] 5

Ahora se utiliza i

tabla$prob.acum.x[7-i]
## [1] 0.06174874

10. ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?

$p(x>8) igual a: 1−p(x≤8) entonces: 1−(∑p(x=6),p(x=7),p(x=8))=1−(p(6)+p(7)+p(8)) igual a: 1−F(x=8)

1 - tabla$prob.acum.x[8-i]
## [1] 0.8586738

11. ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?

tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]
## [1] 0.4121222

12. ¿Cuál es la probabilida de seleccionar un niño menor que once años?

tabla$prob.acum.x[10-i]
## [1] 0.4017876

13. ¿Cuál es la probabildiad de seleccionar un niño de exactamente la edad de nueve?

tabla$prob.acum.x[9-i]
## [1] 0.25993