Variables aleatorias discretas

Descripción

Determinar distribucion de la probabilidad para variables aleatorias discretas, generar tabla de distribucion y visualizar graficas de barra y acumulada, determinar estadisticos: media, varianza y desviacion asi como realizar calculos de probabilidad

Caso

En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.

La tabla siguente muestra, de cuerdo con las edades, el numero de niños que tienen problemas de lectura. La mayoria de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado

Edad Número de niños

6 37369

7 87436

8 160840

9 239719

10 286719

11 306533

12 310787

13 302604

14 289168

Si desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea x la variable aleatoria que indica la edad de un niño tomado en forma aleatoria.

Con estos datos elabore una distribucion de probabilidad para x. Especifique los valores de la variable aleatoria y los correspondientes valores de la funcion de probabilidad p(x)

Objetivos

Calculo de probabilidades
  • 9.¿Cuál es la probabilidad para seleccionar un niño de siete años o menor?
  • 10.¿Cuál es la prbabilidad para seleccionar un niño de mas de ocho años?
  • 11.¿Cuál es la probabilidad para seleccionar a un niño entre nueve y once años?
  • 12¿Cuál es la probabilidad de seleccionar un niño menor que once años?
  • 13.¿Cuál es la probabilidad de seleccionar un niño de exactamente nueve años de edad?

Librerias necesarias

library(knitr)

1. Identificar los valores de x ( variable aleatoria) y de probabilidad de x en la tabla de distribucion mediante frecuancia relativa desde 6 hasta 14

x <- 6:14
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n<- sum(ninios)
prob.x <- ninios/n

x
## [1]  6  7  8  9 10 11 12 13 14
prob.x
## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551
## [8] 0.14971687 0.14306925

2. Determinar el valor esperado \[\sum xp(x)\]

v.e <- sum(x*prob.x)
v.e
## [1] 10.99913

3. Determinar la probabilidad acumulada F(X) de x (6 a 14)

  • El valor de la posicion de un vector en R empieza en 1
  • El valor de la variable aleatoria empienza en 6
  • Entonces se la posicion 1 del vector prob.acum.x sera para el vvalor de la variable x = 6
  • La posicion 9 del vector prob.acum.x sera para el valor de la variable x= 14
prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]), sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]), sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x
## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000

4. Determinar y visualizar la tabla de distribucion de probabilidad con clumnas de x, P(X), F(X) o probidad acumulada o funcion de la distribucion acumulativa ,\[xp(x), (x-\mu)^2, (x-\mu)^2 p(x)\]

pos x p(x) F(x) xp(x) (x−μ)2) (x−μ)2p(x)

tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
pos x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
1 6 0.0184888 0.0184888 0.1109325 24.9912583 0.4620571
2 7 0.0432600 0.0617487 0.3028199 15.9930068 0.6918572
3 8 0.0795775 0.1413262 0.6366198 8.9947553 0.7157799
4 9 0.1186038 0.2599300 1.0674340 3.9965038 0.4740005
5 10 0.1418576 0.4017876 1.4185758 0.9982523 0.1416097
6 11 0.1516608 0.5534484 1.6682687 0.0000008 0.0000001
7 12 0.1537655 0.7072139 1.8451861 1.0017493 0.1540345
8 13 0.1497169 0.8569307 1.9463193 4.0034977 0.5993912
9 14 0.1430693 1.0000000 2.0029696 9.0052462 1.2883739

5. Visualizar la grafica de barrra de la variable aleatroia x con respecto a su probabilidad

barplot(height = tabla$prob.x, names.arg = tabla$x)

6. Visualizar la grafica de la probabilidad acumulada F(x)

plot(x,prob.acum.x, type = 'b')

7. Determinar la varianza \[\sigma ^ 2 = \sum (x - \mu) ^ 2 p(x)\]

var <- sum((x*v.e)^2*prob.x)
var
## [1] 15184.04

8. Determinar desviacion std \[\sigma = \sqrt{\sigma^2}\]

desv.std <- sqrt(var)
desv.std
## [1] 123.2235

Calculo de probabilidad

A partir de la tabla de distribucion de probabilidad

kable(tabla[,1:4])
pos x prob.x prob.acum.x
1 6 0.0184888 0.0184888
2 7 0.0432600 0.0617487
3 8 0.0795775 0.1413262
4 9 0.1186038 0.2599300
5 10 0.1418576 0.4017876
6 11 0.1516608 0.5534484
7 12 0.1537655 0.7072139
8 13 0.1497169 0.8569307
9 14 0.1430693 1.0000000

9.¿Cual es la probabilidad para seleccionar un niño de siete años o menos?

\[p(x\leq7)\] entonces: \[\sum p(x=6),p(x=7) = p(6) + p(7)\] \[F(x=7)\]

  • Se identifica la prob.acum.x [7-5]
  • A traves de variable i para identificar la diferencia entre el valor inicial de la variable discreta y la posicion de la primera fila…
  • Se utiliza cat para desplegar dos valores concatenando “%”
i = 5
i = min(tabla$x) - 1
i
## [1] 5
  • ahora se utiliza i
tabla$prob.acum.x[7-i]
## [1] 0.06174874
cat(tabla$prob.x[9-i]*100,"%")
## 11.86038 %

10.¿Cuál es la probabilidad para seleccionar un niño de mas de ocho años?

\[p(x>8)\] igual a: \[1 - p(x\leq8)\] Entonces: \[1 - (\sum p(x=6),p(x=7), p(x=8)) = 1 -(p(6) + p(7) + p(8)\] Igual a: \[1 - F(x=8)\]

1 - tabla$prob.acum.x[8-i]
## [1] 0.8586738

11.¿Cual es la probabilidad para seleccionar un niño entre nueve y once años

\[p(9 \leq x \leq 11)\] igual: \[p(x\leq11) - p(x\leq8)\] entonces: \[p(x\leq11) = \sum p(6),p(7)...p(11) = p(6) +p(7)+p(8)+p(9)+p(10)+p(11)\] \[p(x\leq8) = \sum p(6),p(7)...p(8) = p(6) +p(7)+p(8)\] de tal forma que: \[F(11) - F(8)\]

tabla$prob.acum.x[11-i]-tabla$prob.acum.x[8-i]
## [1] 0.4121222

12.¿Cuál es la probabilidad de seleccionar un niño menor que once años?

  • demostrar que es 0.4017876
tabla$prob.acum.x[10-i]
## [1] 0.4017876

13.¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve?

  • demostrar que es 0.2599300
tabla$prob.acum.x[9-i]
## [1] 0.25993