Variables aleatorias discretas
Descripción
Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.
Caso
En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.
La tabla siguiente muestra, de acuerdo con las edades, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.
Edad Número de niños 6 37369 7 87436 8 160840 9 239719 10 286719 11 306533 12 310787 13 302604 14 289168
Si desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea x la variable aleatoria que indica la edad de un niño tomado en forma aleatoria.
Con estos datos elabore una distribución de probabilidad para x. Especifique los valores de la variable aleatoria y los correspondientes valores de la función de probabilidad p(x)
Objetivos
Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14 ¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años?
4.Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)
5.Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
6.Visualizar la gráfica de la probabilidad acumulada F(x)
7.Determinar varianza σ2=∑(x−μ)2p(x)
8.Determinar desviación std σ=√σ2
Cálculo de probabilidades
#library(gtools) # Para combinations() y permutations()
library(knitr) # Para kable()
## Warning: package 'knitr' was built under R version 3.6.3
x <- c(6,7,8,9,10,11,12,13,14)
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n = sum(ninios)
prob.x <- ninios/ n
x
## [1] 6 7 8 9 10 11 12 13 14
prob.x
## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551
## [8] 0.14971687 0.14306925
v.e <- sum(x * prob.x)
v.e
## [1] 10.99913
Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6
La posición 9 del vector prob.acum.x será para el valor de la variable x=14
prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x
## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000
x p(x) F(x) xp(x) (x−μ)2) (x−μ)2p(x)
tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)
colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")
kable(tabla)
| pos | x | prob.x | prob.acum.x | x.prob.x | x-v.e^2 | x-v.e^2prob.x |
|---|---|---|---|---|---|---|
| 1 | 6 | 0.0184888 | 0.0184888 | 0.1109325 | 24.9912583 | 0.4620571 |
| 2 | 7 | 0.0432600 | 0.0617487 | 0.3028199 | 15.9930068 | 0.6918572 |
| 3 | 8 | 0.0795775 | 0.1413262 | 0.6366198 | 8.9947553 | 0.7157799 |
| 4 | 9 | 0.1186038 | 0.2599300 | 1.0674340 | 3.9965038 | 0.4740005 |
| 5 | 10 | 0.1418576 | 0.4017876 | 1.4185758 | 0.9982523 | 0.1416097 |
| 6 | 11 | 0.1516608 | 0.5534484 | 1.6682687 | 0.0000008 | 0.0000001 |
| 7 | 12 | 0.1537655 | 0.7072139 | 1.8451861 | 1.0017493 | 0.1540345 |
| 8 | 13 | 0.1497169 | 0.8569307 | 1.9463193 | 4.0034977 | 0.5993912 |
| 9 | 14 | 0.1430693 | 1.0000000 | 2.0029696 | 9.0052462 | 1.2883739 |
barplot(height = tabla$prob.x, names.arg = tabla$x)
6. Visualizar la gráfica de la probabilidad acumulada F(x)
plot(x,prob.acum.x, type = 'b')
7. Determinar varianza σ2=∑(x−μ)2p(x)
var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 4.527104
desv.std <- sqrt(var)
desv.std
## [1] 2.127699
∑p(x=6),p(x=7)=p(6)+p(7)
F(x=7)
i=5 # o sea min(tabla$) - 1
#
i = min(tabla$x) - 1 # Todas las filas y/o vectores en R empiezan en 1
i
## [1] 5
tabla$prob.acum.x[7-i]
## [1] 0.06174874
cat(tabla$prob.acum.x[7-i] * 100,"%")
## 6.174874 %
igual a:
1−p(x≤8)
entonces:
1−(∑p(x=6),p(x=7),p(x=8))=1−(p(6)+p(7)+p(8))
igual a:
1−F(x=8)
tabla$prob.acum.x[8-i]
## [1] 0.1413262
entonces:
de tal forma que:
F(11)−F(8)
tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]
## [1] 0.4121222
tabla$prob.acum.x[10-i]
## [1] 0.4017876
tabla$prob.acum.x[9-i]
## [1] 0.25993