Distribución de Probabilidad Discreta CASO. Niños lectura en USA


19031231 Osiris Ochoa Solis


Variables aleatorias discretas

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

Caso

En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.
La tabla siguiente muestra, de acuerdo con las edades, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.
Edad___Número de niños
6 ___ 37369
7 ___ 87436
8 ___ 160840
9 ___ 239719
10 ___ 286719
11 ___ 306533
12 ___ 310787
13 ___ 302604
14 ___ 289168
Si desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea x la variable aleatoria que indica la edad de un niño tomado en forma aleatoria.
Con estos datos elabore una distribución de probabilidad para x. Especifique los valores de la variable aleatoria y los correspondientes valores de la función de probabilidad p(x)

Objetivos

1-Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14
-¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años?
-¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años?
-¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años?
-¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años?
-¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años?
-¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años?
2-Determinar valor esperado ∑xp(x)
3-Determinar la probabilidad acumulada F(X) de x (6 a 14)
4-Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)
5-Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
6-Visualizar la gráfica de la probabilidad acumulada F(x)
7-Determinar varianza σ2=∑(x−μ)2p(x)
8-Determinar desviación std σ=σ2−−√

Cálculo de probabilidades

9-¿Cual es la probabilidad para seleccionar un niño de siete años o menor?
10-¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?
11-¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?
12-¿Cuál es la probabilidad de seleccionar un niño menor que once años?
13-¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve?

Librerias necesarias

#library(gtools) # Para combinations() y permutations()
library(knitr)  # Para kable()

P1

1. Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14
x <- c(6,7,8,9,10,11,12,13,14)
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n = sum(ninios)

prob.x <- ninios/ n

x
## [1]  6  7  8  9 10 11 12 13 14
prob.x
## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551
## [8] 0.14971687 0.14306925

P2

2. Determinar valor esperado ∑xp(x)
v.e <- sum(x * prob.x)
v.e
## [1] 10.99913

P3

3. Determinar la probabilidad acumulada F(X) de x (6 a 14)
-El valor de la posición de un vetor en R empieza en 1
-El valor de la variable aleatoria empieza en 6
-Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6
-La posición 9 del vector prob.acum.x será para el valor de la variable x=14
prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
                 sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
                 sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x
## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000

P4

4. Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)
pos x p(x) F(x) xp(x) (x−μ)2) (x−μ)2p(x)
tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)
pos x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
1 6 0.0184888 0.0184888 0.1109325 24.9912583 0.4620571
2 7 0.0432600 0.0617487 0.3028199 15.9930068 0.6918572
3 8 0.0795775 0.1413262 0.6366198 8.9947553 0.7157799
4 9 0.1186038 0.2599300 1.0674340 3.9965038 0.4740005
5 10 0.1418576 0.4017876 1.4185758 0.9982523 0.1416097
6 11 0.1516608 0.5534484 1.6682687 0.0000008 0.0000001
7 12 0.1537655 0.7072139 1.8451861 1.0017493 0.1540345
8 13 0.1497169 0.8569307 1.9463193 4.0034977 0.5993912
9 14 0.1430693 1.0000000 2.0029696 9.0052462 1.2883739

P5

5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
barplot(height = tabla$prob.x, names.arg = tabla$x)

P6

6. Visualizar la gráfica de la probabilidad acumulada F(x)
plot(x,prob.acum.x, type = 'b')

P7

7. Determinar varianza σ2=∑(x−μ)2p(x)
var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 4.527104

P8

8. Determinar desviación std σ=σ2−−√
desv.std <- sqrt(var)
desv.std
## [1] 2.127699

Cálculo de probabilidades

A partir de la tabla de distribuciónde proabilidad…
kable(tabla[,1:4]) # Solo las cuatro primeras columnas que interesan
pos x prob.x prob.acum.x
1 6 0.0184888 0.0184888
2 7 0.0432600 0.0617487
3 8 0.0795775 0.1413262
4 9 0.1186038 0.2599300
5 10 0.1418576 0.4017876
6 11 0.1516608 0.5534484
7 12 0.1537655 0.7072139
8 13 0.1497169 0.8569307
9 14 0.1430693 1.0000000

P9

9. ¿Cual es la probabilidad para seleccionar un niño de siete años o menor?
- Se identifica la prob.acum.x[7-5] para identificar la fila 2 de la columna
- A través de variable i para identificar la diferencia entre el valor inciial de la variable discreta y la posición de la primera fila…
- Se utiliza cat para desplegar dos valores concatentando “%”
i=5 # o sea min(tabla$) - 1  
#
i = min(tabla$x) - 1 # Todas las filas y/o vectores en R empiezan en 1
i
## [1] 5
tabla$prob.acum.x[7-i]
## [1] 0.06174874
cat(tabla$prob.acum.x[7-i] * 100,"%")
## 6.174874 %

P10

10. ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?
1 - tabla$prob.acum.x[8-i]
## [1] 0.8586738

P11

11. ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?
tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]
## [1] 0.4121222

P12

12. ¿Cuál es la probabilida de seleccionar un niño menor que once años?
tabla$prob.acum.x[10-i] 
## [1] 0.4017876
cat(tabla$prob.acum.x[10-i] * 100,"%")
## 40.17876 %

P13

13. ¿Cuál es la probabildiad de seleccionar un niño de exactamente la edad de nueve?
tabla$prob.acum.x[9-i] 
## [1] 0.25993

CONCLUSION:

El problema nos plantea cuantos niños poseen dificultades de lectura para su edad, por ello mediante este problema nosotros podemos saber con certeza cual es la probabilidad de que un niño de cierta edad tenga problemas en este campo, por lo que, el problema nos ayuda a nosotros para poder interpretar cual de todas las edades es la mas critica para nosotros poder tomar cartas en el asunto en base a las probabilidades para disminuir el numero de niños con problemas de lectura, concentrandonos en esa seccion en especial