Practica 15: CASO. Niños lectura en USA

Descripción

Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

Caso

En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.

La tabla siguiente muestra, de acuerdo con las edades, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.

Edad	Número de niños
6	37369
7	87436
8	160840
9	239719
10	286719
11	306533
12	310787
13	302604
14	289168

Se desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea \(x\) la variable aleatoria que indica la edad de un niño tomado en forma aleatoria.

Con estos datos elabore una distribución de probabilidad para \(x\). Especifique los valores de la variable aleatoria y los correspondientes valores de la función de probabilidad \(p(x)\)

Objetivos.

Identificar los valores de \(x\) (variable aleatoria) y de probabilidad de \(x\) en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14

¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años?
¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años?

Determinar valor esperado \(\sum xp(x)\)
Determinar la probabilidad acumulada \(F(X)\) de \(x\) (6 a 14)
Determinar y visualizar la tabla de distribución de probabilidad con columnas de \(x\), \(p(x)\), \(F(x)\) o probabilidad acumulada o función de la distribución acumulativa, \(xp(x)\), \((x - \mu) ^ 2\), \((x - \mu) ^ 2 p(x)\).
Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
Visualizar la gráfica de la probabilidad acumulada \(F(x)\)
Determinar varianza \(\sigma ^ 2 = \sum (x - \mu) ^ 2 p(x)\)
Determinar desviación std \(\sigma = \sqrt{\sigma^2}\)
¿Cual es la probabilidad para seleccionar un niño de siete años o menor?
¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?
¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?
¿Cuál es la probabilidad de seleccionar un niño menor que once años?
¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve?

Librerias

library(knitr)

## Warning: package 'knitr' was built under R version 3.6.3

1. Identificar los valores de \(x\) (variable aleatoria) y de probabilidad de \(x\) en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14

x <- c(6,7,8,9,10,11,12,13,14)
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n = sum(ninios)

prob.x <- ninios/ n

x

## [1]  6  7  8  9 10 11 12 13 14

prob.x

## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551
## [8] 0.14971687 0.14306925

2. Determinar valor esperado \(\sum xp(x)\)

v.e <- sum(x * prob.x)
v.e

## [1] 10.99913

3. Determinar la probabilidad acumulada \(F(X)\) de \(x\) (6 a 14)

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
                 sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
                 sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x

## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000

4. Determinar y visualizar la tabla de distribución de probabilidad con columnas de \(x\), \(p(x)\), \(F(x)\) o probabilidad acumulada o función de la distribución acumulativa, \(xp(x)\), \((x - \mu) ^ 2\), \((x - \mu) ^ 2 p(x)\).

tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)

pos	x	prob.x	prob.acum.x	x.prob.x	x-v.e^2	x-v.e^2prob.x
1	6	0.0184888	0.0184888	0.1109325	24.9912583	0.4620571
2	7	0.0432600	0.0617487	0.3028199	15.9930068	0.6918572
3	8	0.0795775	0.1413262	0.6366198	8.9947553	0.7157799
4	9	0.1186038	0.2599300	1.0674340	3.9965038	0.4740005
5	10	0.1418576	0.4017876	1.4185758	0.9982523	0.1416097
6	11	0.1516608	0.5534484	1.6682687	0.0000008	0.0000001
7	12	0.1537655	0.7072139	1.8451861	1.0017493	0.1540345
8	13	0.1497169	0.8569307	1.9463193	4.0034977	0.5993912
9	14	0.1430693	1.0000000	2.0029696	9.0052462	1.2883739

5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad.

barplot(height = tabla$prob.x, names.arg = tabla$x)

6. Visualizar la gráfica de la probabilidad acumulada \(F(x)\)

plot(x,prob.acum.x, type = 'b')

7. Determinar varianza \(\sigma ^ 2 = \sum (x - \mu) ^ 2 p(x)\)

var <- sum((x - v.e) ^ 2 * prob.x)
var

## [1] 4.527104

8. Determinar desviación std \(\sigma = \sqrt{\sigma^2}\)

desv.std <- sqrt(var)
desv.std

## [1] 2.127699

Tabla de probabilidades

kable(tabla[,1:4])

pos	x	prob.x	prob.acum.x
1	6	0.0184888	0.0184888
2	7	0.0432600	0.0617487
3	8	0.0795775	0.1413262
4	9	0.1186038	0.2599300
5	10	0.1418576	0.4017876
6	11	0.1516608	0.5534484
7	12	0.1537655	0.7072139
8	13	0.1497169	0.8569307
9	14	0.1430693	1.0000000

9. ¿Cual es la probabilidad para seleccionar un niño de siete años o menor?

i=5
i = min(tabla$x) - 1
i

## [1] 5

tabla$prob.acum.x[7-i]

## [1] 0.06174874

cat(tabla$prob.acum.x[7-i] * 100,"%")

## 6.174874 %

10. ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?

1 - tabla$prob.acum.x[8-i]

## [1] 0.8586738

cat(1-tabla$prob.acum.x[8-i] * 100,"%")

## -13.13262 %

11. ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?

tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]

## [1] 0.4121222

cat((tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]) * 100,"%")

## 41.21222 %

12. ¿Cuál es la probabilidad de seleccionar un niño menor que once años? \[p(x<11)\] entonces: \[p(x<11) = \sum p(6),p(7)...p(10) = p(6) +p(7)+p(8)+p(9)+p(10)\]

de tal forma que: \[F(10)\]

tabla$prob.acum.x[10-i]

## [1] 0.4017876

cat(tabla$prob.acum.x[10-i] * 100,"%")

## 40.17876 %

13. ¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve? \[p(x=9)\]

de tal forma que: \[F(9)\]

tabla$prob.acum.x[9-i]

## [1] 0.25993

cat(tabla$prob.acum.x[9-i] * 100,"%")

## 25.993 %