| title: “Variables aleatorias” author: “Alejandro Medrano” date: “19/6/2020” output: html_document —Variables aleatorias discretas Descripción Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad. Caso En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad. Si desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea x la variable aleatoria que indica la edad de un niño tomado en forma aleatoria. Con estos datos elabore una distribución de probabilidad para x. Especifique los valores de la variable aleatoria y los correspondientes valores de la función de probabilidad p(x) Objetivos Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14 ¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años? ¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años? ¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años? ¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años? ¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años? ¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años? Determinar valor esperado ∑xp(x) Determinar la probabilidad acumulada F(X) de x (6 a 14) Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x) Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad Visualizar la gráfica de la probabilidad acumulada F(x) Determinar varianza σ2=∑(x−μ)2p(x) Determinar desviación std σ=σ2−−√ Cálculo de probabilidades ¿Cual es la probabilidad para seleccionar un niño de siete años o menor? ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ? ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años? ¿Cuál es la probabilidad de seleccionar un niño menor que once años? ¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve? Librerías necesarias |
r library(gtools) library(knitr) 1. Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14. |
| ```r x <- c(6,7,8,9,10,11,12,13,14) ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168) n = sum(ninios) |
| prob.x <- ninios/ n |
| x ``` |
## [1] 6 7 8 9 10 11 12 13 14 |
r prob.x |
## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551 ## [8] 0.14971687 0.14306925 |
| 2. Determinar valor esperado ∑xp(x) |
r v.e <- sum(x * prob.x) v.e |
## [1] 10.99913 3. Determinar la probabilidad acumulada F(X) de x (6 a 14) -El valor de la posición de un vetor en R empieza en 1 -El valor de la variable aleatoria empieza en 6 -Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6 -La posición 9 del vector prob.acum.x será para el valor de la variable x=14 |
| 3. Determinar la probabilidad acumulada F(X) de x (6 a 14) -El valor de la posición de un vetor en R empieza en 1 -El valor de la variable aleatoria empieza en 6 -Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6 -La posición 9 del vector prob.acum.x será para el valor de la variable x=14 |
r prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]), sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]), sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9])) prob.acum.x |
## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387 ## [8] 0.85693075 1.00000000 |
| 4. Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x) |
| ```r tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x) |
| colnames(tabla) <- c(“pos”,“x”, “prob.x”, “prob.acum.x”, “x.prob.x”, “x-v.e^2”, “x-v.e^2prob.x”) |
| kable(tabla) ``` |
| pos x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x |
1 6 0.0184888 0.0184888 0.1109325 24.9912583 0.4620571 2 7 0.0432600 0.0617487 0.3028199 15.9930068 0.6918572 3 8 0.0795775 0.1413262 0.6366198 8.9947553 0.7157799 4 9 0.1186038 0.2599300 1.0674340 3.9965038 0.4740005 5 10 0.1418576 0.4017876 1.4185758 0.9982523 0.1416097 6 11 0.1516608 0.5534484 1.6682687 0.0000008 0.0000001 7 12 0.1537655 0.7072139 1.8451861 1.0017493 0.1540345 8 13 0.1497169 0.8569307 1.9463193 4.0034977 0.5993912 9 14 0.1430693 1.0000000 2.0029696 9.0052462 1.2883739 5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
barplot(height = tabla$prob.x, names.arg = tabla$x)
6. Visualizar la gráfica de la probabilidad acumulada F(x)
plot(x,prob.acum.x, type = 'b')
7. Determinar varianza σ2=∑(x−μ)2p(x)
var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 4.527104
desv.std <- sqrt(var)
desv.std
## [1] 2.127699
Cálculo de probabilidades A partir de la tabla de distribuciónde proabilidad…
kable(tabla[,1:4])
| pos | x | prob.x | prob.acum.x |
|---|---|---|---|
| 1 | 6 | 0.0184888 | 0.0184888 |
| 2 | 7 | 0.0432600 | 0.0617487 |
| 3 | 8 | 0.0795775 | 0.1413262 |
| 4 | 9 | 0.1186038 | 0.2599300 |
| 5 | 10 | 0.1418576 | 0.4017876 |
| 6 | 11 | 0.1516608 | 0.5534484 |
| 7 | 12 | 0.1537655 | 0.7072139 |
| 8 | 13 | 0.1497169 | 0.8569307 |
| 9 | 14 | 0.1430693 | 1.0000000 |
| 9. ¿Cu | al es | la probabil | idad para seleccionar un niño de siete años o menor? |
| p(x≤7) | |||
| entonc | es: | ||
| ∑p(x=6 | ),p(x | =7)=p(6)+p(7 | ) |
| F(x=7) | |||
| -Se id | entif | ica la prob. | acum.x[7-5] para identificar la fila 2 de la columna |
| -A tra | vés d | e variable i | para identificar la diferencia entre el valor inciial de la variable discreta y la posición de la primera fila… |
| -Se ut | iliza | cat para de | splegar dos valores concatentando “%” |
i=5
i = min(tabla$x) - 1
i
## [1] 5
-Ahora se utiliza i
tabla$prob.acum.x[7-i]
## [1] 0.06174874
cat(tabla$prob.acum.x[7-i] * 100,"%")
## 6.174874 %
1 - tabla$prob.acum.x[8-i]
## [1] 0.8586738
tabla$prob.acum.x[11-i] - tabla$prob.acum.x[8-i]
## [1] 0.4121222
i=9
i = min(tabla$x)
i
## [1] 6
Ahora se utiliza i
tabla$prob.acum.x[11-i]
## [1] 0.4017876
cat(tabla$prob.acum.x[11-i] * 100,"%")
## 40.17876 %
tabla$prob.acum.x[3+1]
## [1] 0.25993