Distribución de Probabilidad Discreta CASO. Niños lectura en USA

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

#Distribución de Probabilidad Discreta CASO. Niños lectura en USA
#Variables aleatorias discretas
#Descripcion:
#Determinar distribución de la probabilidad para variables aleatorias discertas, generar tabla de distribución y visualizar gráficas de barra y acumulada, determinar estadísticos: media, variaza y desviación así como realizar cálculos de probabilidad.

#Caso:
#En Estados Unidos 38% de los niños de cuarto grado no pueden leer un libro adecuado a su edad.

#La tabla siguiente muestra, de acuerdo con las edades, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.

#Edad   Número de niños
#6  37369
#7  87436
#8  160840
#9  239719
#10 286719
#11 306533
#12 310787
#13 302604
#14 289168

#Si desea tomar una muestra de niños que tienen problemas de lectura para que participen en un programa que mejora las habilidades de lectura. Sea x la variable aleatoria que indica la edad de un niño tomado en forma aleatoria.

#Con estos datos elabore una distribución de probabilidad para x. Especifique los valores de la variable aleatoria y los correspondientes valores de la función de probabilidad p(x)

#Objetivos:
#1.Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 4,5 años?
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 6,7 años?
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 8,9 años?
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 10,11 años?
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 12,13 años?
#*¿Cuál es la probabilidad de que la muestra identifique a niños de 14 años?
#2.Determinar valor esperado ∑xp(x)
#3.Determinar la probabilidad acumulada F(X) de x (6 a 14)
#4.Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)
#5.Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
#6.Visualizar la gráfica de la probabilidad acumulada F(x)
#7.Determinar varianza σ2=∑(x−μ)2p(x)
#8.Determinar desviación std σ=σ2−−√

#Cálculo de probabilidades

#9.¿Cual es la probabilidad para seleccionar un niño de siete años o menor?
#10.¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?
#11.¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?
#12.¿Cuál es la probabilidad de seleccionar un niño menor que once años?
#13.¿Cuál es la probabilidad de seleccionar un niño de exactamente la edad de nueve?

#Librerías necesarias
library(gtools) # Para combinations() y permutations()

## Warning: package 'gtools' was built under R version 3.6.3

library(knitr)  # Para kable()

#1. Identificar los valores de x (variable aleatoria) y de probabilidad de x en la tabla de distribución mediante fecuencia relativa desde 6 hasta 14

x <- c(6,7,8,9,10,11,12,13,14)
ninios <- c(37369, 87436, 160840, 239719, 286719, 306533, 310787, 302604, 289168)
n = sum(ninios)

prob.x <- ninios/ n

x

## [1]  6  7  8  9 10 11 12 13 14

prob.x

## [1] 0.01848875 0.04325998 0.07957747 0.11860378 0.14185758 0.15166079 0.15376551
## [8] 0.14971687 0.14306925

#2. Determinar valor esperado ∑xp(x)
v.e <- sum(x * prob.x)
v.e

## [1] 10.99913

#3. Determinar la probabilidad acumulada F(X) de x (6 a 14)
#*El valor de la posición de un vetor en R empieza en 1
#*El valor de la variable aleatoria empieza en 6
#*Entonces será la posición 1 del vector prob.acum.x será para el valor de la variable x=6
#*La posición 9 del vector prob.acum.x será para el valor de la variable x=14
prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
                 sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
                 sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))
prob.acum.x

## [1] 0.01848875 0.06174874 0.14132621 0.25992999 0.40178757 0.55344837 0.70721387
## [8] 0.85693075 1.00000000

#4. Determinar y visualizar la tabla de distribución de probabilidad con columnas de x, p(x), F(x) o probabilidad acumulada o función de la distribución acumulativa, xp(x), (x−μ)2, (x−μ)2p(x)
#pos    x   p(x)    F(x)    xp(x)   (x−μ)2) (x−μ)2p(x)

tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")

kable(tabla)

pos	x	prob.x	prob.acum.x	x.prob.x	x-v.e^2	x-v.e^2prob.x
1	6	0.0184888	0.0184888	0.1109325	24.9912583	0.4620571
2	7	0.0432600	0.0617487	0.3028199	15.9930068	0.6918572
3	8	0.0795775	0.1413262	0.6366198	8.9947553	0.7157799
4	9	0.1186038	0.2599300	1.0674340	3.9965038	0.4740005
5	10	0.1418576	0.4017876	1.4185758	0.9982523	0.1416097
6	11	0.1516608	0.5534484	1.6682687	0.0000008	0.0000001
7	12	0.1537655	0.7072139	1.8451861	1.0017493	0.1540345
8	13	0.1497169	0.8569307	1.9463193	4.0034977	0.5993912
9	14	0.1430693	1.0000000	2.0029696	9.0052462	1.2883739

#5. Visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad
barplot(height = tabla$prob.x, names.arg = tabla$x)

#6. Visualizar la gráfica de la probabilidad acumulada F(x)
plot(x,prob.acum.x, type = 'b')

#7. Determinar varianza σ2=∑(x−μ)2p(x)
var <- sum((x - v.e) ^ 2 * prob.x)
var

## [1] 4.527104

#8. Determinar desviación std σ=σ2−−√
desv.std <- sqrt(var)
desv.std

## [1] 2.127699

#Cálculo de probabilidades
#A partir de la tabla de distribuciónde proabilidad…

#Posi   x   p(x)    F(x)
kable(tabla[,1:4]) # Solo las cuatro primeras columnas que interesan

pos	x	prob.x	prob.acum.x
1	6	0.0184888	0.0184888
2	7	0.0432600	0.0617487
3	8	0.0795775	0.1413262
4	9	0.1186038	0.2599300
5	10	0.1418576	0.4017876
6	11	0.1516608	0.5534484
7	12	0.1537655	0.7072139
8	13	0.1497169	0.8569307
9	14	0.1430693	1.0000000

#9. ¿Cual es la probabilidad para seleccionar un niño de siete años o menor?
#p(x≤7)
#entonces:
#∑p(x=6),p(x=7)=p(6)+p(7)

#F(x=7)

#Se identifica la prob.acum.x[7-5] para identificar la fila 2 de la columna
#A través de variable i para identificar la diferencia entre el valor inciial de la variable discreta y la posición de la primera fila…
#Se utiliza cat para desplegar dos valores concatentando “%”

i=5 # o sea min(tabla$) - 1  
#
i = min(tabla$x) - 1 # Todas las filas y/o vectores en R empiezan en 1
i

## [1] 5

#*Ahora se utiliza i
tabla$prob.acum.x[7-i]

## [1] 0.06174874

cat(tabla$prob.acum.x[7-i] * 100,"%")

## 6.174874 %

#10. ¿Cuál es la probabilidad para seleccionar un niño de más de ocho años ?
#$p(x>8)
#igual a:
#1−p(x≤8)
#entonces:
#1−(∑p(x=6),p(x=7),p(x=8))=1−(p(6)+p(7)+p(8))
#igual a:
#1−F(x=8)

1 - tabla$prob.acum.x[8-i]

## [1] 0.8586738

#11. ¿Cuál es la probabilidad para seleccionar un niño entre nueve y once años?
#p(9≤x≤11)
#igual:
#p(x≤11)−p(x≤8)
#entonces:
#p(x≤11)=∑p(6),p(7)...p(11)=p(6)+p(7)+p(8)+p(9)+p(10)+p(11)
#p(x≤8)=∑p(6),p(7)...p(8)=p(6)+p(7)+p(8)
#de tal forma que:
#F(11)−F(8)
tabla$prob.acum.x[11-i] - tabla$prob.acum.x[6-i]

## [1] 0.5349596

#12. ¿Cuál es la probabilida de seleccionar un niño menor que once años?
#Demostrar que es 0.4017876
tabla$prob.acum.x[10-i]

## [1] 0.4017876

#13. ¿Cuál es la probabildiad de seleccionar un niño de exactamente la edad de nueve?
#Demostrar que es 0.25993
tabla$prob.acum.x[9-i]

## [1] 0.25993

Distribución de Probabilidad Discreta CASO. Niños lectura en USA

Vergara hernandez jesus alejandro - Num control:16040461

29/5/2020

R Markdown

Including Plots