Más aplicaciones estadísticas en:

https://rpubs.com/orlandoan

Esta es una ilustración de la aplicación del teorema del límite central aplicado a una proporción.

Distribución muestral de una proporción.

Sea una población con una proporción \(P\) de éxitos y sea una muestra aleatoria de tamaño \(n\) de esa población. Al designar un fracaso en cada prueba binomial con el valor de 0 y un éxito con el valor de 1, el número de éxitos, x, se puede interpretar como la suma de \(n\) que consisten sólo de 0 y 1, y \(p\) es la media muestral de los \(n\) valores. Para \(n\) suficientemente grande \(p\) tiene aproximadamente una distribución normal con media \(\mu_{p}= P\) y varianza \(\sigma^{2}_{p}=\dfrac{PQ}{n}\)
La variable aleatoria

\[\begin{equation*} Z=\dfrac{p-P}{\sqrt{\frac{P(1-P)}{n}}} \end{equation*}\]

Tiene aproximadamente una distribución normal estándar.

Ilustración.

Sea una población donde 0 es fracaso y 1 es éxito.

z<-c(1,0,1,1,0,1,0,0,1,0,1,0,1,0,0,0,1,0,1,0,1,1,1,0,0,0,0,1,0,1,0,0,1,0,0,1,0,1,0,0,0,1,0,0,1,1,0,1,1,1,0,1,1,1,0,0,0,0,0,0,0,0,1,1,0,0,0,1,0,0,0,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,1,0,0,1,1,0,1,0,0,0,0,0,1,1,1,0,1,1,0,0,0,1,1,1,1,1,1,0,0,1,1,0,0,0,0,1,0,1,0,1,0,0,1,0,1,0,0,1,1,1,0,0,1,1,0,0,1,1,1,0,1,0,0,0,1,0,1,0,0,1,1,0,1,1,0,0,1,0,1,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,0,0,1,1,0,1,0,0,1,0,1,0,0,0,0,0,0,0,1,0,1,1,0,0,1,0,1,0,1,0,0,0,1,1,0,0,1,0,0,0,0,0,0,1,1,0,0,0,1,0,0,0,1,0,1,0,0,0,0,0,0,1,1,0,0,1,1,0,1,0,1,0,1,0,1,0,1,0,0,0,0,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,1,0,1,1,0,0,0,1,0,0,0,0,1,0,0,1,0,0,0,1,1,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,1,0,0,0,0,1,0,0,0,1,1,1,0,0,0,0,0,0,1,0,1,0,0,0,0,1,1,0,1,1,1,0,1,1,1,0,0,1,0,0,0,1,1,0,0,0,0,0,0,1,1,0,1,0,1,1,1,0,0,0,1,1,1,0,0,0,0,1,1,0,1,0,0,0,1,1,1,0,0,0,1,0,0,0,1,0,0,0,1,1,0,0,0,0,0,1,1,0,1,1,0,1,1,1,0,1,1,1,1,0,0,0,1,1,1,0,1,0,0,0,0,0,0,0,0,1,1,0,1,1,1,
1,0,0,1,1,0,0,1,0,1,0,1,0,0,1,0,0,0,1,0,1,0,0,1,1,1,0,0,1,0,0,0,0,1,1)

tamaño da la población.

N<-length(z);N
## [1] 500

Proporción de éxitos en la población.

P<-sum(z)/N;P
## [1] 0.384

Selección de 20000 muestras aleatorias de tamaños 50, 100 y 400 con reemplazamiento.

n50<-c() # muestras de tamaño 50
n100<-c() # muestras de tamaño 100
n400<-c() #muestras de tamaño 400
k =20000 # número de muestras
for(i in 1:k){
n50[i]=sum(sample(z,50,replace=TRUE))
n100[i]=sum(sample(z,100,replac=TRUE))
n400[i]=sum(sample(z,400,replace=TRUE))
}

Muestras de tamaño 50.

p1<-n50/50
P1<-mean(p1);P1
## [1] 0.384031
d1<-sqrt(P1*(1-P1)/50);d1
## [1] 0.06878244
hist(p1,prob=TRUE,col="yellow")
curve(dnorm(x,P1,d1),add=TRUE,col="red",lwd=2)

Normal estándar.

z1<-(p1-P)/(sqrt((P*(1-P))/50))
hist(z1,prob=TRUE,col="green",border="yellow")
curve(dnorm(x,0,1),add=TRUE,col="red",lwd=2)

Muestras de tamaño 100.

p2<-n100/100
P2<-mean(p2);P2
## [1] 0.383356
d2<-sqrt(P2*(1-P2)/100);d2
## [1] 0.04862038
hist(p2,prob=TRUE,col="yellow")
curve(dnorm(x,P2,d2),add=TRUE,col="red",lwd=2)

Normal estándar.

z2<-(p2-P)/(sqrt((P*(1-P))/100))
hist(z2,prob=TRUE,col="green",border="yellow")
curve(dnorm(x,0,1),add=TRUE,col="red",lwd=2)

Muestras de tamaño 400.

p3<-n400/400
P3<-mean(p3);P3
## [1] 0.3839556
d3<-sqrt(P3*(1-P3)/400);d3
## [1] 0.02431737
hist(p3,prob=TRUE,col="yellow")
curve(dnorm(x,P3,d3),add=TRUE,col="red",lwd=2)

Normal estándar.

z3<-(p3-P)/(sqrt((P*(1-P))/400))
hist(z3,prob=TRUE,col="green",border="yellow")
curve(dnorm(x,0,1),add=TRUE,col="red",lwd=2)

|-|-|-|

O.M.F.

|-|-|-|