2. Distribucion Poisson

2a. Graficar la función de probabilidad de X usando R, para distintos valores del parámetro, es decir lambda =5, 10, 20 y 30. Describir los gráficos y compararlos.

lambda_values = c(5,10,20,30)

x_values = 0:50

poisson_prob <- function(lambda){
  dpois(x_values,lambda)
}

prob_values = sapply(lambda_values,poisson_prob)

colores = c("black","blue","green","red")

### Graficos

plot(x_values,prob_values[,1],type="h",lwd=2,ylim=c(0,0.3),ylab="P(X=x)",col=colores[1],
     main="Función de Probabilidad de Poisson para distintos valores de lambda")

for(i in c(2:4)){
lines(x_values,prob_values[,i],type="h",lwd=2,ylim=c(0,0.3),col=colores[i])
}

legend("topright",legend=lambda_values,col=colores,lwd=2)

A medida que lambda aumenta, la distribución se vuelve más concentrada alrededor de su media y más simétrica. La probabilidad de obtener un número alto de eventos disminuye y la probabilidad de obtener valores cercanos al promedio aumenta.

2b. Calcular la probabilidad de que la variable aleatoria X tome valores a lo sumo de: 5 (para lambda 5), 10 (para lambda 10), 20 (para lambda 20) y 30 (para lambda 30). Interpretar resultados y compararlos.

lambda = c(5,10,20,30)
x_max = c(5,10,20,30)

for(i in 1:4){
cat(paste("La probabilidad para un lambda de",lambda[i]," para un x menor o igual a",x_max[i],"\n"))
print(ppois(x_max[i],lambda[i]) * 100)
}
## La probabilidad para un lambda de 5  para un x menor o igual a 5 
## [1] 61.59607
## La probabilidad para un lambda de 10  para un x menor o igual a 10 
## [1] 58.30398
## La probabilidad para un lambda de 20  para un x menor o igual a 20 
## [1] 55.90926
## La probabilidad para un lambda de 30  para un x menor o igual a 30 
## [1] 54.83515

2c. La esperanza matemática y la varianza de X es de 20 cuando la lambda es de 20. Generar 100 muestras aleatorias de tamaño n=1000 de una población X de lambda =20. Por cada muestra aleatoria, calcular la media muestral, varianza muestral y porcentaje de valores en la muestra menores o iguales 20. Para estos resultados:

n_samples = 100
sample_size = 1000
lambda = 20

sample_mean = rep(NA,n_samples)
sample_variance = rep(NA,n_samples)
sample_probability = rep(NA,n_samples)

for(i in 1:n_samples){
  
  sample <- rpois(sample_size,lambda)
  
  sample_mean[i]<-mean(sample)
  sample_variance[i]<-var(sample)
  sample_probability[i]<- mean(sample <= 20)
  
}

2cI. Grafico de la media

promedio_teorico = rep(lambda,n_samples)

plot(x=1:n_samples,y=sample_mean,ylim=c(18,22),xlab="Indice de la muestra",ylab="Medias muestrales",
     main="Gráfico de dispersión de las medias muestrales")

abline(h=promedio_teorico,lty=2,col="red")

Como se ve en el gráfico las medias muestrales se centran alrededor de la media teórica de 20 debido a la ley de los grandes números, que establece que a medida que aumenta el tamaño de la muestra, la media muestral tiende a converger hacia la media poblacional.

2cII. Grafico de la varianza

varianza_teorica = rep(lambda,n_samples)

plot(x=1:n_samples,y=sample_variance,ylim=c(15,25),xlab="Indice de la muestra",ylab="Varianzas muestrales",
     main="Gráfico de dispersión de las varianzas muestrales")

abline(h=varianza_teorica,lty=2,col="red")

Al observar el gráfico, podemos ver que las varianzas muestrales varían alrededor del valor teórico de 20. Esto indica que las varianzas muestrales son representativas de la varianza poblacional.

2cIII. Probabilidad

lambda = 20
x_max =20

prob_teorica = ppois(x_max,lambda) * 100

plot(x=1:n_samples,y=sample_probability * 100,ylim=c(40,80),xlab="Indice de la muestra",ylab="Probabilidades muestrales",
     main="Gráfico de dispersión de las Probabilidades muestrales de que X<=20")

abline(h=prob_teorica,lty=2,col="red")

Al analizar el gráfico de dispersión de las probabilidades muestrales, podemos notar que la mayoría de los porcentajes se encuentran alrededor del valor teórico de probabilidad, representado por la línea roja punteada. Esto sugiere que las muestras aleatorias captan adecuadamente la distribución y las características de la población en términos de ocurrencias menores o iguales a 20.

2d. Graficos de 10 muestras aleatorias

n_graficos = 10

par(mfrow=c(4,3))

for(i in 1:n_graficos){
  
  sample <- rpois(sample_size,lambda)
  
  barplot(table(sample)*100/sum(table(sample)),ylim=c(0,50),main=paste("Muestra",i))
  
  # Teorico
  
  x <- 0:max(sample)
  y <- dpois(x,lambda) * 100
  lines(x,y,type="h",lwd=2,col="red")
  
}

mtext("Comparacion distribucion empirica (negro) vs teorica (rojo) de 10 muestras",                   # Add main title
      side = 3,
      line = -1,
      outer = TRUE)

par(mfrow=c(1,1))

Al Generar 100 muestras aleatorias de tamaño 1000 de una población X con lambda igual a 20 que representan diferentes experimentos, calculamos la media muestral, la varianza muestral y el porcentaje de valores en cada muestra que son menores o iguales a 20. Estos valores nos permiten tener una idea de la distribución de los datos en cada muestra y cómo se comparan con los valores teóricos esperados para una distribución de Poisson con lambda igual a 20. Cada gráfico muestra la proporción de ocurrencia de cada valor en la muestra. Además, se compara con la distribución teórica de Poisson con lambda igual a 20 en color rojo.

Al observar los gráficos, podemos notar que las distribuciones empíricas de las muestras se asemejan a la distribución teórica de Poisson con lambda igual a 20. Sin embargo, debido a la variabilidad de las muestras, dado que son aleatorias, algunas muestras pueden tener ligeras desviaciones de la distribución teórica.

3. muestras aleatorias de diferentes tamaños —–

lambda = 20

muestra_tamanos <- c(2,5,10,20,30,50,100,200,300,400,500,1000)

porcentajes <- rep(NA,length(muestra_tamanos))

for(i in 1:length(muestra_tamanos)){
  
  sample <- rpois(muestra_tamanos[i],lambda)
  porcentajes[i] <- mean(sample <= 20) * 100 
  
}

prob_menor_igual_20 = ppois(20,lambda) * 100

plot(1:length(muestra_tamanos),porcentajes,ylim=c(0,100),pch=16,xlab="Muestra",
     ylab="Porcentaje de valores <= 20")

abline(h=prob_menor_igual_20,lty=2,col="red")

Al analizar el gráfico, podemos observar cómo el porcentaje de valores menores o iguales a 20 en las muestras varía a medida que aumenta el tamaño de la muestra, el porcentaje tiende a acercarse al valor teórico esperado. Esto demuestra la ley de los números grandes