Examen Parcial - Inferencia Estadística

En el frejol con pescado con ensalada y arroz (FPEA) se encuentran una serie de nutrientes, de los cuales en esta práctica se consideran los siguientes: En promedio 100 g de frejol con pescado con ensalada y arroz(FPEA) contiene 258 kcal de energia, 25.1 g de agua, 0.50 g de fibra dietaria, 23.8 g de carbohidratostotales, 4.0 g de proteinas, 16.3 g de grasa total y 0.4 g de cenizas.

Problema 1

El contenido de proteinas en el FPEA tiene distribuciön Normal(\(\mu\),\(\sigma^2\)). Si se toma una muestra aleatoria de tamaño n de esa distribucion.

1a.

Pregunta:

Diga a que converge casi seguramente la estadistica \(\frac{1}{n}\sum_{i=1}^{n}X_i^5\). Exprese su respuesta en funcion de \(\mu\) y \(\sigma^2\).

Desarrollo:

Dado que segun la pregunta, converge casi seguramente, entendemos que se refiere a la ley fuerte de los grandes números.

De la cual podemos extraer lo siguiente:

\[\frac{1}{n}\sum_{i=1}^{n}X_i^k\overset{c.s}{\rightarrow} E(X^k)\] Entonces, reemplazando tenemos lo siguiente:

\[\frac{1}{n}\sum_{i=1}^{n}X_i^5\overset{c.s}{\rightarrow} E(X^5)\] Ahora para expresar lo que nos solicitan, es necesario utilizar la funcion generadora de momentos de la distribución normal.

\[\psi_X(t)=e^{\mu t+\frac{\sigma^2t^2}{2}}\] \[\frac{d^r\psi_X(t)}{dt^r}\mid_{t=0}=\psi^r_X(0)=\mu_r=E(X^r),r=1,2,3,..\] \[E(X^5)=\mu^5+10\mu^3\sigma^2+15\mu\sigma^4\]

Finalmente, nos quedamos con la siguiente expresión:

\[\frac{1}{n}\sum_{i=1}^{n}X_i^5\overset{c.s}{\rightarrow}\mu^5+10\mu^3\sigma^2+15\mu\sigma^4\]

1b.

Pregunta:

Asuma que el contenido de proteinasen FPEA tiene distribución Normal (\(\mu=4\),\(\sigma^2=1\)) y con una semilla de 24 presente un gráfico que describa la pregunta.

Desarrollo:

Utilizamos los datos brindados de media y sigma cuadrado.

mu <- 4 #media poblacional
sd <- 1 #Desviacion estandar poblacional

Establecemos un tamaño considerablemente grande

Tam_m <- 5000 #Tamaño de muestra

Utilizamos la expresión de la pregunta 1a para determinar a que valor converge \(E(X^5)\)

# Converge a:
con<-mu**5+10*mu**3*sd**2+15*mu*sd**4

Extraemos nuestra muestra de interes con la semilla indicada

set.seed(24) #Semilla
pob <- rnorm(Tam_m,mu,sd)

x <- 1:length(pob) 
y<-c() #Generamos un vector vacio para guardar los valores de y
n_mean<-c() #Generamos un vector vacio para guardar los valores de E(x^5)
for (i in x) {y[i] = pob[i]^5} #Generamos los valores de x^5
acum=cumsum(y) #Hallamos la acumulada
for(i in x){n_mean[i] = acum[i]/i} #Generamos la E(X^5) que ira convergiendo mientra el tamaño de la muestra vaya creciendo

df=data.frame(x,n_mean) #Generamos un data frame con las variables de interes para su posterior uso

Graficamos

library(ggplot2)
ggplot(df)+
  geom_line(aes(x,n_mean),color="blue")+
  geom_hline(yintercept = con, color="red")+
  xlab("Cantidad de muestra")+
  ylab("Valores de E(X^5)")+
  ggtitle("Aproximacion a la E(X^5) con media 4 y sigma = 1",
          "E(X^4) Converge casi seguro a 1724")

Observamos, el valor se aproxima al resultado que habiamos obtenido en la pregunta numero 1a.

Problema 2

2a.

Pregunta:

Presente un gräfico de la distribución del octavo estadístico de orden.

Desarrollo:

Creamos la función para determinar la estadística de orden de la muestra aleatoria de la distribucion poisson.

Sus argumentos son los siguientes:

k = orden del estadistico
x = valor de la v.a. poisson
N = tamaño de la muestra
lambda = el lambda de la v.a poisson

pmf.yk.pois=function(k,x,N,lambda) {
  pbeta((ppois(x,lambda)),k,N-k+1)-
    pbeta((ppois(x,lambda)-dpois(x,lambda)),k,N-k+1)
}

Hallamos lo solicitado por la pregunta.

k=8;N=24;lambda=5

x=0:10 #Rango
y=numeric(length(x)) #Creamos una variable "y" lleno de 0 con la misma cantidad de valores de x

for(i in 0:10) {y[i+1]=pmf.yk.pois(8,i,N,lambda)} #Llenamos los valores de y con la funcion que creamos e iterando con la funcion for

plot(x,y,type='h',lwd=3,xlab='Salida',
     main='Octavo Estadistico de Orden para una m.a de tamaño 24') #Graficamos

2b.

Pregunta: Si el octavo de la muestra tieneun valor mayor de 3, halle la probabilidad de que el octavo de la muestra sea menor de 7.

Desarrollo

Creamos otra función acorde a lo solicitado, con los siguientes argumentos:

N = tamaño de la muestra
x = valor de la variable aleatoria
k = orden del estadistico
lambda = lambda de la v.a poisson

Con la siguiente interpretación:

\[P(Y_k\leq x);\ para\ una\ muestra\ de\ tamaño\ N.\]

library(pacman)
ord.ppois = function(x,N,k,lambda){
  v1=ppois(x,lambda)-dpois(x,lambda)
  v2=dpois(x,lambda)
  v3=1-ppois(x,lambda)
  i=(0:N-k)
  p_load(combinat)
  return(sum(nCm(N,i)*v3^i*(v1+v2)^(N-i)))
}

Formulamos la probabilidad condicional:

\[P(Y_8 < 7 | Y_8 > 3) = \frac{P(Y_8<7 \cap Y_8>3)}{(1-P(Y_8\leq3))} = \] \[P(Y_8 < 7 | Y_8 > 3) = \frac{(P(Y_8\leq6)-P(Y_8\leq3))}{(1-P(Y_8\leq3))}\] En codigo:

N=24;k=8;x=6;lambda=5
a=ord.ppois(x,N,k,lambda) #P(Y_8<=6)

N=24;k=8;x=3;lambda=5
b=ord.ppois(x,N,k,lambda) #P(Y_8<=3)

resultado = (a-b)/(1-b)
resultado

## [1] 0.9999979

Problema 3

El contenido de carbohidrato totales tiene distribución Pareto(\(\alpha\),\(\beta\)). Halle la estadistica suficiente bidimensional de \(\theta\)= (\(\alpha\),\(\beta\)).

Si \(X_1,X_2,...,X_n\) es una muestra aleatoria de \(f(x;\alpha,\beta)=\frac{\beta \alpha^\beta}{x^{\beta+1}}I_{(0,\infty)}\)

\(f(X_1,X_2,X_3,...,\theta)=\prod_{i=1}^{n}\frac{\beta \alpha^\beta}{x_i^{\beta+1}}I_{(0,\infty)}=\)

\(\underbrace{(\beta \alpha^{\alpha})^n(\prod_{i=1}^{n} x_i)^{-\beta}}_{g}\underbrace{\prod_{i=1}^{n} (x_i)^{-1}}_{h}\)

Examen Parcial - Inferencia Estadística

Giancarlo Kuway Chero

2022-08-26

Problema 1

1a.

1b.

Problema 2

2a.

2b.

Problema 3