En el frejol con pescado con ensalada y arroz (FPEA) se encuentran una serie de nutrientes, de los cuales en esta práctica se consideran los siguientes: En promedio 100 g de frejol con pescado con ensalada y arroz(FPEA) contiene 258 kcal de energia, 25.1 g de agua, 0.50 g de fibra dietaria, 23.8 g de carbohidratostotales, 4.0 g de proteinas, 16.3 g de grasa total y 0.4 g de cenizas.
El contenido de proteinas en el FPEA tiene distribuciön Normal(\(\mu\),\(\sigma^2\)). Si se toma una muestra aleatoria de tamaño n de esa distribucion.
Pregunta:
Diga a que converge casi seguramente la estadistica \(\frac{1}{n}\sum_{i=1}^{n}X_i^5\). Exprese su respuesta en funcion de \(\mu\) y \(\sigma^2\).
Desarrollo:
Dado que segun la pregunta, converge casi seguramente, entendemos que se refiere a la ley fuerte de los grandes números.
De la cual podemos extraer lo siguiente:
\[\frac{1}{n}\sum_{i=1}^{n}X_i^k\overset{c.s}{\rightarrow} E(X^k)\] Entonces, reemplazando tenemos lo siguiente:
\[\frac{1}{n}\sum_{i=1}^{n}X_i^5\overset{c.s}{\rightarrow} E(X^5)\] Ahora para expresar lo que nos solicitan, es necesario utilizar la funcion generadora de momentos de la distribución normal.
\[\psi_X(t)=e^{\mu t+\frac{\sigma^2t^2}{2}}\] \[\frac{d^r\psi_X(t)}{dt^r}\mid_{t=0}=\psi^r_X(0)=\mu_r=E(X^r),r=1,2,3,..\] \[E(X^5)=\mu^5+10\mu^3\sigma^2+15\mu\sigma^4\]
Finalmente, nos quedamos con la siguiente expresión:
\[\frac{1}{n}\sum_{i=1}^{n}X_i^5\overset{c.s}{\rightarrow}\mu^5+10\mu^3\sigma^2+15\mu\sigma^4\]
Pregunta:
Asuma que el contenido de proteinasen FPEA tiene distribución Normal (\(\mu=4\),\(\sigma^2=1\)) y con una semilla de 24 presente un gráfico que describa la pregunta.
Desarrollo:
Utilizamos los datos brindados de media y sigma cuadrado.
mu <- 4 #media poblacional
sd <- 1 #Desviacion estandar poblacional
Establecemos un tamaño considerablemente grande
Tam_m <- 5000 #Tamaño de muestra
Utilizamos la expresión de la pregunta 1a para determinar a que valor converge \(E(X^5)\)
# Converge a:
con<-mu**5+10*mu**3*sd**2+15*mu*sd**4
Extraemos nuestra muestra de interes con la semilla indicada
set.seed(24) #Semilla
pob <- rnorm(Tam_m,mu,sd)
x <- 1:length(pob)
y<-c() #Generamos un vector vacio para guardar los valores de y
n_mean<-c() #Generamos un vector vacio para guardar los valores de E(x^5)
for (i in x) {y[i] = pob[i]^5} #Generamos los valores de x^5
acum=cumsum(y) #Hallamos la acumulada
for(i in x){n_mean[i] = acum[i]/i} #Generamos la E(X^5) que ira convergiendo mientra el tamaño de la muestra vaya creciendo
df=data.frame(x,n_mean) #Generamos un data frame con las variables de interes para su posterior uso
Graficamos
library(ggplot2)
ggplot(df)+
geom_line(aes(x,n_mean),color="blue")+
geom_hline(yintercept = con, color="red")+
xlab("Cantidad de muestra")+
ylab("Valores de E(X^5)")+
ggtitle("Aproximacion a la E(X^5) con media 4 y sigma = 1",
"E(X^4) Converge casi seguro a 1724")
Observamos, el valor se aproxima al resultado que habiamos obtenido en la pregunta numero 1a.
Pregunta:
Presente un gräfico de la distribución del octavo estadístico de orden.
Desarrollo:
Creamos la función para determinar la estadística de orden de la muestra aleatoria de la distribucion poisson.
Sus argumentos son los siguientes:
pmf.yk.pois=function(k,x,N,lambda) {
pbeta((ppois(x,lambda)),k,N-k+1)-
pbeta((ppois(x,lambda)-dpois(x,lambda)),k,N-k+1)
}
Hallamos lo solicitado por la pregunta.
k=8;N=24;lambda=5
x=0:10 #Rango
y=numeric(length(x)) #Creamos una variable "y" lleno de 0 con la misma cantidad de valores de x
for(i in 0:10) {y[i+1]=pmf.yk.pois(8,i,N,lambda)} #Llenamos los valores de y con la funcion que creamos e iterando con la funcion for
plot(x,y,type='h',lwd=3,xlab='Salida',
main='Octavo Estadistico de Orden para una m.a de tamaño 24') #Graficamos
Pregunta: Si el octavo de la muestra tieneun valor mayor de 3, halle la probabilidad de que el octavo de la muestra sea menor de 7.
Desarrollo
Creamos otra función acorde a lo solicitado, con los siguientes argumentos:
Con la siguiente interpretación:
\[P(Y_k\leq x);\ para\ una\ muestra\ de\ tamaño\ N.\]
library(pacman)
ord.ppois = function(x,N,k,lambda){
v1=ppois(x,lambda)-dpois(x,lambda)
v2=dpois(x,lambda)
v3=1-ppois(x,lambda)
i=(0:N-k)
p_load(combinat)
return(sum(nCm(N,i)*v3^i*(v1+v2)^(N-i)))
}
Formulamos la probabilidad condicional:
\[P(Y_8 < 7 | Y_8 > 3) = \frac{P(Y_8<7 \cap Y_8>3)}{(1-P(Y_8\leq3))} = \] \[P(Y_8 < 7 | Y_8 > 3) = \frac{(P(Y_8\leq6)-P(Y_8\leq3))}{(1-P(Y_8\leq3))}\] En codigo:
N=24;k=8;x=6;lambda=5
a=ord.ppois(x,N,k,lambda) #P(Y_8<=6)
N=24;k=8;x=3;lambda=5
b=ord.ppois(x,N,k,lambda) #P(Y_8<=3)
resultado = (a-b)/(1-b)
resultado
## [1] 0.9999979
El contenido de carbohidrato totales tiene distribución Pareto(\(\alpha\),\(\beta\)). Halle la estadistica suficiente bidimensional de \(\theta\)= (\(\alpha\),\(\beta\)).
Si \(X_1,X_2,...,X_n\) es una muestra aleatoria de \(f(x;\alpha,\beta)=\frac{\beta \alpha^\beta}{x^{\beta+1}}I_{(0,\infty)}\)
\(f(X_1,X_2,X_3,...,\theta)=\prod_{i=1}^{n}\frac{\beta \alpha^\beta}{x_i^{\beta+1}}I_{(0,\infty)}=\)
\(\underbrace{(\beta \alpha^{\alpha})^n(\prod_{i=1}^{n} x_i)^{-\beta}}_{g}\underbrace{\prod_{i=1}^{n} (x_i)^{-1}}_{h}\)