Analizando la función potencia de la distribución Poisson
Dado que nos piden una distribución que no sea ni Normal y Binomial, en esta oportunidad estamos escogiendo la distribución Poisson que es ideal si se quiere modelar conteos en un intervalo de tiempo continuo.
Sea \(X_{1},X_2, X_n\) una muestra aleatoria de tamaño n; por lo tanto la función de densidad para la variable i tiene la siguiente forma.
\(f_({x_i,\lambda}) = \frac{e^{-\lambda} \lambda^{x_i}}{x_{i}!}I_{(0,\infty)}(x)\)
Le damos la forma de la familia exponencial para hallar el estadístico mínimal y suficiente.
\(f_({x_{i},\lambda}) = e^{-\lambda}\frac{1}{x_{i}!}e(^{log\lambda x_{i}})\)
por la familia exponencial d(x) = \(x_i\), por lo tanto \(\sum d(x)\) es el estadístico minimal y sufiente, como la muestra aleatoria tiene propieda de i.i.d, \(X_i\) son igualmente distribuídas, por ese motivo la función de densidad de la estadistica suficiente y minimal es
\[\sum x_i = Y \sim Pois(n\lambda)\]
Sea \(\phi\) una prueba de hipótesis nula \(H_0\), definida por \[ \phi(x_i)= \begin{cases} 1, & \text{si } x_i \in C,\\ 0, & \text{si } x_i \notin C \end{cases} \]
Donde:
H0 : \(\lambda = \lambda_0\)
H1: \(\lambda > \lambda_0\)
La función potencia de la prueba \(\phi\) se define como una función del parámetro desconocido \(\lambda = \theta\) definida como:
\(\prod_{\phi} = P_{\theta}(R.H0)\)
Región crítica
RC = {\(\sum x_i > k\)}
Tenemos que hallar el valor crítico k, asumimos que H0 es verdadera; por lo tanto:
\(\prod_{\phi}(\theta) \leq \alpha\)
\(P(Y>k|\lambda = \lambda0) \leq \alpha\)
sabemos que :
\(1-\prod_{\phi} = P(NR.H0)\), entonces
\(1-P(NR.H0) = \prod_{\phi}\)
Reemplazando:
\(\prod_{\phi} = 1 - P(Y \leq k|n\lambda)\)
\(\prod_{\phi} = 1 - \sum_{y=0}^{k} \frac{e^{-n\lambda}(n\lambda)^y}{y!}\)
Hemos definido la función potencia de la prueba \(\phi\), ahora para graficar esa función colocaremos valores al parámetro y tamaño de prueba
Nota: también se puede determinar el tamaño de prueba colocándolo como parámetro desconocido, pero en esta oportunidad; pondremos un caso real con valores ya establecidos.
CASO : Control de plagas en invernaderos Experimentales
El Programa de Sanidad Vegetal de la UNALM realiza monitoreos continuos sobre la presencia de Bemisia tabaci (mosca blanca) en los cultivos de arándanos experimentales. Se sabe que, bajo condiciones estables y de control adecuado, la aparición de estos insectos en las trampas de monitoreo ocurre de manera aleatoria e independiente, registrándose históricamente una tasa promedio de 2 especímenes por trampa adhesiva expuesta durante 24 horas.
Ante la sospecha de un brote debido al aumento de temperaturas recientes, el equipo de ingenieros instaló una muestra aleatoria de 25 trampas dispersas uniformemente por el invernadero. El objetivo del estudio es determinar si existe evidencia estadística suficiente para afirmar que la densidad promedio de la plaga ha aumentado respecto a su nivel histórico.
Para la toma de decisión, se registrará el conteo total de insectos capturados en todas las trampas y se utilizará un nivel de significancia del 5% para controlar el riesgo de emitir una falsa alerta sanitaria.
Variable aleatoria : Número de especímenes de una plaga específica encontrados por trampa adhesiva en un día.
\(\lambda_0 = 2\)
n = 25
H0 : \(\lambda \leq 2\)
H1 : \(\lambda > 2\), no nos preocupa si disminuye, solo nos preocupa si el promedio de infestación aumenta
El estadístico suficiente (Y) : Es el conteo total de insectos atrapados de las 25 trampas.
n = 25;lambda0 = 2
alpha = 0.05
#parametros de la estadistica suficiente Y
param_Y = n*lambda0
k = qpois(1-alpha, param_Y)
alpha_real = 1-ppois(k,param_Y)
#RC
#valores alrededor de la media
x_vals = (param_Y - 20):(param_Y+30)
probs <- dpois(x_vals, param_Y)
colores = ifelse(x_vals > k, "red","blue") # phi(y) = 1 > k
barplot(probs,x_vals, col = colores)#se puede ver que el k = 62Vemos la región de rechazo para la estadística suficiente Y, ahora veremos la función potencia
# Función potencia
#pi(lambda) = P(Y > c | lambda_real)
funcion_potencia <- function(param_Y) {
1 - ppois(k, n * param_Y)
}
# generamos 200 numeros entre 1.5 y 4
seq_lambda = seq(1.5,4, length.out=200)
valores = funcion_potencia(seq_lambda)
plot(seq_lambda,valores,xlab='lambda',
ylab='Poder de la Prueba',main='Poder vs Probabilidades',
col='green',type='l',lwd=2)
abline(h = alpha,v = lambda0, col = "red", lty = 2) Se puede ver que el estadístico es suficiente y consistente, se puede observar que la prueba es confiable, ya que asegura una baja probabilidad de error cuando el proceso está bajo control (\(\lambda=2\)) y una certeza total de rechazo cuando \(\lambda > 3.5\) aproximadamente.
## [1] 62
Función potencia quedaría de la siguiente forma
\[ \phi(x_i)= \begin{cases} 1, & \text{si } \sum x_i > 62,\\ 0, & \text{si } \sum x_i \leq 62 \end{cases} \]