GET00130 - Métodos Computacionais para Estatística II

Conteúdo da aula

Erro Tipo II,
Função poder do teste.

Erro Tipo II para um teste unilateral à direita.

Considere uma amostra aleatória simples \(X_1, \ldots, X_n\) obtida de uma população normal com média \(\mu\) e variância \(\sigma^2 = 25\) conhecida.

Suponha que desejamos testar as seguintes hipóteses sobre \(\mu\), \[H_0: \mu = 500 \qquad \times \qquad H_1: \mu > 500.\]

O teste acima possui uma região crítica definida por\[ RC = \{\bar{x}: \bar{x} > k\}.\]

Se desejamos calcular o Erro tipo II (chamado de \(\beta\)) associado ao teste acima, devemos calcular

\[ \def\Xbar{\overline{X}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{align} \beta &= P(\mbox{Erro Tipo II}) \\ &= P(\mbox{Não Rejeitar } H_0 \mbox{ | } H_0 \mbox{ é falsa}) \\ &= P(\Xbar < k \mbox{ | } H_0 \mbox{ é falsa}) \end{align} \]

Para resolver a probabilidade acima é necessário conhecer \(k\), mas este só será conhecido se fixarmos um valor para \(\alpha\) = P(Erro Tipo I), por exemplo, vamos definí-lo como 0,05:

\[ \def\Xbar{\overline{X}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{align} \alpha &= P(\mbox{Erro Tipo I}) \\ &= P(\mbox{Rejeitar } H_0 \mbox{ | } H_0 \mbox{ é verdadeira}) \\ &= P(\Xbar \in \mbox{ RC | } H_0 \mbox{ é verdadeira}) \\ &= P\left(\Xbar > k \mbox{ | } \Xbar \sim N \left(500,\frac{25}{24} \right)\right) = 0,05 \end{align} \]

Deste modo é possível definir o valor de \(k\), basta encontrarmos o quantil da distribuição de \(\bar{X}\) que deixa uma área acima dele de \(0,05\).

Definido o valor de \(k\), podemos calcular \(\beta\)?

Note que só é possível calcularmos \(\beta\) se conhecermos a distribuição de probabilidade de \(\bar{X}\). A mesma só será conhecida se definirmos um valor para \(\mu\), então \(\beta\) é uma função de \(\mu\), logo, podemos escrever

\[ \def\Xbar{\overline{X}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{align} \beta(\mu) &= P(\mbox{Erro Tipo II}) \\ &= P(\mbox{Não Rejeitar } H_0 \mbox{ | } H_0 \mbox{ é falso}) \\ &= P(\mbox{Não Rejeitar } H_0 \mbox{ | } \mu) \\ &= P(\Xbar \not\in \mbox{ RC | } \mu) \\ &= P\left(\Xbar < k \mbox{ | } \Xbar \sim N \left(\mu,\frac{25}{24} \right)\right) \end{align} \] Com base nas equações desenvolvidas acima, podemos criar uma função que receberá como argumentos: tamanho da amostra, nível de significância, valor da média a ser testado, valor da variância populacional e \(\mu\) - o valor da média na qual será calculado o valor do erro tipo II.

#Criando uma função que calcula o erro tipo II para um teste de hipóteses
#unilateral a direita da média de uma população normal com variância conhecida
erroII.media = function(n,alfa,mu,mu0,sigma2){
  k = qnorm(1-alfa,mu0,sqrt(sigma2/n))
  beta = pnorm(k, mu, sqrt(sigma2/n))
  return(beta)
}

Suponha que foi observada uma amostra de 24 valores, qual será o erro tipo II do teste se \(\mu =\) 504?

#Calculando o erro tipo II para mu = 504
erroII.media(n = 24,
             alfa = 0.05, 
             mu = 504, 
             mu0 = 500,
             sigma2 = 25)

[1] 0.01147308

Notamos que a probabilidade de afirmarmos que a média é 500 quando na verdade ela é 504 é de aproximadamente 1,14%.

Como podemos obter esta probabilidade para diversos valores de \(\mu\), vamos plotar a função criada para valores de \(\mu\) de 495 a 510?

#Carregando pacote
library(tidyverse)

#Plotando a função do erro tipo II
ggplot(data = tibble(val = c(495,510)), aes(x = val)) +
  stat_function(fun = erroII.media,
                args = list(n = 24,
                            alfa = 0.05,
                            mu0 = 500,
                            sigma2 = 25)) +
  xlab(expression(mu)) +
  ylab(expression(beta(mu)))

Percebemos que quanto maior for o valor de \(\mu\), menor é a probabilidade do teste dizer que a média é 500. Mais do que isso, percebemos que esta probabilidade cai rapidamente para zero, um comportamento desejado das funções de erro tipo II.

Efeito do tamanho da amostra no erro tipo II

Se ao invés de obervarmos uma amostra de tamanho 24, nós tivessemos observados uma amostra de tamanho 50, qual seria o comportamento da função do erro tipo II, ele mudaria?

#Plotando a função do erro tipo II
ggplot(data = tibble(val = c(495,510)), aes(x = val)) +
  stat_function(aes(colour = "24"),
                fun = erroII.media,
                args = list(n = 24,
                            alfa = 0.05,
                            mu0 = 500,
                            sigma2 = 25)) +
  stat_function(aes(colour = "50"),
                fun = erroII.media,
                args = list(n = 50,
                            alfa = 0.05,
                            mu0 = 500,
                            sigma2 = 25)) +
  xlab(expression(mu)) +
  ylab(expression(beta(mu))) +
  scale_colour_manual("n", values = c("Black", "Red"))

O que percebemos ao analisar o gráfico acima, é que a probabilidade de cometermos o erro tipo II é influenciada pelo tamanho da amostra, de modo que para amostras maiores o erro tipo II tende a decair mais rapidamente para 0.

Poder do teste para um teste unilateral à direita.

Suponha que continuamos avaliando o mesmo cenário (teste unilateral à direita para a média de uma população normal com variância conhecida).

Uma função do erro tipo II bastante útil para a avaliação de um determinado teste de hipóteses é o poder do teste. Ele é obtido como o complementar do erro tipo II, no caso no qual estamos avaliando o poder seria dado por

\[ \def\Xbar{\overline{X}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{align} \pi(\mu) &= P(\mbox{Rejeitar } H_0 \mbox{ | } H_0 \mbox{ é falsa}) \\ &= 1 - P(\mbox{Não Rejeitar } H_0 \mbox{ | } \mu) \\ &= 1 - \beta(\mu). \end{align} \]

Veja que ao contrário do erro tipo II, o poder do teste é uma probabilidade de acerto, logo estamos interessados em calcular qual a probabilidade do teste rejeitar a hipótese nula (falar que a média é maior do que \(\mu_0\)) quando de fato é é maior do que \(\mu_0\). O poder é calculado como o complementar do erro tipo II.

Vamos modificar a função do erro tipo II e criar uma função poder.

#Criando a função poder do teste para um teste unilateral à direita 
#do teste de média com variância conhecida
poder.media = function(n,alfa,mu,mu0,sigma2){
  k = qnorm(1-alfa,mu0,sqrt(sigma2/n))
  poder = 1 - pnorm(k, mu, sqrt(sigma2/n))
  return(poder)
}

Suponha que foi observada uma amostra de 24 valores, qual será o poder do teste se \(\mu =\) 504?

#Calculando o poder do teste se mu = 504
poder.media(n = 24,
            alfa = 0.05, 
            mu = 504, 
            mu0 = 500,
            sigma2 = 25)

[1] 0.9885269

Notamos que a probabilidade de afirmarmos que a média é superior a 500 quando na verdade ela é 504 é de aproximadamente 99%.

Como podemos obter esta probabilidade para diversos valores de \(\mu\), vamos plotar a função criada para valores de \(\mu\) de 495 a 510?

#Carregando pacote
library(tidyverse)

#Plotando a função poder do teste
ggplot(data = tibble(val = c(495,510)), aes(x = val)) +
  stat_function(fun = poder.media,
                args = list(n = 24,
                            alfa = 0.05,
                            mu0 = 500,
                            sigma2 = 25)) +
  xlab(expression(mu)) +
  ylab(expression(pi(mu)))

Percebemos que quanto maior for o valor de \(\mu\), maior é a probabilidade do teste dizer que a média é superior a 500. Mais do que isso, percebemos que esta probabilidade cresce rapidamente para 1, um comportamento desejado da função poder.

Abaixo vamos calcular a probabilidade de rejeitarmos \(H_0\), ou seja, afirmar que a média é maior do que 500, quando na verdade ela é 500.

#Calculando o poder do teste se mu = 500
poder.media(n = 24,
            alfa = 0.05, 
            mu = 500, 
            mu0 = 500,
            sigma2 = 25)

[1] 0.05

O resultado, como esperado, é o erro tipo I que foi definido para o teste, neste caso 0,05.

Como a função poder é o complementar da função do erro tipo II, o tamanho da amostra também influencia o poder, de modo que amostras maiores terão poderes convergindo para 1 mais rapidamente.

Atividade: Crie as funções erro tipo II e poder do teste para um teste bilateral para a média de uma população normal com variância conhecida.