Distribuição exata da estatística Ws

Considera-se para as simulações a seguir a veracidade da hipótese nula, qual seja:

\[\begin{equation} \begin{cases} H_0: F(x) = G(x), para \space todo \space x\\ H_1:F(x) \neq G(x), para \space algum \space x\\ \end{cases} \end{equation}\]

Em que \(G(x)\) representa a função de distribuição de \(Y\) e \(F(x)\) representa a função de distribuição de \(X\). Os tamanhos amostrais de \(Y\) e \(X\) serão representados por \(m\) e \(n\) respectivamente, de modo que o tamanho total das amostra é \(N = n + m\).

Dessa forma, há \(\binom{N}{m}\) possibilidades para os postos dos elementos de Y com probabilidade de ocorrência igual a \(\frac{1}{\binom{N}{M}}\).

Serão analisados os seguintes casos:

  1. n = 4 e m = 3;
  2. n = 3 e m = 4;

De tal sorte que há iguais possibilidades de postos para ambos os casos, sendo \(\binom{7}{3} = \binom{7}{4} = 35\)

A distribuição que se busca calcular é a soma dos postos de Y, ou seja \(Ws = \sum R(Y_j)\).


Caso a

Os possíveis postos para o caso a) e sua estatística W correspondente são expostos na tabela 1 a seguir:


Tabela 1: Possíveis postos para m = 3 e estatística W correspondente
Postos Probabilidade W n
{1,2,3} 0.03 6 1
{1,2,4} 0.03 7 1
{1,2,5} 0.06 8 2
{1,2,6} 0.09 9 3
{1,2,7} 0.11 10 4
{1,3,4} 0.06 8 2
{1,3,5} 0.09 9 3
{1,3,6} 0.11 10 4
{1,3,7} 0.11 11 4
{1,4,5} 0.11 10 4
{1,4,6} 0.11 11 4
{1,4,7} 0.14 12 5
{1,5,6} 0.14 12 5
{1,5,7} 0.11 13 4
{1,6,7} 0.11 14 4
{2,3,4} 0.09 9 3
{2,3,5} 0.11 10 4
{2,3,6} 0.11 11 4
{2,3,7} 0.14 12 5
{2,4,5} 0.11 11 4
{2,4,6} 0.14 12 5
{2,4,7} 0.11 13 4
{2,5,6} 0.11 13 4
{2,5,7} 0.11 14 4
{2,6,7} 0.09 15 3
{3,4,5} 0.14 12 5
{3,4,6} 0.11 13 4
{3,4,7} 0.11 14 4
{3,5,6} 0.11 14 4
{3,5,7} 0.09 15 3
{3,6,7} 0.06 16 2
{4,5,6} 0.09 15 3
{4,5,7} 0.06 16 2
{4,6,7} 0.03 17 1
{5,6,7} 0.03 18 1
Fonte: elaboração própria


A distribuição da estatística W no caso em que m = 3 está exposta na tabela 2 a seguir:


Tabela 2: Distribuição de frequências da estatística W para m = 3
W n Probabilidade
6 1 0.03
7 1 0.03
8 2 0.06
9 3 0.09
10 4 0.11
11 4 0.11
12 5 0.14
13 4 0.11
14 4 0.11
15 3 0.09
16 2 0.06
17 1 0.03
18 1 0.03
Fonte: elaboração própria


É possível observar que A estatística W varia de 6 a 18 e sua distribuição de probabilidades é simétrica com maior ocorrência em seu centro, de valor 0.14.

Em seguida, a Figura 1 expõe o histograma para a estatística W que, apesar das legendas ausentes no eixo das abscissas, varia de 6 a 18.


Figura 1: Distribuição de frequências da estatística W para m = 3

Figura 1: Distribuição de frequências da estatística W para m = 3


Caso b

Os possíveis postos para o caso b) e sua estatística W correspondente são expostos na tabela 3 a seguir:


Tabela 3: Possíveis postos para m = 3 e estatística W correspondente
Postos Probabilidade W n
{1,2,3,4} 0.03 10 1
{1,2,3,5} 0.03 11 1
{1,2,3,6} 0.06 12 2
{1,2,3,7} 0.09 13 3
{1,2,4,5} 0.06 12 2
{1,2,4,6} 0.09 13 3
{1,2,4,7} 0.11 14 4
{1,2,5,6} 0.11 14 4
{1,2,5,7} 0.11 15 4
{1,2,6,7} 0.14 16 5
{1,3,4,5} 0.09 13 3
{1,3,4,6} 0.11 14 4
{1,3,4,7} 0.11 15 4
{1,3,5,6} 0.11 15 4
{1,3,5,7} 0.14 16 5
{1,3,6,7} 0.11 17 4
{1,4,5,6} 0.14 16 5
{1,4,5,7} 0.11 17 4
{1,4,6,7} 0.11 18 4
{1,5,6,7} 0.09 19 3
{2,3,4,5} 0.11 14 4
{2,3,4,6} 0.11 15 4
{2,3,4,7} 0.14 16 5
{2,3,5,6} 0.14 16 5
{2,3,5,7} 0.11 17 4
{2,3,6,7} 0.11 18 4
{2,4,5,6} 0.11 17 4
{2,4,5,7} 0.11 18 4
{2,4,6,7} 0.09 19 3
{2,5,6,7} 0.06 20 2
{3,4,5,6} 0.11 18 4
{3,4,5,7} 0.09 19 3
{3,4,6,7} 0.06 20 2
{3,5,6,7} 0.03 21 1
{4,5,6,7} 0.03 22 1
Fonte: elaboração própria


A distribuição da estatística W no caso em que m = 4 está exposta na tabela 4 a seguir:


Tabela 4: Distribuição de frequências da estatística W para m = 4
W n Probabilidade
10 1 0.03
11 1 0.03
12 2 0.06
13 3 0.09
14 4 0.11
15 4 0.11
16 5 0.14
17 4 0.11
18 4 0.11
19 3 0.09
20 2 0.06
21 1 0.03
22 1 0.03
Fonte: elaboração própria


É possível observar que A estatística W varia de 10 a 22 e sua distribuição de probabilidades é simétrica com maior ocorrência em seu centro, de valor 0.14.

Em seguida, a Figura 2 expõe o histograma para a estatística W que, apesar das legendas ausentes no eixo das abscissas, varia de 10 a 22.


Figura 2: Distribuição de frequências da estatística W para m = 4

Figura 2: Distribuição de frequências da estatística W para m = 4


Distribuição da estatística U

Em uma última análise, foi aplicada a transformação U sobre a estatística W da seguinte forma:

\[U = Ws - \frac{m(m+1)}{2}\]

Aplicada em ambos os casos, a e b, obteve-se a mesma distribuição da estatística U, que é exibida na tabela 5 a seguir.


Tabela 5: Distribuição de frequências da estatística U
U n Probabilidade
0 1 0.03
1 1 0.03
2 2 0.06
3 3 0.09
4 4 0.11
5 4 0.11
6 5 0.14
7 4 0.11
8 4 0.11
9 3 0.09
10 2 0.06
11 1 0.03
12 1 0.03
Fonte: elaboração própria