1. Intervalo de confiança a 95% para a média (AAS) e comentário à margem de erro

Considera-se Amostragem Aleatória Simples (AAS) e observações independentes Como as amostras são grandes, usa-se o quantil z = 1,96 (aproximação a t).

Cálculos por grupo:

média amostral: \(\bar{x} = \sum x_i / n\)

erro-padrão: \(SE = s/\sqrt{n}\), com \(s=\sqrt{2060}\)

margem de erro: \(ME = 1{,}96 \times SE\)

IC de 95%: \(\bar{x} \pm ME\)

Resultados em euros:

\(\begin{array}{lrrrr} \hline \text{Groupe} & n & \bar x\ (\mathrm{€}) & ME\ (\mathrm{€}) & IC_{95\%}\ (\mathrm{€})\\ \hline A & 345 & 943.478 & 4.789 & [938.689;\,948.268] \\ B & 370 & 879.730 & 4.625 & [875.105;\,884.354] \\ C & 400 & 813.750 & 4.448 & [809.302;\,818.198] \\ D & 300 & 1085.000 & 5.136 & [1079.864;\,1090.136] \\ E & 425 & 765.882 & 4.315 & [761.567;\,770.197] \\ \hline \end{array}\)

Podemos dizer a margem de erro diminui quando n aumenta (depende de 1/√n). Por isso, o Grupo E (n=425) tem a menor ME.

  1. Como reduzir a margem de erro em 30%

O objetivo é obter \(ME_{novo} = 0,7 \times ME_{atual}\).

Como \(ME \propto 1/\sqrt{n}\), então 0,7 = \(\sqrt{n_{atual}/n_{novo}}\)

\(n_{novo} \approx n_{atual} / 0,7^2 \approx 2,041 \times n_{atual}\).

Tamanhos necessários arredondados para cima :

\(\begin{array}{lrr} \hline \text{Groupe} & n_{\!actuel} & n_{\!requis}\ (\!-30\%\ ME)\\ \hline A & 345 & 705\\ B & 370 & 756\\ C & 400 & 817\\ D & 300 & 613\\ E & 425 & 868\\ \hline \end{array}\)

Podemos dizer que o custo vs benefício: quase duplicar o tamanho da amostra para ganhar só 30% em precisão. Antes de aumentar n, vale testar: melhorar questionário/controlo de qualidade (reduz variabilidade) ou planos mais eficientes.

  1. Se a população total tiver N = 700 clientes

seja correção de população finita = CPF

Quando a fração amostral é grande, ajusta-se o erro-padrão pela Correção para População Finita (CPF):

\(SE_{cpf} = (s/\sqrt{n}) \times \sqrt{(N - n)/(N - 1)}\).

O IC mantém a forma \(\bar{x} \pm 1{,}96\,SE_{cpf}\).

Resultados com N = 700 (euros):

\[\begin{array}{lrrrr} \hline \text{Groupe} & n & \text{FPC}=\sqrt{\tfrac{N-n}{N-1}} & ME_{\text{fpc}}\ (\mathrm{€}) & IC_{95\%}^{\text{(fpc)}}\ (\mathrm{€})\\ \hline A & 345 & 0.7126 & 3.413 & [940.065;\,946.891]\\ B & 370 & 0.6871 & 3.178 & [876.552;\,882.907]\\ C & 400 & 0.6551 & 2.914 & [810.836;\,816.664]\\ D & 300 & 0.7565 & 3.885 & [1081.115;\,1088.885]\\ E & 425 & 0.6272 & 2.707 & [763.176;\,768.589]\\ \hline \end{array}\]


Em conclusão: com N=700 a margem de erro baixa visivelmente, logo o IC com CPF é o adequado neste cenário.

  1. Duas grandes regiões: qual o tipo de amostragem?

Segundo o enunciado, a empresa tem Região A: 20 000 clientes e Região B: 85% de A ⇒ 17 000 (total 37 000). O objetivo é comparar o feedback por região.

Recomendação: amostragem estratificada por região.

Estratos: {A, B}.

Alocação proporcional (simples e transparente):

\(n_A = n \times (N_A/N) e n_B = n \times (N_B/N)\).

Exemplos de alocação por grupo:

\[\begin{array}{lrrr} \hline \text{Groupe} & n_{\text{total}} & n_A\ (\approx n\cdot 20000/37000) & n_B\ (\approx n\cdot 17000/37000)\\ \hline A & 345 & 186 & 159\\ B & 370 & 200 & 170\\ C & 400 & 216 & 184\\ D & 300 & 162 & 138\\ E & 425 & 230 & 195\\ \hline \end{array}\]


Porquê estratificar?

Garante estimativas separadas por região e melhor precisão global.

Se a variabilidade for maior numa região, pode-se usar alocação de Neyman (mais amostras na região mais variável, mantendo o mesmo custo total). Para isso, faz-se um piloto para estimar os desvios-padrão por região.

Usei z=1{,}96 em vez de t porque os n são grandes; a diferença seria mínima.

Mantive os mesmos dados comuns soma e variância e apenas varie o n conforme o grupo, como indicado no enunciado do trabalho.