Aula 3

Distribuição simples de frequência

Quando empregar: variáveis qualitativas ou variáveis quantitativas com poucos valores distintos observados.

Exemplo 1: Registro (N: não identifica corretamente, P: identifica corretamente) dos resultados do dispositivo A30 para identificação dos níveis de contaminação de amostras de água: P, N, N, P, P, P, P, P, P, P, P, N, P, P, P, P, P, P, P, P, P, N, P, N, P, P, P, P, P, P, P, N, N, N, P, N, P, N, P, P.

\[\mbox{Resultados do dispositivo A30 na identificação da}\] \[\mbox{contaminação de água, Laboratório Beta, JAN 2019}\] \[\begin{array}{ccc} \hline \mbox{Resultado} &\mbox{Frequência} &\mbox{Porcentagem} \\ \hline \mbox{Não identifica}& 10&25,0\\ \mbox{Identifica} & 30& 75,0\\ \hline \mbox{Total} & 40& 100,0\\ \hline \mbox{Fonte: Dados fictícios}& &\\ \end{array}\]

Exemplo 2: Uma amostra de 30 equipamentos NZ43 produzidos pela empresa Alpha no ano de 2019 foi avaliada e os seguintes números de falhas no processo de fabricação foram registrados: 1, 2, 1, 3, 4, 2, 1, 1, 2, 3, 4, 1, 1, 1, 1, 2, 3, 1, 2, 1, 2, 1, 3, 1, 3, 3, 1, 4, 1, 1.

\[\mbox{Distribuição de frequência do número de falhas}\] \[\mbox{do equipamento NZ43 da empresa Alpha, 2019} \]

\[\begin{array}{ccc} \hline \mbox{Número de falhas} &\mbox{Frequência} &\mbox{Porcentagem} \\ \hline 1& 15& 50,0\\ 2& 6& 20,0\\ 3& 6& 20,0\\ 4& 3& 10,0\\ \hline \mbox{Total} & 30& 100,0\\ \hline \mbox{Fonte: Dados fictícios}& &\\ \end{array}\]

Distribuição de frequência em classes

Quando empregar: variáveis quantitativas com muitos valores distintos observados.

Exemplo 3: Gramas de proteína em 30 amostras de 100g do cereal KL:

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 10.1 11.0 12.3 13.0 15.0 16.0 16.5 20.0 21.5  25.9
[2,] 10.5 11.9 12.5 14.0 15.0 16.0 17.0 20.8 21.8  27.0
[3,] 10.8 12.0 13.0 14.5 15.5 16.5 17.5 21.0 23.0  29.2
\[\begin{array}{ccc} \hline \mbox{Proteína(g)} &\mbox{Frequência} &\mbox{Porcentagem} \\ \hline 10\vdash 14& 10& 33,3\\ 14\vdash 18& 11& \color{red}{36,6}\\ 18\vdash 22& 5& 16,7\\ 22\vdash 26& 2& 6,7\\ 26\vdash 30& 2& 6,7\\ \hline \mbox{Total} & 30& 100,0\\ \hline \mbox{Fonte: Dados fictícios}& &\\ \end{array}\]

Regra prática para a construção

  1. Calcular a amplitude total (AT): \(AT = X_{max} - X_{min}\), em que \(X\) denota a variável de estudo.
  2. Determinar o número de classes (NC): \(NC=\sqrt{n}\), se \(n > 25\), ou \(NC=5\), se \(n\leq 25\), em que \(n\) denota o número de observações.
  3. Determinar a amplitude do intervalo de classe (AI): \(AI=\dfrac{AT}{NC}\)

Observações:

  • O limite inferior da primeira classe será o menor valor inteiro do conjunto de dados. Caso o menor valor não seja inteiro, usaremos o valor inteiro imediatamente anterior.
  • Tipos de intervalos: \(\vdash\), \(\dashv\) e \(\vdash\!\!\!\dashv\)
  • O ponto médio da classe será o valor que representará os valores da classe para efeito de cálculo das estatísticas.
  • A escolha do número de classes e da amplitude e limites dos intervalos de classe é arbitrária.
    • poucas classes, perde-se informações
    • muitas classes, o objetivo de resumo fica prejudicado
    • sugere-se o uso de 5 a 15 classes
  • Alternativa para \(NC\) (Regra de Sturges): \(NC=1+3.3\log_{10} n\)

Exercício

Os dados abaixo são medidas de tempo de vida útil (em horas) de um certo produto após sua exposição à temperatura ambiente. As estatísticas média e desvio padrão para esses dados são 30,14g e 2,70g, respectivamente

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 24.1 26.8 28.1 28.7 29.3 30.3 31.2 31.7 32.5  33.8
[2,] 24.9 26.9 28.3 28.9 29.3 30.4 31.3 32.1 32.6  34.7
[3,] 26.2 27.8 28.3 29.1 29.8 30.5 31.4 32.1 32.7  35.1
[4,] 26.6 27.9 28.6 29.1 30.2 31.1 31.5 32.5 33.7  35.4
  1. Organize os dados em uma distribuição de frequência.
  2. Com base na tabela gerada, calcule o tempo médio e o desvio padrão do tempo. Compare com as estatísticas calculadas para os dados observados.