Estatística Descritiva Aplicada à Engenharia

Roberval Lima

1o. Semestre de 2018

Notas de aula 01 local: “http://rpubs.com/roberval/362838

Capítulo 1. Introdução

Este texto é dirigido ao ensino da Estatística descritiva, especialmente para estudantes de engenharia.

A maioria das análises estatísticas são feitas usando uma biblioteca de comandos pré-escrita nos programas estatísticos. O usuário insere os dados e, em seguida, seleciona os tipos de análise e as saídas de interesse são exibidas. Muitos pacotes de software estatísticos estão disponíveis para computadores pessoais. Vamos apresentar exemplos de saída do programa R (um dos pacotes de PC mais utilizados e de uso segundo a filosofia livre), ao longo da apostila.

A nossa proposta é ensinar a Estatística descritiva, abordando todos os seus conceitos básicos e ao mesmo tempo disponibilizar uma ferramenta computacional, onde o aluno poderá obter os resultados de suas análises através do uso do programa livre R.

R é um sistema para análises estatísticas e gráficos criado por Ross Lhaka y Robert Gentleman (Lhaka R. & Gentleman R. 1996. R: a language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5:299-314. R tem uma característica dupla de programa e linguagem de programação e é considerado como um dialeto da linguagem S criada pelos laboratórios AT&T Bell.

R é distribuído gratuitamente sob os termos da GNU (General Public Licence). Seu desenvolvimento e distribuição são implementados por vários estatísticos conhecidos como o Grupo Nuclear de desenvolvimento do R.

1.1. Os métodos de engenharia e o pensamento estatístico

Um engenheiro é alguém que resolve problemas de interesse para sociedade pela eficiente aplicação de princípios científicos. Estes profissionais realizam isto, ou por refinar um produto existente ou processar ou por desenhar um novo produto ou processo de acordo com a necessidade de seus clientes. A engenharia ou método científico contribui para formulação e soluções para esses problemas. Os passos nos métodos da engenharia são os seguintes:

  1. Desenvolver uma clara e concisa descrição do problema.

  2. Identificar os principais fatores que afetam este problema e qual pode ser o seu papel na solução.

  3. Propor um modelo para o problema, usando conhecimento científico do fenomeno que está sendo estudado. Identificar qualquer limitação ou assumpções do modelo.

  4. Conduzir apropriado experimentos e coletar dados para testar ou validar o modelo tentativo ou as conclusões obtidas nos passos 2 e 3.

  5. Refinar o modelo com base nos dados observados.

  6. Manipular o modelo para ajudar no desenvolvimento da solução do problema.

  7. Conduzir um apropriado experimento para confirmar que a solução proposta para o problema é ao mesmo tempo efetiva e eficiente.

  8. Expor as conclusões ou fazer recomendações baeadas na solução do problema.

Os passos dos métodos da engenharia são mostrados na figura 1.

Figura1.1 Os métodos da engenharia

Figura1.1 Os métodos da engenharia

Os passos 2-4 na Fig. 1 indicam que vários ciclos de iterações são necessários para obter a solução final. Consequentemente, engenheiros devem ter conhecimento para planejar eficientemente os experimentos, coletar, analizar e interpretar dados; e entender como os dados observados estão relacionados ao modelo proposto para o problema em estudo.

A ciência estatística trata da coleta, apresentação, análise, e uso dos dados para tomar decisões, solucionar problemas, e propor novos produtos e processos. Em função de muitos aspectos práticos da engenharia envolver o trabalho com dados, algum conhecimento de estatística é importante para qualquer engenheiro. Especificamente, as técnicas estatísticas podem dar uma forte ajuda no desenho de novos produtos e sistemas, melhorando os projetos existentes, e desevolvendo, e melhorando os processos de produção.

1.2. De que trata a Estatística

Estatística é ciência que se ocupa da obtenção de informação (amostragem, planejamento de experimentos), seu tratamento inicial (ordenação, cálculo de características amostrais, agrupamento em classes, representações gráficas - em suma, estatística descritiva e análise exploratória de dados), com a finalidade de, através de resultados probabílisticos adequados, inferir de uma amosra para a população (decisão sobre hipóteses, estimativa de parâmetros populacionais a partir de características amostrais relevantes, comparação de populações, relacionamento de uma variável resposta com variáveis controladas). Por outras palavras, é um instrumento de leitura de informação e da sua transformação em Conhecimento.

É, também, uma ciência que se ocupa de estratégias e decisão num contexto de variabilidade e incerteza.

Galileu afirmava que Deus escreveu o Mundo em linguagem matemática, e que competia ao homem decifrar esta linguagem. Caso Galileu vivesse hoje, teria certamente escrito “estatística” em vez de “matemática”: o âmago da Estatística é a decifração dos dados.

O propósito último da análise estatística é inferir, a partir de uma amostra as características de uma população, ou comparar populações; e se possível, predizer acontecimentos futuros (no sentido específico de avaliar as suas probabilidades). Inferência e predição decorrem de modelos probabilísticos, e só podem ser efetivados com estudo prévio da matemática das incertezas, a teoria da probabilidade.

DEFINIÇÕES

Estatística descritiva é o ramo que trata da organização, do resumo e da apresentaçao dos dados.

Estatística indutiva ou inferencial é o ramo que trata de tirar conclusões sobre uma população a partir de uma amostra. A ferramenta básica no estudo da estatística inferencial é a probabilidade.

População é o conjunto de elementos que formam o universo de nosso estudo que são passíves de ser observados, sob as mesmas condições.

Amostra é uma parte dos elementos de uma população, obtidos por um determinado critério.

Amostragem é um processo ou critério que será usado para selecionar as unidades que comporão a amostra.

Parâmetro é uma medida que descreve certa característica dos elementos da população.

Estatística é uma medida que descreve certa característica dos elementos da amostra.

Estimativa é um valor resultante do cálculo de uma estatística, quando usado para se ter uma idéia do parâmetro de interesse.

Variável:

Constante:

1.3. Coleta, registro e inspeção dos dados

Os objetos de estudo da Estatística são os dados estatísticos, e o objetivo da Estatística é obter dados, por observação ou produzindo-os intencionalmente, descrevê-los, sumarizá-los, agrupá-los, organizá-los, analisá-los e interpretar os resultados da análise.

Existem várias maneiras de recompilar datos. En termos gerais podem ser coletados conforme a figura 1.2.

Figura 1.2. Métodos de coleta de dados.

Figura 1.2. Métodos de coleta de dados.

1.4. Tipo de dados

No ambiente de engenharia, os dados são quase sempre uma amostra que tenha sido selecionada a partir de alguma população. Três métodos básicos de coleta de dados são:

Um procedimento de coleta de dados eficaz pode simplificar muito a análise e levar à melhorar a compreensão da população ou processo que está sendo estudado.

Para realizar cálculos estatísticos uma das primeiras coisas a serem feitas é caracterizar qual tipo de dados estão sendo trabalhados, pois muitos cálculos estatísticos aplicáveis a um, não são adequados para outros.

Chamamos unidades amostrais aos elementos sobre os quais temos acesso aos dados. Uma variável estatística é uma característica que pode ser diferente nas diversas observações feitas, e pode ser de natureza qualitativa ou quantitativa. Sobre qualquer unidade amostral, podemos observar qualidades ou medir quantidades.

A estatística qualitativa ocupa-se das variáveis qualitativas, em geral usando contagens ou frequências absolutas, ou percentagens ou frequências relativas das classes ou categorias, sendo as variáveis nominais ou ordinais.

A estatística quantitativa ocupa-se das variáveis quantitativas, que em geral resultam de medições. Os resultados das medições são expressos numa escala contínua ou intervalar ou numa escala absoluta (Figura 1.3).

Figura1.3 Classificação dos dados

Figura1.3 Classificação dos dados

Exemplo 1.1. Classificação dos dados

Exercício 1.1

  1. Nas questões de a-c, determine se a afirmação é verdadeira ou falsa
  1. Nas questões de a-d, determine se os dados são qualitativos ou quantitativos.
  1. Classifique as seguintes variáveis aleatórias como discretas ou contínuas: