1) O que é Distribuição de Frequências? Explique e apresente
um exemplo
Um método para agrupar dados pelo valor ou, para grande quantidade de
dados, em classes de modo a fornecer a a frequência absoluta e/ou
frequência relativa de cada classe em relação ao valor da amostra.
Por exemplo, se temos 10 alunos com idades, de forma ordenada,
[16,16,17,18,18,18,20,20,20,23] podemos ter a Distribuição de frequência
com cada idade ou por classe, como no exemplo a seguir:
| Idade | Frequência Absoluta | Frequência Relativa |
|---|---|---|
| Menor de 18 | 3 | 30% |
| 18 anos | 3 | 30% |
| Maior de 18 | 4 | 40% |
2) Explique de forma intuitiva e ou de forma formal o que é
uma Variável Aleatória. Apresente um (1) ou mais
exemplos.
Variável Aleatória assume um valor que não é exato, mas sim depende de
fatores aleatórios, como por exemplo o valor em unidades que resulta de
uma jogada de dado, pode ser de 1 a 6, que não é definido, mas sim
aleatório.
3) Como podem ser classificadas as Variáveis Aleatórias?
Apresente um exemplo de cada tipo.
A variável aleatória pode ser tanto discreta quanto contínua. Onde para
que seja discreta o valor da variável é finito/enumerável, já para que
seja contínua pode assumir valores infinitos dentro de um
intervalo.
Exemplos:
Variável Aleatório Discreta: Usando o exemplo do dado que é jogado o
valor da face que fica para cima pode assumir valores entre 1 e 6, sendo
assim é enumerável.
Variável Aleatório Contínua: Dentro de uma corrida o tempo exato da
passagem pela linha de chegada pode assumir valores infinitos, pois um
carro pode passar na marca final de 10:34, porém ao ter mais precisão
esse tempo pode ser visto como 10:34.45, e se for olhar ainda com mais
precisão pode obter o tempo 10:34:44859605 e assim por diante. O tempo é
uma medida que não é mensurável.
4) Apresente a definição e um exemplo de função de probabilidade
(f.p.).
A Função de probabilidade assume um valor entre 0 e 1 que define a
probabilidade da variável aleatória assumir o valor passado. A somatório
de todas as probabilidades será igual a 1.
Exemplo: Usando o exemplo do dado que é jogado o valor da face que fica
para cima pode assumir valores entre 1 e 6, sendo assim podemos aplicar
a função de probabilidade para cada valor. A probabilidade de o dado
resultar em face de valor 1:
f(1) = ⅙ -> Aproximadamente 0.17, ou seja, aproximadamente 17%.
5) O que é uma Distribuição de Probabilidades?
Uma distribuição de probabilidade é um modelo matemático que faz a
relação de uma variável em estudo com as suas probabilidades de
ocorrência.
6) Existe alguma semelhança entre Distribuição de
Probabilidades e Distribuição de Frequências? Explique.
Sim. A distribuição de probabilidade, leva em consideração a
probabilidade de ocorrência então os valores com maiores frequências na
distribuição de frequência serão os que possuem mais probabilidade de
ocorrência.
7) Descreva situações ou experimentos aleatórios em que o
fenômeno (dados) a ser estudado/investigado pode ser representado por
uma Distribuição Bernoulli.
Uma distribuição de Bernoulli assim experimentos aleatórios onde só há 2
valores possíveis, sendo 1 para sucesso e 0 para fracasso. Como por
exemplo ao jogar uma moeda ela será cara, sendo assim se for cara então
é sucesso com valor 1, porém ser for coroa será fracasso com valor
0.
8) Qual ou quais são os parâmetros da Distribuição Bernoulli
que deve(m) ser conhecidos para que seja possível calcular a
probabilidade de algum evento de interesse?
A distribuição de Bernoulli é caracterizada quando há apenas 2 eventos
possíveis, sendo um de sucesso e outro de fracasso, e a probabilidade de
fracasso é complementar à probabilidade de fracasso. Sendo assim, para
realizar o cálculo de algum evento de interesse, é necessário apenas
conhecer 1 parâmetro para que seja calculado a probabilidade de algum
evento de interesse, pois, para calcular o segundo evento basta realizar
1 - p, onde p é o valor da probabilidade do evento conhecido.
9)Apresente a f.p. da Distribuição Bernoulli e dê um exemplo
de problema cuja solução requeira o cálculo de probabilidade usando a
mesma. Apresente o cálculo manual e usando função(̃oes) do
R
Função de probabilidade da distribuição de bernoulli: pX (x) = P(X = x)
= p^x (1 − p)^(1−x) x = 0; 1:
Usando como exemplo o lançamento de uma moeda, e a variável aleatória X
associada à esse experimento: x = { 0 , se ocorrer cara | 1 , se ocorrer
coroa}
e p = ½. Como lm(x) = {0, 1}, x px(1) = (½)¹ (1 - ½) ^(1-1) px(1) = ½ (½)⁰ px(1) = (½).1 px(1) = ½
Usando R:
dbinom(0,1,0.5)
[1] 0.5
10)Descreva situações ou experimentos aleatórios em que o
fenômeno (dados) a ser estudado/investigado pode ser representado por
uma Distribuição Binomial.
O lançamento de uma moeda 4 vezes consecutivas, onde cada lançamento
temos o experimento de Bernoulli, e teríamos que calcular a
probabilidade de tirar 4 caras.
Também podemos imaginar uma caixa totalmente opaca com duas bolas
dentro, uma branca e a outra preta, e uma pessoa pega uma bola
aleatoriamente, checa sua cor e então a devolve para a caixa. Qual seria
a probabilidade de tirar 10 bolas brancas?
11) Qual ou quais são os parâmetros da Distribuição Binomial
que deve(m) ser conhecido(s) para que seja possível calcular a
probabilidade de algum evento de interesse?
Para realizar o cálculo da probabilidade de algum evento de interesse, é
necessário saber os dados de probabilidade do experimento de Bernoulli
que compõe a distribuição binomial. Além disso, é necessário também ter
conhecimento da quantidade de vezes que o experimento de Bernoulli se
repete.
12)Apresente a f.p. da Distribuição Binomial e dê um exemplo
de problema cuja solução requeira o cálculo de probabilidade usando a
mesma. Apresente o cálculo manual e usando função( ̃oes) do
R.
Para a distribuição binomial, temos a seguinte formula:
Pk=C(n,k)pK.(1-p)(n-k)
Vamos imaginar qual a probabilidade de lançar uma moeda 5 vezes, e 2
das vezes dar cara. Para isso, temos as seguintes variáveis:
n=5
p=½
k=2
Logo,
P(2) = C(5,2).(½)2.(1-½)(3)
P(2) = C(5,2).(¼).(½)^3
P(2) = C(5,2).(¼).(⅛)
P(2) = C(5,2) 0.3125
Usando R:
dbinom(2,5, 0.5)
[1] 0.3125
13) Apresente a definição e um exemplo de função densidade de
probabilidade (f.d.p.)
A função de densidade de probabilidade descreve as probabilidades
associadas a uma variável aleatória. Respeitando as regras que
são:
Para um valor x dentro dos valores prováveis a probabilidade de f(x) é
maior ou igual a 0. A soma de todas as probabilidades dentro de uma
f.d.p equivale a 1. A probabilidade de um valor x está entre A e B
dentro da f.d.p é igual à soma de todas as probabilidades entre A e B,
aplicando na integral de A até B f(x)dx=área abaixo de f(x) entre a e
b.
Exemplo: Uma máquina que corta rolhas para garrafas de vinho produz
rolhas com diâmetros diferentes. No gráfico de barras a seguir para os
diâmetros das rolhas, cada barra representa a porcentagem de rolhas com
o diâmetro correspondente.
14)Descreva situações ou experimentos aleatórios em que o
fenômeno (dados) a ser estudado/investigado pode ser representado por
uma Distribuição Normal.
Experimentos aleatórios onde os valores mais prováveis estão dispostos
próximo ao valor de média da função podem ser representados, pois assim
o gráfico toma por si um formato de sino, onde a média define o centro
da curva e a variância o espalhamento. Em uma distribuição normal a
média é igual a mediana
15)Qual ou quais são os parâmetros da Distribuição Normal que
deve ser conhecido para que seja possível calcular a probabilidade de
algum evento de interesse?
Para calcular a probabilidade é preciso da média e do desvio padrão.
17) Diga e descreva resumidamente quais são as principais Etapas/Fases de uma Pesquisa Estatística. Dê um exemplo.
As fases do método estatístico são:
Definição do problema: Consiste em uma definição correta do problema a
ser estudado. Exemplo: Eu, sendo uma empresa de jogos mobiles, ao
realizar um novo projeto quero saber qual a idade do meu público e onde
estão geograficamente para ter uma melhor definição de jogo meu público
alvo.
Planejamento: Consiste em definir os procedimentos necessários para resolver o problema em foco na pesquisa, em especial, como levantar informações que serão usadas na pesquisa. Exemplo: Não preciso de todas as informações do meu jogador para desenvolver minha pesquisa, então defino as informações necessárias como idade e localização. A pesquisa não precisa ser feita a todo meu público, então será feita em apenas uma amostra.
Coleta dos dados: Como o nome sugere é onde é feita a coleta dos dados necessários dos jogadores, que pode ser feita de diferentes formas. Exemplo: Eu como uma empresa que já possuo dados dos meus clientes, para gerar a pesquisa em dados como idade e localização só preciso repassar os dados que já disponho de uma parte dos meus jogadores.
Crítica dos dados: Após a coleta dos dados eles são analisados para conferir se há erros, para que não ocorram distorções que interfiram no resultado final da pesquisa. Exemplo: Se por acaso o sistema possuir uma liberdade de cadastro de idade e um jogador colocar que possui 300 anos, ao sistema está permitido e é possível, porém é um erro de dado, pois não condiz com a realidade.
Apuração dos dados: Os dados antes de serem corretamente analisados devem passar por uma apuração que consiste em resumir os dados, através de sua contagem e agrupamento. Permitindo uma análise mais concisa, já que todos os dados estão organizados.Exemplo: Em nosso exemplo a idade pode assumir vários valores, porém agrupar seria a melhor forma de ter uma melhor análise, já que saber a quantidade entre certo intervalo, ou então de jogadores menores ou maiores de idades seria uma informação mais útil do que apenas saber a quantidade para cada idade.
Exposição ou Apresentação dos dados: Se trata de como será mostrados os dados, onde pode assumir duas formas: Apresentação Tabular e Apresentação Gráfica. Onde a apresentação Tabular é uma maneira mais formal onde os dados são disponibilizados em linhas e colunas, já na Gráfica é algo mais visual e de rápida percepção dos dados.
Análise e Interpretação dos resultados: Nesta etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. Com todos os dados disponíveis e organizados essa é a parte mais esperada, que é através dos dados deduzir alguma resposta ao problema inicial, ou retirar algum insigth.