Lista 01 - Estatistica Aplicada

Alunos

Matheus Eduardo Rodrigues da Silva - 116211262

José Vinícius Lacerda de Arruda - 116210766

Thiago Farias de Almeida - 119110385

1) O que é Distribuição de Frequências? Explique e apresente um exemplo
Um método para agrupar dados pelo valor ou, para grande quantidade de dados, em classes de modo a fornecer a a frequência absoluta e/ou frequência relativa de cada classe em relação ao valor da amostra.
Por exemplo, se temos 10 alunos com idades, de forma ordenada, [16,16,17,18,18,18,20,20,20,23] podemos ter a Distribuição de frequência com cada idade ou por classe, como no exemplo a seguir:

Idade Frequência Absoluta Frequência Relativa
Menor de 18 3 30%
18 anos 3 30%
Maior de 18 4 40%

2) Explique de forma intuitiva e ou de forma formal o que é uma Variável Aleatória. Apresente um (1) ou mais exemplos.
Variável Aleatória assume um valor que não é exato, mas sim depende de fatores aleatórios, como por exemplo o valor em unidades que resulta de uma jogada de dado, pode ser de 1 a 6, que não é definido, mas sim aleatório.

3) Como podem ser classificadas as Variáveis Aleatórias? Apresente um exemplo de cada tipo.
A variável aleatória pode ser tanto discreta quanto contínua. Onde para que seja discreta o valor da variável é finito/enumerável, já para que seja contínua pode assumir valores infinitos dentro de um intervalo.
Exemplos:
Variável Aleatório Discreta: Usando o exemplo do dado que é jogado o valor da face que fica para cima pode assumir valores entre 1 e 6, sendo assim é enumerável.
Variável Aleatório Contínua: Dentro de uma corrida o tempo exato da passagem pela linha de chegada pode assumir valores infinitos, pois um carro pode passar na marca final de 10:34, porém ao ter mais precisão esse tempo pode ser visto como 10:34.45, e se for olhar ainda com mais precisão pode obter o tempo 10:34:44859605 e assim por diante. O tempo é uma medida que não é mensurável.
4) Apresente a definição e um exemplo de função de probabilidade (f.p.).
A Função de probabilidade assume um valor entre 0 e 1 que define a probabilidade da variável aleatória assumir o valor passado. A somatório de todas as probabilidades será igual a 1.
Exemplo: Usando o exemplo do dado que é jogado o valor da face que fica para cima pode assumir valores entre 1 e 6, sendo assim podemos aplicar a função de probabilidade para cada valor. A probabilidade de o dado resultar em face de valor 1:
f(1) = ⅙ -> Aproximadamente 0.17, ou seja, aproximadamente 17%.

5) O que é uma Distribuição de Probabilidades?
Uma distribuição de probabilidade é um modelo matemático que faz a relação de uma variável em estudo com as suas probabilidades de ocorrência.

6) Existe alguma semelhança entre Distribuição de Probabilidades e Distribuição de Frequências? Explique.
Sim. A distribuição de probabilidade, leva em consideração a probabilidade de ocorrência então os valores com maiores frequências na distribuição de frequência serão os que possuem mais probabilidade de ocorrência.

7) Descreva situações ou experimentos aleatórios em que o fenômeno (dados) a ser estudado/investigado pode ser representado por uma Distribuição Bernoulli.
Uma distribuição de Bernoulli assim experimentos aleatórios onde só há 2 valores possíveis, sendo 1 para sucesso e 0 para fracasso. Como por exemplo ao jogar uma moeda ela será cara, sendo assim se for cara então é sucesso com valor 1, porém ser for coroa será fracasso com valor 0.

8) Qual ou quais são os parâmetros da Distribuição Bernoulli que deve(m) ser conhecidos para que seja possível calcular a probabilidade de algum evento de interesse?
A distribuição de Bernoulli é caracterizada quando há apenas 2 eventos possíveis, sendo um de sucesso e outro de fracasso, e a probabilidade de fracasso é complementar à probabilidade de fracasso. Sendo assim, para realizar o cálculo de algum evento de interesse, é necessário apenas conhecer 1 parâmetro para que seja calculado a probabilidade de algum evento de interesse, pois, para calcular o segundo evento basta realizar 1 - p, onde p é o valor da probabilidade do evento conhecido.

9)Apresente a f.p. da Distribuição Bernoulli e dê um exemplo de problema cuja solução requeira o cálculo de probabilidade usando a mesma. Apresente o cálculo manual e usando função(̃oes) do R
Função de probabilidade da distribuição de bernoulli: pX (x) = P(X = x) = p^x (1 − p)^(1−x) x = 0; 1:
Usando como exemplo o lançamento de uma moeda, e a variável aleatória X associada à esse experimento: x = { 0 , se ocorrer cara | 1 , se ocorrer coroa}

e p = ½. Como lm(x) = {0, 1}, x px(1) = (½)¹ (1 - ½) ^(1-1) px(1) = ½ (½)⁰ px(1) = (½).1 px(1) = ½

Usando R:
dbinom(0,1,0.5)
[1] 0.5

10)Descreva situações ou experimentos aleatórios em que o fenômeno (dados) a ser estudado/investigado pode ser representado por uma Distribuição Binomial.
O lançamento de uma moeda 4 vezes consecutivas, onde cada lançamento temos o experimento de Bernoulli, e teríamos que calcular a probabilidade de tirar 4 caras.
Também podemos imaginar uma caixa totalmente opaca com duas bolas dentro, uma branca e a outra preta, e uma pessoa pega uma bola aleatoriamente, checa sua cor e então a devolve para a caixa. Qual seria a probabilidade de tirar 10 bolas brancas?

11) Qual ou quais são os parâmetros da Distribuição Binomial que deve(m) ser conhecido(s) para que seja possível calcular a probabilidade de algum evento de interesse?
Para realizar o cálculo da probabilidade de algum evento de interesse, é necessário saber os dados de probabilidade do experimento de Bernoulli que compõe a distribuição binomial. Além disso, é necessário também ter conhecimento da quantidade de vezes que o experimento de Bernoulli se repete.

12)Apresente a f.p. da Distribuição Binomial e dê um exemplo de problema cuja solução requeira o cálculo de probabilidade usando a mesma. Apresente o cálculo manual e usando função( ̃oes) do R.
Para a distribuição binomial, temos a seguinte formula:
Pk=C(n,k)pK.(1-p)(n-k)

Vamos imaginar qual a probabilidade de lançar uma moeda 5 vezes, e 2 das vezes dar cara. Para isso, temos as seguintes variáveis:
n=5
p=½
k=2

Logo,
P(2) = C(5,2).(½)2.(1-½)(3)
P(2) = C(5,2).(¼).(½)^3
P(2) = C(5,2).(¼).(⅛)
P(2) = C(5,2) 0.3125
Usando R:
dbinom(2,5, 0.5)
[1] 0.3125

13) Apresente a definição e um exemplo de função densidade de probabilidade (f.d.p.)
A função de densidade de probabilidade descreve as probabilidades associadas a uma variável aleatória. Respeitando as regras que são:
Para um valor x dentro dos valores prováveis a probabilidade de f(x) é maior ou igual a 0. A soma de todas as probabilidades dentro de uma f.d.p equivale a 1. A probabilidade de um valor x está entre A e B dentro da f.d.p é igual à soma de todas as probabilidades entre A e B, aplicando na integral de A até B f(x)dx=área abaixo de f(x) entre a e b.
Exemplo: Uma máquina que corta rolhas para garrafas de vinho produz rolhas com diâmetros diferentes. No gráfico de barras a seguir para os diâmetros das rolhas, cada barra representa a porcentagem de rolhas com o diâmetro correspondente.

14)Descreva situações ou experimentos aleatórios em que o fenômeno (dados) a ser estudado/investigado pode ser representado por uma Distribuição Normal.
Experimentos aleatórios onde os valores mais prováveis estão dispostos próximo ao valor de média da função podem ser representados, pois assim o gráfico toma por si um formato de sino, onde a média define o centro da curva e a variância o espalhamento. Em uma distribuição normal a média é igual a mediana

15)Qual ou quais são os parâmetros da Distribuição Normal que deve ser conhecido para que seja possível calcular a probabilidade de algum evento de interesse?
Para calcular a probabilidade é preciso da média e do desvio padrão.

17) Diga e descreva resumidamente quais são as principais Etapas/Fases de uma Pesquisa Estatística. Dê um exemplo.

As fases do método estatístico são:
Definição do problema: Consiste em uma definição correta do problema a ser estudado. Exemplo: Eu, sendo uma empresa de jogos mobiles, ao realizar um novo projeto quero saber qual a idade do meu público e onde estão geograficamente para ter uma melhor definição de jogo meu público alvo.

Planejamento: Consiste em definir os procedimentos necessários para resolver o problema em foco na pesquisa, em especial, como levantar informações que serão usadas na pesquisa. Exemplo: Não preciso de todas as informações do meu jogador para desenvolver minha pesquisa, então defino as informações necessárias como idade e localização. A pesquisa não precisa ser feita a todo meu público, então será feita em apenas uma amostra.

Coleta dos dados: Como o nome sugere é onde é feita a coleta dos dados necessários dos jogadores, que pode ser feita de diferentes formas. Exemplo: Eu como uma empresa que já possuo dados dos meus clientes, para gerar a pesquisa em dados como idade e localização só preciso repassar os dados que já disponho de uma parte dos meus jogadores.

Crítica dos dados: Após a coleta dos dados eles são analisados para conferir se há erros, para que não ocorram distorções que interfiram no resultado final da pesquisa. Exemplo: Se por acaso o sistema possuir uma liberdade de cadastro de idade e um jogador colocar que possui 300 anos, ao sistema está permitido e é possível, porém é um erro de dado, pois não condiz com a realidade.

Apuração dos dados: Os dados antes de serem corretamente analisados devem passar por uma apuração que consiste em resumir os dados, através de sua contagem e agrupamento. Permitindo uma análise mais concisa, já que todos os dados estão organizados.Exemplo: Em nosso exemplo a idade pode assumir vários valores, porém agrupar seria a melhor forma de ter uma melhor análise, já que saber a quantidade entre certo intervalo, ou então de jogadores menores ou maiores de idades seria uma informação mais útil do que apenas saber a quantidade para cada idade.

Exposição ou Apresentação dos dados: Se trata de como será mostrados os dados, onde pode assumir duas formas: Apresentação Tabular e Apresentação Gráfica. Onde a apresentação Tabular é uma maneira mais formal onde os dados são disponibilizados em linhas e colunas, já na Gráfica é algo mais visual e de rápida percepção dos dados.

Análise e Interpretação dos resultados: Nesta etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. Com todos os dados disponíveis e organizados essa é a parte mais esperada, que é através dos dados deduzir alguma resposta ao problema inicial, ou retirar algum insigth.