Este material tem como objetivo revisar conceitos introdutórios sobre Estatística e que são importantes para o curso de Econometria de Séries Temporais. Ele compreende os seguintes pontos:

  1. PROBABILIDADE

A teoria das probabilidades é o ramo da Matemática que cria, desenvolve e pesquisa modelos que podem ser utilizados para estudar experimentos ou fenômenos aleatórios.

Podemos definir a probabilidade como uma medida que quantifica a sua incerteza frente a um possível acontecimento futuro. O modelo utilizado para estudar um fenômeno aleatório pode variar em complexidade, mas todos eles possuem ingredientes básicos comuns. Eles são: experimento aleatório, espaço amostral e eventos.

Nesta seção vamos entender sobre experimento aleatório, espaço amostral e eventos. Além disso, como calcular a probabilidade clássica.

EXPERIMENTO ALEATÓRIO

Todo processo de realizar observações e obter dados é denominado experimento. O mesmo pode ser classificado em determinístico e aleatório. Basicamente, temos:

Como vimos, o resultado de um experimento aleatório depende do acaso, ou seja, mesmo repetido várias vezes sob condições semelhantes, o experimento apresenta resultados imprevisíveis. Assim, nosso objetivo é construir um modelo matemático que represente experimentos aleatórios e permita o cálculo de probabilidades.

ESPAÇO AMOSTRAL

A cada experimento aleatório correspondem, em geral, vários resultados possíveis. Por exemplo, ao lançarmos uma moeda, há dois resultados possíveis (ocorrer cara ou ocorrer coroa) enquanto para um dado há seis resultados possíveis (1, 2, 3, 4, 5, 6).

Ao conjunto formado por todos os possíveis e diferentes resultados de um experimento aleatório dá-se o nome de espaço amostral ou conjunto universo, representado por \(S\).

Os dois experimentos aleatórios citados anteriormente têm os seguintes espaços amostrais:

Outros dois exemplos são:

EVENTOS

Chamamos de evento qualquer subconjunto do espaço amostral \(S\) de um experimento aleatório. Assim, qualquer que seja \(E\), se \(E \subset S\) (\(E\) está contido em \(S\)), então \(E\) é um evento de \(S\). Alguns conceitos importantes:

No lançamento de um dado, onde \(S=\left\{1,2,3,4,5,6\right\}\), temos:

Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser definidos pelas sentenças:

DEFINIÇÃO CLÁSSICA DE PROBABILIDADE

Dado um experimento aleatório, sendo \(S\) o seu espaço amostral, vamos admitir que todos os elementos de \(S\) tenham a mesma chance de acontecer. Chamamos de probabilidade de um evento \(A\) (\(A\subset S\)) o número real \(P(A)\), tal que:

\[ P(A)=\frac{n(A)}{n(S)} \] onde \(n(A)\) é o número de elementos de \(A\) e \(n(S)\) é o número de elementos de \(S\).

Exemplos:

  1. Considerando o lançamento de uma moeda e o evento \(A\):obter cara, temos:

\[ \begin{aligned} S=\left\{Ca,Co \right\} \Rightarrow n\left(S\right)=2 \\ A = \left\{Ca \right\} \Rightarrow n\left(A\right)=1 \\ P\left(A\right)=\frac{1}{2}=50\% \end{aligned} \]

  1. Considerando o lançamento de um dado e o evento \(A\):obter um número par na face superior, temos:

\[ \begin{aligned} S=\left\{1,2,3,4,5,6 \right\} \Rightarrow n\left(S\right)=6 \\ A = \left\{2,4,6 \right\} \Rightarrow n\left(A\right)=3 \\ P\left(A\right)=\frac{3}{6}=\frac{1}{2}=50\% \end{aligned} \]

O resultado para o primeiro exemplo nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos \(50\%\) de chance de que apareça cara na face superior.

REGRA DA ADIÇÃO EM PROBABILIDADE

A probabilidade da união entre dois eventos quaisquer, \(A\) e \(B\), é dada pela regra da adição de probabilidade, como segue:

\[ P\left(A \cup B\right) = P\left(A\right) + P\left(B\right) - P\left(A \cap B\right) \]

Alt text

Note que a regra da adição pode ser simplificada, se e somente se os eventos \(A\) e \(B\) forem mutuamente exclusivos, pois neste caso \(P\left(A \cap B\right) = \emptyset\):

\[ P\left(A \cup B\right) = P\left(A\right) + P\left(B\right) \]

Alt text

Exemplo: Considerando o lançamento de um dado e os eventos \(A\):obter um número par na face superior e \(B\):sair resultado inferior a 3, encontre \(P\left(A \cup B\right)\):

\[ \begin{aligned} S=\left\{1,2,3,4,5,6 \right\} \Rightarrow n\left(S\right)=6 \\ A = \left\{2,4,6 \right\} \Rightarrow n\left(A\right)=3 \\ B = \left\{1,2 \right\} \Rightarrow n\left(B\right)=2 \\ A \cap B = \left\{2 \right\} \Rightarrow n\left(A \cap B\right)=1 \\ P\left(A\right)=\frac{n\left(A\right)}{n\left(S\right)} = \frac{3}{6}=\frac{1}{2} \\ P\left(B\right)=\frac{n\left(B\right)}{n\left(S\right)} = \frac{2}{6}=\frac{1}{3} \\ P\left(A \cap B\right)=\frac{n\left(A \cap B\right)}{n\left(S\right)} = \frac{1}{6} \\ P\left(A \cup B\right) = P\left(A\right) + P\left(B\right) - P\left(A \cap B\right)=\frac{1}{2}+\frac{1}{3}-\frac{1}{6} = \frac{2}{3} \end{aligned} \]

PROBABILIDADE CONDICIONAL

Em muitas situações práticas, o fenômeno aleatório com o qual trabalhamos pode ser separado em etapas. A informação do que ocorreu em uma determinada etapa pode influenciar nas probabilidades de ocorrências das etapas sucessivas.

Nestes casos, dizemos que ganhamos informação, e podemos recalcular as probabilidades de interesse. Tais probabilidades recebem o nome de probabilidade condicional.

Para entender a ideia de probabilidade condicional, considere o seguinte exemplo:

DEFINIÇÃO: Para dois eventos \(A\) e \(B\) de um mesmo espaço amostral, o termo \(P\left(A | B\right)\) denota a probabilidade de \(A\) ocorrer, dado que \(B\) ocorreu, e é definido como:

\[ P\left(A | B\right) = \frac{P\left(A \cap B\right)}{P\left(B\right)} \]

da mesma forma que a probabilidade de \(B\) ocorrer, dado que \(A\) ocorreu, é definida como:

\[ P\left(B | A\right) = \frac{P\left(B \cap A\right)}{P\left(A\right)} \]

Exemplo: Considerando o lançamento de um dado e os evento \(A\): obter o número 4 na face superior e \(B\): obter um número par na face superior, encontre \(P\left(A | B\right)\):

\[ \begin{aligned} S=\left\{1,2,3,4,5,6 \right\} \Rightarrow n\left(S\right)=6 \\ A = \left\{4 \right\} \Rightarrow n\left(A\right)=1 \\ B = \left\{2,4,6 \right\} \Rightarrow n\left(B\right)=3 \\ A \cap B = \left\{4 \right\} \Rightarrow n\left(A \cap B\right)=1 \\ P\left(A\right)=\frac{n\left(A\right)}{n\left(S\right)} = \frac{1}{6} \\ P\left(B\right)=\frac{n\left(B\right)}{n\left(S\right)} = \frac{3}{6}=\frac{1}{2} \\ P\left(A \cap B\right)=\frac{n\left(A \cap B\right)}{n\left(S\right)} = \frac{1}{6} \\ P\left(A | B\right) = \frac{P\left(A \cap B\right)}{P\left(B\right)}=\frac{\frac{1}{6}}{\frac{1}{2}} = \frac{1}{3} \end{aligned} \]

INDEPENDÊNCIA DE EVENTOS

Existem algumas situações nas quais saber que o evento \(B\) ocorreu, não tem qualquer interferência na ocorrência ou não de \(A\). Nestes casos, podemos dizer os eventos são independentes.

Os eventos \(A\) e \(B\) são eventos independentes se: \(P\left(A | B\right)=P\left(A \right)\) e \(P\left(B | A\right)=P\left(B \right)\). Com isso, temos que:

\[ \begin{aligned} P\left(A \cap B\right) = P\left(A \right) \times P\left(A | B\right) = P\left(B \right) \times P\left(A \right) \\ P\left(B \cap A\right) = P\left(A \right) \times P\left(B | A\right) = P\left(A \right) \times P\left(B \right) \end{aligned} \]

Isso significa que se dois eventos são independentes, a probabilidade de ocorrência simultânea é o produto das probabilidades de cada evento.

  1. VARIÁVEIS ALEATÓRIAS

Frequentemente estamos interessados em resumir o resultado de um experimento aleatório através de um número dado que o espaço amostral é apenas uma descrição dos resultados possíveis do mesmo. Por exemplo, suponha que realizamos o experimento de lançar três moedas e observamos o número de caras que aparecem e que tal número (quantidade de caras) será armazenado em uma variável qualquer. Como não sabemos de ante-mão qual será o resultado, o valor da variável resultante também não é conhecido.

Assim, a função que confere um número real a cada resultado no espaço amostral do experimento aleatório é conhecida como variável aleatória, pois aleatoriamente pode assumir qualquer valor do espaço amostral.

Geralmente, uma variável aleatória é denotada por letra maiúscula, tal como \(X\) enquanto que após o experimento ser conduzido, o valor observado da variável aleatória é denotado por letra minúscula (por exemplo, \(x=2\) para o lançamento de 3 moedas e observar 2 caras).

As variáveis aleatórias podem ser discretas e contínuas. Dizemos que uma variável aleatória \(X\) é discreta se toma um número finito ou enumerável de valores. Por outro lado, a variável aleatória \(X\) será contínua se assume valores em um intervalo de números reais. Abaixo, exemplos de experimentos que geram variáveis aleatórias de cada tipo:

MOMENTOS

Os momentos são muito importantes em estatística para caracterizar distribuições de probabilidade. Por exemplo, a distribuição normal é caracterizada apenas pelo primeiro e pelo segundo momentos. O primeiro, segundo, terceiro e quarto momentos caracterizam a tendência central, dispersão, assimetria e curtose, respectivamente, de uma distribuição de probabilidade.

O k-ésimo momento não central de uma variável aleatória discreta notado por \({M}_{k}^{'}\), é definido por:

\[ {M}_{k}^{'}=\sum_{x}{{x}^{k}} p\left( x \right) \]

Assim, o primeiro momento não central de uma variável aleatória discreta será \({M}_{1}^{'}=\sum _{x}{{x}} p\left(x \right)\) que é a esperança de \(X\), notada por \(E\left[X \right]\).

O k-ésimo momento central de uma variável aleatória contínua notado por \({M}_{k}^{'}\), é definido por:

\[ {M}_{k}=\int _{\mathbb{R}}{{\left(x-E\left[x \right] \right)}^{k}f\left(x \right)dx} \] Assim, o segundo momento central de uma variável aleatória contínua será \({M}_{k}=\int _{\mathbb{R}}{{\left(x-E\left[x \right] \right)}^{2}f\left(x \right)dx}\) que é a variância de \(X\), notada por \(\sigma_{x}^{2}\).

  1. DISTRIBUIÇÕES DE PROBABILIDADE

Uma distribuição de probabilidade é um modelo matemático que relaciona um certo valor da variável aleatória em estudo com a sua probabilidade de ocorrência.

Nesta seção vamos estudar as principais distribuições de probabilidade contínuas (quando a variável aleatória que está sendo medida é expressa em uma escala contínua) e discretas (quando a variável aleatória que está sendo medida só pode assumir certos valores, como por exemplo valores inteiros). Além disso, vamos aprender como calcular a valor médio esperado e a variância de uma variável aleatória.

DISCRETAS

Suponha que temos o experimento aleatório de lançar um dado e observar qual o número da face superior. O espaço amostral pode ser expressado em uma variável aleatória discreta \(X\) que assume os valores \(1,2,3,4,5,6\) com a probabilidade \(\frac{1}{6}\). Abaixo, o gráfico da distribuição de probabilidade para a variável aleatória em análise. Observe que podemos obter a probabilidade de ocorrência de qualquer valor da variável aleatória e que ela é sempre a mesma, ou seja, \(\frac{1}{6}\).

Porém, nem sempre temos a facilidade de detalhar o espaço amostral de um experimento aleatório e especificar uma variável aleatória discreta para o mesmo. Em função disso, existem algumas distribuições de probabilidade discretas definidas a priori e que podemos usar para descrever uma variável aleatória discreta em análise.

Observe que neste caso, estamos assumindo que nossa variável aleatória discreta segue uma destas distribuições de probabilidade discreta. Na sequência, mostramos as principais distribuições de probabilidade discretas.

BERNOULLI

Na prática muitos experimentos admitem apenas dois resultados. Esses experimentos recebem o nome de Ensaios de Bernoulli. Por exemplo, o resultado de um exame médico para detecção de uma doença pode ser positivo ou negativo. Nestes casos, temos dois eventos mutuamente exclusivos que podemos denominar de sucesso e fracasso.

Assim, uma variável aleatória \(X\) de Bernoulli é aquela que assume apenas dois valores discretos:

\[ X=\begin{cases} 1~\text{se sucesso} \\ 0~\text{se fracasso} \end{cases} \] e a distribuição de probabilidade é dada por:

Para tais variáveis o valor esperado e a variância podem ser dados por:

\[ \begin{aligned} && E\left[ X \right] = p \\ && Var\left( X \right) = p\left( 1-p \right) \end{aligned} \] * Exemplo: um paciente, ao dar entrada na terapia intensiva, tem 25% de probabilidade de óbito (risco de morte). Se associamos \(p=0.25\), a probabilidade de sucesso (óbito) e \(1-p\) a probabilidade de fracasso (sem óbito), podemos criar uma variável aleatória discreta \(X\) que pode assumir apenas dois valores (\(x=0\) para fracasso e \(x=1\) para sucesso) e a distribuição de probabilidade pode ser desenhada no seguinte formato:

BINOMIAL

A distribuição binomial nada mais é que a generalização da distribuição de Bernoulli. Continuamos com um sucesso, com probabilidade \(p\), e um fracasso, com probabilidade \(1−p\), mas o experimento é repetido \(n\) vezes sendo estas independentes, ou seja, o resultado de uma repetição não é influenciado por outros resultados.

Para tanto, fazemos uso da seguinte fórmula:

\[ P\left( X=k \right) =\left( \begin{matrix} n \\ k \end{matrix} \right) { p }^{ k }{ \left( 1-p \right) }^{ n-k } \] onde:

  • \(n\): quantidade de repetições do experimento;
  • \(p\): probabilidade de sucesso;
  • \(1−p\): probabilidade de fracasso;
  • \(k\): quantidade de sucessos nas repetições;
  • \(\left( \begin{matrix} n \\ k \end{matrix} \right)\): representa o número de combinações de \(n\) elementos em grupos de \(k\) (quantidade de maneiras distintas de se obter o evento desejado), calculado como \(\left( \begin{matrix} n \\ k \end{matrix} \right) =\frac{n!}{k!\left(n-k \right)!}\)

Além disso, temos que o valor esperado e a variância serão:

\[ \begin{aligned} E\left[ X \right] =np \\ Var\left( X \right) =np\left( 1-p \right) \end{aligned} \]

Considere o exemplo anterior onde um paciente ao dar entrada na terapia intensiva tem 25% de probabilidade de óbito (risco de morte). Se 10 pacientes entrarem no CTI qual a probabilidade de óbito de 0 até 10 pacientes? É para este tipo de análise que podemos fazer uso da distribuição Binomial, como mostra o gráfico abaixo:

Outras aplicações para este tipo de variável aleatória são:

  • Número de itens defeituosos em \(n\) itens produzidos independentes
  • Amostra contaminada em \(n\) amostras independentes
  • Número de questões corretas em \(n\) questões respondidas independentes
POISSON

A distribuição de Poisson é adequada para descrever as probabilidades do número de ocorrências num intervalo contínuo (em geral tempo ou espaço). São exemplos de variáveis que podem ter como modelo a distribuição de Poisson:

  • Acidentes com automóveis em uma determinada estrada
  • Quantidade de pacientes que chegam num pronto socorro durante a madrugada

Note que a quantidade de valores possíveis que a variável aleatória pode assumir é infinita, entretanto enumerável. Além disso, observe que a variável aleatória é discreta (número de ocorrências), no entanto a unidade de medida é contínua (tempo, área).

Ainda, as falhas não são contáveis. Por exemplo, não é possível contar os acidentes que não ocorreram em um dia, nem tão pouco a quantidade de pacientes que não chegaram ao pronto socorro na madrugada.

A distribuição de Poisson fica completamente caracterizada por um único parâmetro \(\lambda\) que representa o número médio de ocorrências por unidade de tempo. A equação para calcular a probabilidade de \(k\) ocorrências num intervalo contínuo (em geral tempo ou espaço) é dada por:

\[ P\left(X=k\right)= \frac{e^{-\lambda}\lambda^{k}}{k!} \] onde:

  • \(e\): é a base do logaritmo natural;
  • \(k\): quantidade de ocorrências num intervalo contínuo;
  • \(k!\): é o fatorial de \(k\);
  • \(\lambda\): é um número real que representa a taxa de ocorrência. Por exemplo, se o evento ocorre a uma média de 4 minutos e estamos interessados no número de eventos que ocorrem num intervalo de 10 minutos, \(\lambda={10}/{4}=2.5\)

Além disso, temos que o valor esperado e a variância serão:

\[ \begin{aligned} E\left[X\right] =\lambda \\ Var\left(X\right) = \lambda \end{aligned} \]

  • Exemplo: O governo de uma ilha informou que durante 20 anos, 200 turistas faleceram (em média 10 turistas por ano). Qual a probabilidade de exatamente 5 turistas falecerem no próximo ano?

\[ \begin{aligned} &&& k =5~\text{(quantidade de turistas falecerem no intervalo de um ano)} \\ &&& \lambda =10~\text{(média de turistas que falecem no intervalo de um ano)} \\ && \\ &&& P\left(X=5\right)= \frac{e^{-10}10^{5}}{5!}=0,037=37\% \end{aligned} \] Como resultado, temos que a probabilidade de falecimento de exatamente 5 turistas no próximo ano é de \(3,5\%\). Agora, para diversos valores de \(k\) temos a seguinte distribuição de probabilidades:

CONTÍNUAS

Quando uma variável que está sendo medida é expressa em uma escala contínua, não se pode usar distribuições de probabilidaddes tais como Bernoulli, Binomial ou Poisson para obter probabilidades.

Imagine o ponteiro de um relógio. Uma vez que tenha sido posto a girar, o ponteiro pode parar em qualquer posição ao longo do cículo. Agora, imagine um círculo dividido em 8.000 partes iguais ao invés das 12 partes que tradicionalmente um relógio tem. Se cada posição constitui um ponto de parada tão provável quanto qualquer outra, somo levados à seguinte conclusão:

Como há tantos resultados possíveis, a probabilidade do ponteiro parar em qualquer valor particular é tão pequena que deve ser considerada aproximadamente zero.

Na verdade, temos ao menos 1 milhão de posições diferentes, de modo que a probabilidade do ponteito parar exatamente em uma delas seria de \(1/1.000.000 = 0.000001\)

Em face dessa peculiaridade, é realmente sem sentido falar-se da probabilidade de um resultado específico, tal como fizemos no estudo das distribuições discretas. Assim, a análise das variáveis contínuas tende a focalizar a probabilidade de uma variável aleatória tomar um valor num determinado intervalo (por exemplo, a probabilidade do ponteiro parar entre \(3\) ou \(4\)).

Distribuição Exponencial

De uma forma bastante resumida imagine uma variável aleatória de Poisson, onde temos a contagem do número de ocorrências de falhas em um intervalo. Suponha agora que estejamos interessados em verificar a probabilidade do tempo transcorrido entre duas ocorrências consecutivas de falhas. Essa última é considerada uma variável aleatória exponencial.

A distribuição exponencial é muito utilizada para modelar o tempo até que um evento se verifique. Por exemplo, o tempo entre falhas de equipamentos ou tempo entre a ocorrência de acidentes em uma rodovia.

Para tanto, usamos a fórmula:

\[ P\left(X>t\right) = \lambda e^{-\lambda t} \] onde:

  • \(\lambda\) representa a taxa de falha por unidade de tempo,
  • \(t\) é um tempo de falha

A partir dessa fórmula, podemos calcular a probabilidade de que o tempo antes da primeira ocorrência de falha seja maior que um dado tempo \(t\). Já a probabilidade de uma ocorrência em \(t\) ou antes de \(t\) é dada por:

\[ P\left(X \le t\right) = 1-e^{\lambda t} \] Além disso, temos que o valor esperado e a variância serão:

\[ \begin{aligned} E\left[X\right] = \frac{1}{\lambda} \\ Var\left(X\right) = \frac{1}{\lambda^2} \end{aligned} \] * Exemplo: Suponha que, em determinado período do dia, o tempo médio de atendimento em um caixa de banco seja de 5 minutos. Admitindo que o tempo para atendimento tenha distribuição exponencial, temos que a taxa de falha por minuto é de \(\lambda= \frac{1}{5}\). A partir disso, qual a probabilidade de um cliente esperar mais do que 5 minutos?

O gráfico abaixo apresenta a distribuição de probabilidades exponencial para \(\lambda= \frac{1}{5}\). Como estamos buscando a probabilidade de um cliente esperar mais do que 5 minutos, temos que fazer 1 menos a probabilidade de ele esperar até 5 minutos.

Distribuição Normal

A distribuição Normal ou gaussiana é a mais familiar das distribuições de probabilidade e uma das mais importantes em estatística. Muitas variáveis aleatórias podem ser descritas pela distribuição Normal.

A equação da curva Normal é especificada usando 2 parâmetros: a média \(\mu\) e o desvio padrão \(\sigma\). A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva. Para referência, a equação da curva é:

\[ f\left(x\right) = \frac{1}{\sqrt{2\pi \sigma^2}}exp \left\{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 \right\},~~~-\infty<x<\infty~~\text{e}~\sigma>0 \]

Geralmente, quando dizemos que uma variável aleatória \(X\) segue uma distribuição Normal, podemos escrever \(X \sim N\left(\mu,\sigma^2\right)\). Além disso, temos que o valor esperado e a variância serão:

\[ \begin{aligned} E\left[X\right] = \mu \\ Var\left(X\right) = \sigma^2 \end{aligned} \] O gráfico abaixo mostra como mudar a média \(\mu\) e/ou variância \(\sigma^2\) impacta na forma da curva Normal.

Para o cálculo de probabilidade, usamos:

\[ P\left(a<X<b\right)=\int_{a}^{b}{\frac{1}{\sqrt{2\pi \sigma^2}}exp \left\{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 \right\}dx} \]

Cabe notar que a integral da função densidade de probabilidade Normal não possui solução analítica, sendo neste caso o seu cálculo deve ser realizado por método numérico. Para sanar tal dificuldade a função pode ser padronizada com a substituição dos parâmetros por \(\mu=0\) e \(\sigma^2=1\). Essa abordagem é dada pela definição de uma nova variável aleatória \(Z\), chamada de variável aleatória Normal padronizada.

Alt

Distribuição Lognormal

Ao contrário da distribuição Normal e outras distribuições de probabilidade simétricas, em que as medidas de tendência central convergem para um mesmo valor, na distribuição Lognormal, moda, média e mediana apresentam localizações distintas.

A função densidade de probabilidade de uma variável aleatória \(X\) que segue uma distribuição Lognormal com média \(\mu\) e desvio \(\sigma\) é:

\[ f\left(x\right) = \frac{1}{\sqrt{2\pi \sigma^2}}exp \left\{-\frac{1}{2}\left(\frac{ln(x)-\mu}{\sigma}\right)^2 \right\},~~~-\infty<x<\infty~~\text{e}~\sigma>0 \]

Observe como o gráfico da distribuição se alterna na medida que temos valores diversos para

Distribuição t de Student

A distribuição t de Student é uma das distribuições mais utilizadas na estatística, com aplicações que vão desde a modelagem estatística até teste de hipóteses.

Uma variável aleatória contínua \(X\) tem distribuição t de Student com \(\upsilon\) graus de liberdade, denotada por \(t\left(\upsilon\right)\), se sua função de densidade de probabilidade for dada por:

\[ f\left(x\right)=\frac{1}{\sqrt{\upsilon \pi}}\frac{\Gamma\left(\frac{\upsilon+1}{2}\right) }{\Gamma \left(\frac{\upsilon}{2}\right)}\left(1+\frac{x^2}{\upsilon}\right)^{-\left(\frac{\upsilon+1}{2}\right)},~~~-\infty<x<\infty \] Na verdade, a distribuição t de Student é a divisão entre uma variável aleatória com distribuição Normal padronizada e uma variável aleatória com distribuição Qui-Quadrado. Além disso, temos que o valor esperado e a variância serão:

\[ \begin{aligned} E\left[X\right] = 0 \\ Var\left(X\right) = \frac{\upsilon}{\upsilon-2} \end{aligned} \] Observe que \(\upsilon >2\) para que a variância exista. Fazendo diversos valores para \(\upsilon\) percebemos que a densidade da distribuição t de Student se aproxima bastante de uma distribuição Normal padronizada (média nula e variância igual a 1) quando \(\upsilon\) é grande.

Distribuição de Cauchy

A distribuição de Cauchy tem sua importância em diversas áreas do conhecimento (física, matemática, finanças, …). Uma variável aleatória contínua \(X\) tem distribuição de Cauchy com parâmetros \(\alpha\) e \(\beta\) se sua função densidade de probabilidade for definida por:

\[ f\left(x\right) = \frac{1}{\pi\beta\left[1+\left[\frac{x-\alpha}{\beta}\right]^2\right]},~~~-\infty<x<\infty \] onde \(\alpha\) e \(\beta\) são os parâmetros de locação e escala, respectivamente.

O gráfico abaixo mostra como a densidade de probabilidade da distribuição Cauchy se comporta na medida que alteramos os valores dos seus parâmetros:

  1. VETORES ALEATÓRIOS

Para facilitar o entendimento sobre vetores aleatórios (também conhecidos como amostras aleatórias), vamos voltar ao exemplo de lançar um dado.

Porém, suponha que estamos lançando \(n\) dados não viciados. Isto significa que estamos interessados no resultado da variável aleatória \(Y_i\), \(i=1,...,n\) que representará os resultados para cada um dos \(n\) dados.

Uma vez que os resultados são selecionados aleatoriamente, eles são variáveis aleatórias por si só e suas realizações serão diferentes em cada vez que lançarmos os \(n\) dados. Além disso, cada observação é retirada aleatóriamente da mesma população (os números de \(1\) a \(6\)) com a mesma distribuição de probabilidades. Assim, \(Y_1\), \(Y_2\), …, \(Y_n\) são identicamente distribuídos.

Ainda, sabemos que os valores de cada \(Y_i\) não fornece qualquer informação sobre os resultados dos outros dados. Em nosso exemplo, encontrar \(6\) como a primeira observação em nossa amostra não altera a distribuição de \(Y_2\), …, \(Y_n\). Isto significa que todos \(Y_i\) são tabmém independemente distribuídos. Assim, \(Y_1\), …, \(Y_n\) são independente e identicamente distribuídos (iid)

REFERÊNCIAS

James, Barry R. 2011. Probabilidade Um Curso Em Nível Intermediário. Coleção Projeto Euclides.

Morettin, Pedro Alberto, and Wilton Oliveira BUSSAB. 2017. Estatística Básica. Editora Saraiva.

