Edgar
28/07/2020
Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são pessoas que coletam esses dados.
A estatística originou-se com a coleta e construção de tabelas de dados para os governos A situação evoluiu e esta coleta de dados representa somente um dos aspectos da estatística.
1.- Estatística Descritiva.
2.- Probabilidade.
3.- Inferência estatística.
A estatística descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados.
A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou está área da estatística.
## [1] 5.727273
## [1] 6
## [1] 1.618182
## [1] 1.272078
## [1] 4
## [1] 8
## [1] 63
## [1] 169344000
## 25%
## 5
A teoria de probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza.
A probabilidade de 90% significa que se um experimento fosse refeito 100 vezes, em 90 vezes os resultados são os esperados. \[ P(x_i)= \frac{n_0}{\Omega} \] Onde \(n_0\) é o evento e \(\Omega\) é o espaço amostral.
Veja mais exemplo.
E o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
## [1] 13.12857
## [1] 12.85714
##
## Welch Two Sample t-test
##
## data: x1 and y1
## t = 0.15313, df = 9.3785, p-value = 0.8815
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -3.713678 4.256535
## sample estimates:
## mean of x mean of y
## 13.12857 12.85714
Lembrando que no R as variáveis Qualitativas são denominadas de caractere(crt) ou fator(Factor) e as variáveis Quantitativas são denominadas de inteiro(int) ou número(num).
\[\bar{x} = \frac{ \sum{x_i} }{n}\] \[\bar{x} = \frac{ x_1 +x_2 +x_3 +... + x_n }{n}\]
amostra = {12,14,15,19,21} \[\bar{amostra} = \frac{12+14+15+19+21}{5}=\frac{81}{5}=16,5\]
Mediana = é o elemento central em uma amostra. Ele representa a divisão de 50% dos elementos.
Exemplo de quantidade par. \({x_1=12, x_2=16, x_3=17, x_4=19, x_5=20, x_6=21}\)
Temos que fazer a média aritmética entre os dois elementos centrais. \[md = \frac{x_3+x_4}{2}=\frac{17+19}{2}=\]
A mediana é o elemento central md=19
Quem é a moda?
\({12,16,17,19,20,21}\)
O mínimo é 12 e o máximo é 21, então a amplitude é: \(H= 21 -12 = 9\)
Exemplo \({12,16,17,19,20,21}\) A média é 17,5, assim temos:
\[soma = (12-17,5)^2 + (16-17,5)^2 +(17-17,5)^2\] \[ +(19-17,5)^2 +(20-17,5)^2 +(21-17,5)^2 + \] Assim temos: \[soma = (-5,5)^2 + (-1,5)^2 +(0,5)^2+(1,5)^2+(2,5)^2+(3,5)^2\] Calculando temos:
\[var=\frac{soma}{5}=\]
\[S = \sqrt{var}= \sqrt{\frac{ \sum(x_i - \bar{x})^2}{n-1}}\]
\[S= \sqrt{\frac{53,5}{5}}=\sqrt{10,7}= 3,27\]
\[ media =\]
\[ var =\]
\[ S= \]
## a amostra é { 4 5 6 7 8 }
## a média é = 6
## O desvio padrão é = 1.581139
## O coeficiente de variação é = 26.35231
Representa a divisão da amostra em espaços iguais da amplitude.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela$dados <- as.numeric(levels(tabela$dados))
tabela <- tabela %>%
mutate(Fr = 100*Freq/sum(Freq),
Fac = cumsum(Freq),
Xi.Fi = dados*Freq)
round(tabela,2)## dados Freq Fr Fac Xi.Fi
## 1 18 1 4.55 1 18
## 2 19 8 36.36 9 152
## 3 20 2 9.09 11 40
## 4 22 3 13.64 14 66
## 5 23 1 4.55 15 23
## 6 24 3 13.64 18 72
## 7 26 2 9.09 20 52
## 8 30 1 4.55 21 30
## 9 32 1 4.55 22 32
O BOXPLOT representa os dados através de um retângulo construído com os quartis e fornece informação sobre valores extremos. (veja o esquema embaixo)