ENGD02 - Estatística na engenharia

Regressão linear

\[ y_i = \beta + \alpha x_i + e_i \]


\[ SSE = \sum_{i=1}^{N} e_i^2 \]


Considerações

  • Resíduos com distribuição normal

  • Independência dos resíduos

  • Ausência de incerteza nsa variáveis preditoras

  • Ausência de multicolinearidade entre o regressores

Onde vamos utilizar?

Meio acadêmico:

  • Construção de modelos (termodinâmicos, dimensionamento)
  • Planejamento de experimentos
  • Predição e séries temporais


Indústria

  • Projetos six-sigma
  • Área de qualidade
  • Previsão de demanda e estoque

Exemplo 01: Cars

Exemplo 02: Germinação

## 
## Call:
## lm(formula = germination$dry.mass ~ germination$treatment)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.3053 -0.2413 -0.1803  0.1522  1.5893 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           0.2999897  0.0447513   6.703 6.12e-10 ***
## germination$treatment 0.0006679  0.0147956   0.045    0.964    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.381 on 126 degrees of freedom
## Multiple R-squared:  1.617e-05,  Adjusted R-squared:  -0.00792 
## F-statistic: 0.002038 on 1 and 126 DF,  p-value: 0.9641

Exemplo 02: Germinação

Exemplo 03: Anscombe

Retornando ao exemplo 01

Retornando ao exemplo 01

Exemplo 04: Qualidade do ar

Mínimos quadrados

Pressuposto 1: Assume-se que a distribuição dos erros experimentais no domínio de análise é conhecida.

Pressuposto 2: Os desvios (erros) experimentais apresentam uma distribuição de probabilidade normal (gaussiana).

\[p(Z^e | Z, V_Z) = \frac{1}{\sqrt{2\cdot \pi \cdot det(V_Z)}}\cdot e^{-\frac{1}{2} \left ( Z^e -Z\right )^T\cdot V_{Z}^{-1}\cdot \left ( Z^e -Z\right )}\]

Pressuposto 3: Os experimentos são realizados de forma independente, não há correlação entre eles.

\[\mathcal{L}(Z, V_Z | Z^e) = \prod_{i = 1}^{n}p_i(Z_{i}^{e} | Z_i, V_{Zi})\]

Pressuposto 4: As medições das variáveis independentes não estão correlacionadas com as medições das variáveis dependentes.

\[\mathcal{L}(Z, V_Z | Z^e) =\prod_{i = 1}^{n}\left [p_i(X_{i}^{e} | X_i, V_{Xi}\cdot p_i(Y_{i}^{e} | Y_i, V_{Yi}) \right ]\]

Mínimos quadrados

Pressuposto 5: O valor das variáveis independentes é conhecido com grande precisão.

\[\left ( x^e-x \right )\approx 0\]

\[\mathcal{L}(Z, V_Z | Z^e) =\prod_{i = 1}^{n}p_i(Y_{i}^{e} | Y_i, V_{Yi})\]

\[\mathcal{L}(Z, V_Z | Z^e) =\prod_{i = 1}^{n}\prod_{j = 1}^{n_y}p_{yij}(Y_{ij}^{e} | Y_{ij}, V_{Yij})\]

Mínimos quadrados

Pressuposto 6: As medições experimentais podem ser realizadas de forma independente.

\(V_{Yij} = \sigma_{yij}^{2}\)

\[\mathcal{L}(Z, V_Z | Z^e) =\prod_{i = 1}^{n}\prod_{j = 1}^{n_y}p_{yij}(Y_{ij}^{e} | Y_{ij}, \sigma_{yij}^{2})\]

\[\mathcal{L}(Z, V_Z | Z^e) =\prod_{i = 1}^{n}\prod_{j = 1}^{n_y}\frac{1}{\sqrt{2\cdot \pi \cdot \sigma_{yij}^{2}}}\cdot e^{-\frac{1}{2}\cdot \frac{\left (Y_{ij}^{e}-Y_{ij} \right )^2}{\sigma_{yij}^{2}}}\]

Pressuposto 7: Admite-se válida a hipótese do modelo ideal.

\[Y^{m} = f(X^{m}, \Theta )\]

\[\mathcal{L}(Z^{m}, V_Z | Z^e) =\prod_{i = 1}^{n}\prod_{j = 1}^{n_y}\frac{1}{\sqrt{2\cdot \pi \cdot \sigma_{yij}^{2}}}\cdot e^{-\frac{1}{2}\cdot \frac{\left (Y_{ij}^{e}-Y_{ij}^{m}(X^{m}, \Theta) \right )^2}{\sigma_{yij}^{2}}}\]

Mínimos quadrados

Pressuposto 8: É válida a hipótese do experimento bem-realizado.

\[F_{obj} = ln\left [ \mathcal{L}(Z^{m}, V_Z | Z^e) \right ]\]

\[F_{obj} = \sum_{i=1}^{n}\sum_{j=1}^{n_{y}}ln\left [ \frac{1}{\sqrt{2\cdot \pi \cdot \sigma_{yij}^{2}}} \right ]-\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n_{y}}\frac{\left (Y_{ij}^{e}-Y_{ij}^{m}(X^{m}, \Theta) \right )^2}{\sigma_{yij}^{2}}\]

\[\max\left \{ F_{obj}\right \} = \underset{\Theta}{\arg\max}\left \{ -\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n_{y}}\frac{\left (Y_{ij}^{e}-Y_{ij}^{m}(X^{m}, \Theta) \right )^2}{\sigma_{yij}^{2}}\right \}\]

\[\max\left \{ F_{obj}\right \} = \underset{\Theta}{\arg\min}\left \{ \sum_{i=1}^{n}\sum_{j=1}^{n_{y}}\frac{\left (Y_{ij}^{e}-Y_{ij}^{m}(X^{m}, \Theta) \right )^2}{\sigma_{yij}^{2}}\right \}\]

Mínimos quadrados

Pressuposto 9: O modelo proposto possui uma única variável predita.

\[\max\left \{ F_{obj}\right \} = \underset{\Theta}{\arg\min}\left \{ \sum_{i=1}^{n}\frac{\left (y_{ij}^{e}-y_{ij}^{m}(X^{m}, \Theta) \right )^2}{\sigma_{yij}^{2}}\right \}\]


Pressuposto 10: Os erros de medição são constantes em todo domínio de análise.

\[\max\left \{ F_{obj}\right \} = \underset{\Theta}{\arg\min}\left \{ \sum_{i=1}^{n}\left (y_{ij}^{e}-y_{ij}^{m}(X^{m}, \Theta) \right )^2\right \} \equiv \text{MMQ}\]

Just for fun!