MESTRADO PROFISSIONAL EM SUSTENTABILIDADE E TECNOLOGIA AMBIENTAL

DISCIPLINA: ANÁLISE DE DADOS

TUTOR: WASHINGTON SILVA

OBSERVAÇÕES: EXAME 2 COM DATA PARA ENTREGA DIA 30/05/2015 ATÉ AS 13:00 HORAS


1- A resistência a tração de um determinado tipo de cimento está sendo analisada. Quatro técnicas de mistura possuem viabilidade econômica para serem utilizadas. Os seguintes dados foram coletados:

getwd()
## [1] "C:/Users/Alan/Documents"
setwd("C:/Users/Alan/Documents")


library (ggplot2)

library (asbio)
## Loading required package: tcltk
library (agricolae)

tecmis  <- read.table("tab1.txt", h=T)
tecmis
##    niveis    y
## 1      T1 3129
## 2      T1 3000
## 3      T1 2865
## 4      T1 2890
## 5      T2 3200
## 6      T2 3300
## 7      T2 2975
## 8      T2 3150
## 9      T3 2800
## 10     T3 2900
## 11     T3 2985
## 12     T3 3050
## 13     T4 2600
## 14     T4 2700
## 15     T4 2600
## 16     T4 2765
boxplot (y ~ niveis, data = tecmis, col="lightyellow")

  1. Teste a hipótese de que as técnicas de mistura afetam a resistência a tração. Use a = 5%.
teste <-  aov(y ~ niveis, data = tecmis)
summary (teste)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## niveis       3 489740  163247   12.73 0.000489 ***
## Residuals   12 153908   12826                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

CONCLUSÃO: Como Pr(>F) é 0.000489 e é < 0,05, rejeita-se H0 e conclui-se que existe pelo menos uma técnica de mistura que leva à uma média de resistência à tração do cimento diferente das demais, onde se comprova que as técnicas de mistura afetam a resistência à tração do cimento.

  1. Use o teste da diferença míninma significativa de Fisher com correção de bonferroni para fazer comparações entre os pares de médias.
testea = LSD.test (teste, "niveis", p.adj="bon", console=TRUE)
## 
## Study: teste ~ "niveis"
## 
## LSD t Test for y 
## P value adjustment method: bonferroni 
## 
## Mean Square Error:  12825.69 
## 
## niveis,  means and individual ( 95 %) CI
## 
##          y       std r      LCL      UCL  Min  Max
## T1 2971.00 120.55704 4 2847.624 3094.376 2865 3129
## T2 3156.25 135.97641 4 3032.874 3279.626 2975 3300
## T3 2933.75 108.27242 4 2810.374 3057.126 2800 3050
## T4 2666.25  80.97067 4 2542.874 2789.626 2600 2765
## 
## alpha: 0.05 ; Df Error: 12
## Critical Value of t: 3.152681 
## 
## Least Significant Difference 252.4675
## Means with the same letter are not significantly different.
## 
## Groups, Treatments and means
## a     T2      3156 
## a     T1      2971 
## a     T3      2934 
## b     T4      2666
bar.group(testea$groups, ylim=c(0,3800))

CONCLUSÃO: Apenas a técnica de mistura T4 se difere das outras. As técnicas de mistura T2, T1 e T3 podem ser consideradas semelhantes, pois levaram a valores médios de resistência à tração do cimento próximos.

  1. Construa um gráfico quantil-quantil dos resíduos do modelo, quais as conclusões sobre a validade da hipótese de normalidade?
plot (teste, which=2)

CONCLUSÃO: Observa-se que os pontos no gráfico (resíduos do modelo) apresentam comportamento semelhante à reta; e quanto aos pontos que aparecem em destaque, 1 e 7, não estão afetando o comportamento da distribuição pois, estão no mesmo sentido da reta, portanto é plausível considerar que os resíduos do modelo seguem uma distribuição normal.

  1. Faça um gráfico dos resíduos contra os valores previstos pelo modelo e comente o resultado.
plot (teste, which=1)

CONCLUSÃO: Nota se neste gráfico um padrão de comportamento aleatório da distruição com valores próximo à zero, portanto, é plausivel considerar um bom ajuste do modelo.

  1. Relate as conclusões finais do experimento.

CONCLUSÃO: De acordo com os gráficos e levando em consideração a probabilidade de 5% pelo teste de Fisher apenas a técnica de mistura T4 deve ser negada se for exigido uma maior resistência à tração do cimento, pois a mesma difere das ou técnicas (1, 2 e 3) que têm semelhanças de valores em resistência a tração.


2- Um fabricante de ligas de alumínio produz refinadores de grãos em forma de lingote. A empresa produz usando em quatro fornos. Cada forno é conhecido por ter características operacionais únicas, portanto, qualquer experimento executado na fundição que envolva mais de um forno, irá considerá-los como um fator de perturbação. Os engenheiros responsáveis pelo processo de produção suspeitam que a velocidade de agitação afeta o tamanho de grão do produto. Cada forno pode ser executado em quatro taxas de agitacão diferentes. Um delineamento em blocos aleatorizados foi para um refinador particular e o tamanho do grão resultante é exibido no quadro abaixo:

  1. Há alguma evidência de que as taxas de agitação afetam o tamanho do grão?
tabfor  <- read.table("tab2.txt", h=T)
tabfor
##    rpm forno  y
## 1   r5    f1  8
## 2   r5    f2  4
## 3   r5    f3  5
## 4   r5    f4  6
## 5  r10    f1 14
## 6  r10    f2  5
## 7  r10    f3  6
## 8  r10    f4  9
## 9  r15    f1 14
## 10 r15    f2  6
## 11 r15    f3  9
## 12 r15    f4  2
## 13 r20    f1 17
## 14 r20    f2  9
## 15 r20    f3  3
## 16 r20    f4  6
# Boxplot: y x rpm
ggplot (tabfor, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ( )

# Boxplot: y x forno
ggplot (tabfor, aes(x=forno, y=y, fill=forno)) + geom_boxplot ( )

interaction.plot (tabfor$rpm, tabfor$forno, tabfor$y, fixed=TRUE)

evid  <- aov (y~rpm + forno, data = tabfor)
summary (evid)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## rpm          3  22.19    7.40   0.853 0.4995  
## forno        3 165.19   55.06   6.348 0.0133 *
## Residuals    9  78.06    8.67                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

CONCLUSÃO: De acordo com a estimacao do modelo com blocagem dos fornos a análise da variância NÃO fornece evidências (a = 5%) de que as taxas de agitação afetam o tamanho do grão.

  1. Faça os gráficos apropriados e execute testes para verificar a normalidade e homogeneidade de variância dos resíduos. Comente os resultados.
plot (evid, which=1) 

plot (evid, which=2) 

shapiro.test (evid$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  evid$residuals
## W = 0.9301, p-value = 0.2447

CONCLUSÃO: Observa-se que no gráfico de resíduos x valores previstos apresenta-se os pontos aleatoriamente em torno do zero e próximo do mesmo; e quanto ao ponto que aparece em destaque, ponto 1, este não está afetando o comportamento da distribuição pois, é somente ele que está longe dos demais, portanto é plausível considerar um bom ajuste de modelo pois, os resíduos do modelo seguem uma distribuição normal. Já observando o gráfico normal qplot os pontos no gráfico (resíduos do modelo) tendem a seguir uma reta padrão; alguns pontos como o 1 e 15 afastam-se um pouco da reta, porém não afetam o comportamento geral da distribuição, portanto é plausível considerar que os resíduos do modelo seguem uma distribuição normal. Tal observação é comprovada pelo teste de Shapiro Wilk, onde p-valor > 0,05, logo não se rejeita H0, ou seja, os dados seguem uma distribuição normal.

  1. O que os engenheiros deveriam recomendar em relação a escolha da taxa de agitação e do forno para este refinador de grão em particular, se deseja-se um pequeno tamanho para o grão produzido?
tukey.add.test (tabfor$y, tabfor$rpm, tabfor$forno)
## 
## Tukey's one df test for additivity 
## F = 2.9804177   Denom df = 8    p-value = 0.1225519
ggplot (tabfor, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ( )

CONCLUSÃO: Conclui-se não existir interação entre as taxas de agitação e os fornos utilizados para fabricação do refinador. Portanto, a recomendação se baseará na taxa de agitação que produz menor tamanho de grão. Pela ANOVA, concluiu-se que não existe diferença significativa entre as taxas de agitação, portanto, poderia se recomendar qualquer taxa de agitação para o refinador. Porém, ao se observar o gráfico boxplot acima para Tamanho de grão (y) x Taxa de agitação (rpm), nota-se que quando a taxa de agitação é de 5 RPM, existe menor variabilidade no tamanho do grão processado, sendo, em média, composto por tamanhos pequenos.


3- Um engenheiro está tentando otimizar a produção de um processo químico. Ele avaliou que as duas variáveis mais importantes foram a temperatura e a pressão do processo. Três níveis de cada fator foram selecionados e um experimento fatorial com duas repetições foi executado. Os dados foram os seguintes:

  1. Analise os dados do experimento e tire as conclusões apropriadas. Use a = 5%.
tempres  <-  read.table("tab3.txt", h=T)


tempres
##       y pre temp
## 1  90.4 200  150
## 2  90.2 200  150
## 3  90.7 215  150
## 4  90.6 215  150
## 5  90.2 230  150
## 6  90.4 230  150
## 7  90.1 200  160
## 8  90.3 200  160
## 9  90.5 215  160
## 10 90.6 215  160
## 11 89.9 230  160
## 12 90.1 230  160
## 13 90.5 200  170
## 14 90.7 200  170
## 15 90.8 215  170
## 16 90.9 215  170
## 17 90.4 230  170
## 18 90.1 230  170
str (tempres)
## 'data.frame':    18 obs. of  3 variables:
##  $ y   : num  90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
##  $ pre : int  200 200 215 215 230 230 200 200 215 215 ...
##  $ temp: int  150 150 150 150 150 150 160 160 160 160 ...
summary (tempres)
##        y              pre           temp    
##  Min.   :89.90   Min.   :200   Min.   :150  
##  1st Qu.:90.20   1st Qu.:200   1st Qu.:150  
##  Median :90.40   Median :215   Median :160  
##  Mean   :90.41   Mean   :215   Mean   :160  
##  3rd Qu.:90.60   3rd Qu.:230   3rd Qu.:170  
##  Max.   :90.90   Max.   :230   Max.   :170
tempres$pre  <- as.factor (tempres$pre)
tempres$temp  <-  as.factor (tempres$temp)
str (tempres)
## 'data.frame':    18 obs. of  3 variables:
##  $ y   : num  90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
##  $ pre : Factor w/ 3 levels "200","215","230": 1 1 2 2 3 3 1 1 2 2 ...
##  $ temp: Factor w/ 3 levels "150","160","170": 1 1 1 1 1 1 2 2 2 2 ...
interaction.plot (tempres$pre, tempres$temp, tempres$y,
                                  type="b" , pch =19 ,
                                  fixed=T, xlab="Pressão", 
                                  ylab="Resultado do Processo")

tempres.aov <- aov(y~pre * temp, data=tempres)


summary (tempres.aov)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## pre          2 0.7678  0.3839  21.594 0.000367 ***
## temp         2 0.3011  0.1506   8.469 0.008539 ** 
## pre:temp     4 0.0689  0.0172   0.969 0.470006    
## Residuals    9 0.1600  0.0178                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

CONCLUSÃO: Observa-se que ao nível de probabilidade de 5% a interação entre os fatores pressão e temperatura não foi significativa. Somente os fatores isolados foram significativos (Pr < 0,05). Portanto, conclui-se, para este caso, que a produção do processo químico leva a resultados semelhantes independentemente da combinação de diferentes niveis de Temperatura e Pressão testados.

  1. Analise os resíduos do modelo ajustado e comente sobre a adequação do modelo.
plot (tempres.aov, which=1) 

fligner.test (y~interaction (pre, temp), data=tempres)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  y by interaction(pre, temp)
## Fligner-Killeen:med chi-squared = 14.869, df = 8, p-value =
## 0.06174
plot (tempres.aov, which=2) 

shapiro.test (tempres.aov$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  tempres.aov$residuals
## W = 0.87366, p-value = 0.02046

CONCLUSÃO: Observa-se que no gráfico de resíduos x valores previstos apresenta-se os pontos aleatoriamente distribuidos em torno do zero e próximos do mesmo, portanto considera-se um bom ajuste do modelo. Esta situação é comprovada pelo teste de Fligner Killeen que testa se a variância dos resíduos é homogênea. Como p-value > 0,05, não se rejeita H0, logo, é plausivel considerar que a variãncia do residuo é homogênea. Já pelo gráfico normal identifica-se que não há uma distribuição normal dos resíduos do modelo pois, os pontos não seguem a reta padrão, e também tendo em vista que deve-se rejeitar o H0 porque o p-value é menor que 0,05 de acordo com o Shapiro Wilk. Para que a ANOVA seja corretamente empregada as seguintes pressuposições devem ser satisfeitas para proporcionar validade e nível de significância corretos aos testes de significância e estimativas eficientes dos parâmetros do modelo: Os efeitos do modelo devem ser aditivos; Os erros experimentais devem ser normalmente distribuídos, independentes, com média zero e com variância comum; Logo, falhas em qualquer uma das suposições da ANOVA irão alterar, de algum modo, as suas propriedades padrão. Uma maneira de contornar a situação é mudar de análise, utilizando-se de métodos não paramétricos ou análises ponderadas, ou ainda realizar uma mudança da escala de medida por uma transformação adequada. Contudo, para as análises da questão, considerou-se que tais pressuposições foram atendidas.

  1. Sob quais condições dos fatores analisados o engenheiro deveria recomendar a operação do processo?

Como observado na letra (a) ao nível de probabilidade de 5% a interação entre os fatores pressão e temperatura não foi significativa, portanto sob qualquer condição seria recomendável, porém, seria louvável no caso fazer a opção por uma cobinação que necessite de um menor gasto energético, o que poderia otimizar o processo, ajudando assim no objetivo do engenheiro.