MESTRADO PROFISSIONAL EM SUSTENTABILIDADE E TECNOLOGIA AMBIENTAL
DISCIPLINA: ANÁLISE DE DADOS
TUTOR: WASHINGTON SILVA
OBSERVAÇÕES: EXAME 2 COM DATA PARA ENTREGA DIA 30/05/2015 ATÉ AS 13:00 HORAS
getwd()
## [1] "C:/Users/Alan/Documents"
setwd("C:/Users/Alan/Documents")
library (ggplot2)
library (asbio)
## Loading required package: tcltk
library (agricolae)
tecmis <- read.table("tab1.txt", h=T)
tecmis
## niveis y
## 1 T1 3129
## 2 T1 3000
## 3 T1 2865
## 4 T1 2890
## 5 T2 3200
## 6 T2 3300
## 7 T2 2975
## 8 T2 3150
## 9 T3 2800
## 10 T3 2900
## 11 T3 2985
## 12 T3 3050
## 13 T4 2600
## 14 T4 2700
## 15 T4 2600
## 16 T4 2765
boxplot (y ~ niveis, data = tecmis, col="lightyellow")
teste <- aov(y ~ niveis, data = tecmis)
summary (teste)
## Df Sum Sq Mean Sq F value Pr(>F)
## niveis 3 489740 163247 12.73 0.000489 ***
## Residuals 12 153908 12826
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
CONCLUSÃO: Como Pr(>F) é 0.000489 e é < 0,05, rejeita-se H0 e conclui-se que existe pelo menos uma técnica de mistura que leva à uma média de resistência à tração do cimento diferente das demais, onde se comprova que as técnicas de mistura afetam a resistência à tração do cimento.
testea = LSD.test (teste, "niveis", p.adj="bon", console=TRUE)
##
## Study: teste ~ "niveis"
##
## LSD t Test for y
## P value adjustment method: bonferroni
##
## Mean Square Error: 12825.69
##
## niveis, means and individual ( 95 %) CI
##
## y std r LCL UCL Min Max
## T1 2971.00 120.55704 4 2847.624 3094.376 2865 3129
## T2 3156.25 135.97641 4 3032.874 3279.626 2975 3300
## T3 2933.75 108.27242 4 2810.374 3057.126 2800 3050
## T4 2666.25 80.97067 4 2542.874 2789.626 2600 2765
##
## alpha: 0.05 ; Df Error: 12
## Critical Value of t: 3.152681
##
## Least Significant Difference 252.4675
## Means with the same letter are not significantly different.
##
## Groups, Treatments and means
## a T2 3156
## a T1 2971
## a T3 2934
## b T4 2666
bar.group(testea$groups, ylim=c(0,3800))
CONCLUSÃO: Apenas a técnica de mistura T4 se difere das outras. As técnicas de mistura T2, T1 e T3 podem ser consideradas semelhantes, pois levaram a valores médios de resistência à tração do cimento próximos.
plot (teste, which=2)
CONCLUSÃO: Observa-se que os pontos no gráfico (resíduos do modelo) apresentam comportamento semelhante à reta; e quanto aos pontos que aparecem em destaque, 1 e 7, não estão afetando o comportamento da distribuição pois, estão no mesmo sentido da reta, portanto é plausível considerar que os resíduos do modelo seguem uma distribuição normal.
plot (teste, which=1)
CONCLUSÃO: Nota se neste gráfico um padrão de comportamento aleatório da distruição com valores próximo à zero, portanto, é plausivel considerar um bom ajuste do modelo.
CONCLUSÃO: De acordo com os gráficos e levando em consideração a probabilidade de 5% pelo teste de Fisher apenas a técnica de mistura T4 deve ser negada se for exigido uma maior resistência à tração do cimento, pois a mesma difere das ou técnicas (1, 2 e 3) que têm semelhanças de valores em resistência a tração.
tabfor <- read.table("tab2.txt", h=T)
tabfor
## rpm forno y
## 1 r5 f1 8
## 2 r5 f2 4
## 3 r5 f3 5
## 4 r5 f4 6
## 5 r10 f1 14
## 6 r10 f2 5
## 7 r10 f3 6
## 8 r10 f4 9
## 9 r15 f1 14
## 10 r15 f2 6
## 11 r15 f3 9
## 12 r15 f4 2
## 13 r20 f1 17
## 14 r20 f2 9
## 15 r20 f3 3
## 16 r20 f4 6
# Boxplot: y x rpm
ggplot (tabfor, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ( )
# Boxplot: y x forno
ggplot (tabfor, aes(x=forno, y=y, fill=forno)) + geom_boxplot ( )
interaction.plot (tabfor$rpm, tabfor$forno, tabfor$y, fixed=TRUE)
evid <- aov (y~rpm + forno, data = tabfor)
summary (evid)
## Df Sum Sq Mean Sq F value Pr(>F)
## rpm 3 22.19 7.40 0.853 0.4995
## forno 3 165.19 55.06 6.348 0.0133 *
## Residuals 9 78.06 8.67
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
CONCLUSÃO: De acordo com a estimacao do modelo com blocagem dos fornos a análise da variância NÃO fornece evidências (a = 5%) de que as taxas de agitação afetam o tamanho do grão.
plot (evid, which=1)
plot (evid, which=2)
shapiro.test (evid$residuals)
##
## Shapiro-Wilk normality test
##
## data: evid$residuals
## W = 0.9301, p-value = 0.2447
CONCLUSÃO: Observa-se que no gráfico de resíduos x valores previstos apresenta-se os pontos aleatoriamente em torno do zero e próximo do mesmo; e quanto ao ponto que aparece em destaque, ponto 1, este não está afetando o comportamento da distribuição pois, é somente ele que está longe dos demais, portanto é plausível considerar um bom ajuste de modelo pois, os resíduos do modelo seguem uma distribuição normal. Já observando o gráfico normal qplot os pontos no gráfico (resíduos do modelo) tendem a seguir uma reta padrão; alguns pontos como o 1 e 15 afastam-se um pouco da reta, porém não afetam o comportamento geral da distribuição, portanto é plausível considerar que os resíduos do modelo seguem uma distribuição normal. Tal observação é comprovada pelo teste de Shapiro Wilk, onde p-valor > 0,05, logo não se rejeita H0, ou seja, os dados seguem uma distribuição normal.
tukey.add.test (tabfor$y, tabfor$rpm, tabfor$forno)
##
## Tukey's one df test for additivity
## F = 2.9804177 Denom df = 8 p-value = 0.1225519
ggplot (tabfor, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ( )
CONCLUSÃO: Conclui-se não existir interação entre as taxas de agitação e os fornos utilizados para fabricação do refinador. Portanto, a recomendação se baseará na taxa de agitação que produz menor tamanho de grão. Pela ANOVA, concluiu-se que não existe diferença significativa entre as taxas de agitação, portanto, poderia se recomendar qualquer taxa de agitação para o refinador. Porém, ao se observar o gráfico boxplot acima para Tamanho de grão (y) x Taxa de agitação (rpm), nota-se que quando a taxa de agitação é de 5 RPM, existe menor variabilidade no tamanho do grão processado, sendo, em média, composto por tamanhos pequenos.
tempres <- read.table("tab3.txt", h=T)
tempres
## y pre temp
## 1 90.4 200 150
## 2 90.2 200 150
## 3 90.7 215 150
## 4 90.6 215 150
## 5 90.2 230 150
## 6 90.4 230 150
## 7 90.1 200 160
## 8 90.3 200 160
## 9 90.5 215 160
## 10 90.6 215 160
## 11 89.9 230 160
## 12 90.1 230 160
## 13 90.5 200 170
## 14 90.7 200 170
## 15 90.8 215 170
## 16 90.9 215 170
## 17 90.4 230 170
## 18 90.1 230 170
str (tempres)
## 'data.frame': 18 obs. of 3 variables:
## $ y : num 90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
## $ pre : int 200 200 215 215 230 230 200 200 215 215 ...
## $ temp: int 150 150 150 150 150 150 160 160 160 160 ...
summary (tempres)
## y pre temp
## Min. :89.90 Min. :200 Min. :150
## 1st Qu.:90.20 1st Qu.:200 1st Qu.:150
## Median :90.40 Median :215 Median :160
## Mean :90.41 Mean :215 Mean :160
## 3rd Qu.:90.60 3rd Qu.:230 3rd Qu.:170
## Max. :90.90 Max. :230 Max. :170
tempres$pre <- as.factor (tempres$pre)
tempres$temp <- as.factor (tempres$temp)
str (tempres)
## 'data.frame': 18 obs. of 3 variables:
## $ y : num 90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
## $ pre : Factor w/ 3 levels "200","215","230": 1 1 2 2 3 3 1 1 2 2 ...
## $ temp: Factor w/ 3 levels "150","160","170": 1 1 1 1 1 1 2 2 2 2 ...
interaction.plot (tempres$pre, tempres$temp, tempres$y,
type="b" , pch =19 ,
fixed=T, xlab="Pressão",
ylab="Resultado do Processo")
tempres.aov <- aov(y~pre * temp, data=tempres)
summary (tempres.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## pre 2 0.7678 0.3839 21.594 0.000367 ***
## temp 2 0.3011 0.1506 8.469 0.008539 **
## pre:temp 4 0.0689 0.0172 0.969 0.470006
## Residuals 9 0.1600 0.0178
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
CONCLUSÃO: Observa-se que ao nível de probabilidade de 5% a interação entre os fatores pressão e temperatura não foi significativa. Somente os fatores isolados foram significativos (Pr < 0,05). Portanto, conclui-se, para este caso, que a produção do processo químico leva a resultados semelhantes independentemente da combinação de diferentes niveis de Temperatura e Pressão testados.
plot (tempres.aov, which=1)
fligner.test (y~interaction (pre, temp), data=tempres)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: y by interaction(pre, temp)
## Fligner-Killeen:med chi-squared = 14.869, df = 8, p-value =
## 0.06174
plot (tempres.aov, which=2)
shapiro.test (tempres.aov$residuals)
##
## Shapiro-Wilk normality test
##
## data: tempres.aov$residuals
## W = 0.87366, p-value = 0.02046
CONCLUSÃO: Observa-se que no gráfico de resíduos x valores previstos apresenta-se os pontos aleatoriamente distribuidos em torno do zero e próximos do mesmo, portanto considera-se um bom ajuste do modelo. Esta situação é comprovada pelo teste de Fligner Killeen que testa se a variância dos resíduos é homogênea. Como p-value > 0,05, não se rejeita H0, logo, é plausivel considerar que a variãncia do residuo é homogênea. Já pelo gráfico normal identifica-se que não há uma distribuição normal dos resíduos do modelo pois, os pontos não seguem a reta padrão, e também tendo em vista que deve-se rejeitar o H0 porque o p-value é menor que 0,05 de acordo com o Shapiro Wilk. Para que a ANOVA seja corretamente empregada as seguintes pressuposições devem ser satisfeitas para proporcionar validade e nível de significância corretos aos testes de significância e estimativas eficientes dos parâmetros do modelo: Os efeitos do modelo devem ser aditivos; Os erros experimentais devem ser normalmente distribuídos, independentes, com média zero e com variância comum; Logo, falhas em qualquer uma das suposições da ANOVA irão alterar, de algum modo, as suas propriedades padrão. Uma maneira de contornar a situação é mudar de análise, utilizando-se de métodos não paramétricos ou análises ponderadas, ou ainda realizar uma mudança da escala de medida por uma transformação adequada. Contudo, para as análises da questão, considerou-se que tais pressuposições foram atendidas.
Como observado na letra (a) ao nível de probabilidade de 5% a interação entre os fatores pressão e temperatura não foi significativa, portanto sob qualquer condição seria recomendável, porém, seria louvável no caso fazer a opção por uma cobinação que necessite de um menor gasto energético, o que poderia otimizar o processo, ajudando assim no objetivo do engenheiro.