title: ‘Exame 2: Análise de Dados’ author: “Fernanda Raggi” date: “Saturday, May 30, 2015” output: html_document —
QUESTÃO 01 - A resistência à tração de um determinado tipo de cimento está sendo analisada. Quatro técnicas de mistura possuem viabilidade econcômica para serem utilizadas. Os seguintes dados foram coletados:
#Diretório
setwd("G:\\Fernanda")
#importando os dados
tecmix = read.table("dadosq1.txt", h=TRUE)
str(tecmix)
## 'data.frame': 16 obs. of 2 variables:
## $ Tec : Factor w/ 4 levels "Tec1","Tec2",..: 1 1 1 1 2 2 2 2 3 3 ...
## $ Tracao: int 3129 3000 2865 2890 3200 3300 2975 3150 2800 2900 ...
tecmix
## Tec Tracao
## 1 Tec1 3129
## 2 Tec1 3000
## 3 Tec1 2865
## 4 Tec1 2890
## 5 Tec2 3200
## 6 Tec2 3300
## 7 Tec2 2975
## 8 Tec2 3150
## 9 Tec3 2800
## 10 Tec3 2900
## 11 Tec3 2985
## 12 Tec3 3050
## 13 Tec4 2600
## 14 Tec4 2700
## 15 Tec4 2600
## 16 Tec4 2765
#pacotes de dados
library(asbio)
## Warning: package 'asbio' was built under R version 3.1.3
## Loading required package: tcltk
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.1.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.1.3
library(doBy)
## Warning: package 'doBy' was built under R version 3.1.3
## Loading required package: survival
## Warning: package 'survival' was built under R version 3.1.3
(a) Teste a hipótese de que as técnicas de mistura afetam a resistência a tração. Use α = 5%.
H0: As técnicas de mistura utilizadas apresentam médias de resistência a tração do cimento semelhantes;
Ha: Existe pelo menos uma técnica de mistura que apresenta média de resistência a tração do cimento diferente;
Estimação do modelo linear
modtecmix <- aov(Tracao~Tec,data = tecmix)
summary (modtecmix)
## Df Sum Sq Mean Sq F value Pr(>F)
## Tec 3 489740 163247 12.73 0.000489 ***
## Residuals 12 153908 12826
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Considerações Considerando que Pr(>F) < 0,05, a hipótese nula H0 foi rejeitada, uma vez que existe pelo menos uma técnica de mistura que leva à uma média de resistência à tração do cimento diferente das outras utilizadas. As técnicas de mistura utilizadas afetam a resistência à tração do cimento.
(b) Use o teste da diferença mininma significativa de Fisher com correção de bonferroni para fazer comparações entre os pares de médias.
test1 = LSD.test (modtecmix, "Tec", p.adj="bon", console=TRUE)
##
## Study: modtecmix ~ "Tec"
##
## LSD t Test for Tracao
## P value adjustment method: bonferroni
##
## Mean Square Error: 12825.69
##
## Tec, means and individual ( 95 %) CI
##
## Tracao std r LCL UCL Min Max
## Tec1 2971.00 120.55704 4 2847.624 3094.376 2865 3129
## Tec2 3156.25 135.97641 4 3032.874 3279.626 2975 3300
## Tec3 2933.75 108.27242 4 2810.374 3057.126 2800 3050
## Tec4 2666.25 80.97067 4 2542.874 2789.626 2600 2765
##
## alpha: 0.05 ; Df Error: 12
## Critical Value of t: 3.152681
##
## Least Significant Difference 252.4675
## Means with the same letter are not significantly different.
##
## Groups, Treatments and means
## a Tec2 3156
## a Tec1 2971
## a Tec3 2934
## b Tec4 2666
bar.group(test1$groups, ylim=c(0,3800), col="pink")
Considerações
De acordo com o teste de Fisher, utilizando 5% de probabilidade, as médias com a mesma letra não diferem entre si. Desta forma, é possível considerar semelhantes as técnicas de mistura 1, 2 e 3, já que possuem as médias de resistência à tração do cimento semelhantes entre si.
(c) Construa um gráfico quantil-quantil dos resíduos do modelo. Quais as conclusões sobre a validade da hipótese de normalidade?
#grafico qqnorm
plot (modtecmix, which=2)
Considerações
De acordo com o gráfico Normal qqplot, foi possível observar que os pontos do gráfico que correspondem aos resíduos do modelo apresentam comportamento semelhante à reta, atestando distribuição normal.
#Residuos x Valores previstos = verificando o ajuste do modelo
plot (modtecmix, which=1)
*Considerações**
Considerando o comportamento de distribuição, os valores apresentam resíduos com variância aparentemente homogênea, atestando bom ajuste de modelo, uma vez que os valores estão flutuando entorno de zero.
(c)Relate as conclusões finais do experimento.
As técnicas de mistura utilizadas apresentaram diferenças na resistência de tração do cimento, sendo que as técnicas 1, 2 e 3 não diferiram estatisticamente à 5% de probabilidade pelo teste de Fisher, comprovado pelos maiores valores de resistência à tração apresentados.Já a técnica 4 se diferenciou estatisticamente, apresentando menores valores de resistência à tração, comprovado pelo teste de Fisher com correção de bonferroni. Assim, a hipótese Ha foi confirmada, ou seja, existe pelo menos uma técnica de mistura que apresenta média de resistência a tração do cimento diferente,devendo-se utilizar as técnicas 1, 2 ou 3 para obter maior resistência, e não utilizar a 4, uma vez que apresenta menos resistência.
QUESTÃO 02 Um fabricante de ligas de alumínio produz refinadores de grãos em forma de lingote. A empresa produz usando em quatro fornos. Cada forno é conhecido por ter características operacionais únicas, portanto, qualquer experimento executado na fundição que envolva mais de um forno, irá considerá-los como um fator de perturbação. Os engenheiros responsáveis pelo processo de produção suspeitam que a velocidade de agitação afeta o tamanho de grão do produto. Cada forno pode ser executado em quatro taxas de agitação diferentes. Um delineamento em blocos aleatorizados foi para um refinador particular e o tamanho do grão resultante é exibido no quadro abaixo:
(a) Há alguma evidência de que as taxas de agitação afetam o tamanho do grão?
Dados de entrada
refingr <- read.table("dadosq2.txt", h=T)
# Boxplot: y x rpm
ggplot (refingr, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ()
## Boxplot: y x forno
ggplot (refingr, aes(x=Forno, y=y, fill=Forno)) + geom_boxplot ( )
interaction.plot (refingr$rpm, refingr$Forno, refingr$y, fixed=TRUE)
De acordo com os gráficos, foi possível perceber que quanto maior a rotação maior a variabilidade do tamanho dos grãos. Ainda, há uma relação de interação entre os valores de F2, F3, F4. Com isso, rejeita-se a hipótese nula de que não há interação, uma vez que H0 é diferente de zero.
Em relação ao refinamento, O Forno 1 é discrepante em relação aos demais, como demonstrado no gráfico yxforno.
(b) Faça os gráficos apropriados e execute testes para verificar a normalidade e homogeneidade de variância dos resíduos. Comente os resultados.
mdbca <- aov (y~rpm + Forno, data = refingr)
summary (mdbca)
## Df Sum Sq Mean Sq F value Pr(>F)
## rpm 3 22.19 7.40 0.853 0.4995
## Forno 3 165.19 55.06 6.348 0.0133 *
## Residuals 9 78.06 8.67
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Analise Grafica da Normalidade e Homogeneidade das Variâncias
plot (mdbca, which=1) #Residudos x Valores previstos
plot (mdbca, which=2) # grafico qqplot
# Teste de Shapiro Wilks
shapiro.test (mdbca$residuals)
##
## Shapiro-Wilk normality test
##
## data: mdbca$residuals
## W = 0.9301, p-value = 0.2447
Considerações
Pelo gráfico de resíduos x valores previstos, nota-se que em geral os pontos se distribuem aleatoriamente em torno de zero e não muito distante deste, com exceção do ponto 1 que por não ter outros pontos na mesma região acima de zero acaba exercendo maior força na linha de tendência de homogeneidade de residuos, porém, ainda assim, é plausivel considerar um bom ajuste do modelo, pois apenas este ponto está destoando dos demais. O teste de Bartlett não é executado pois são necessárias pelo menos 2 observações em cada bloco.
Segundo o teste ANAVA,a hipótese nula (H0) não pode ser rejeitada, uma vez que as taxas de rotação não interferem no tamanho dos grãos, de acordo com o valor observado em pr>F (49,9%). Ainda, o p-value (24%) confirma normalidade entre a distribuição dos dados de resíduos, como demonstrado no teste de normalidade de Shapiro-wilks.
Pelo gráfico Normal qqplot observa-se que os pontos no gráfico (resíduos do modelo) tendem a seguir a reta padrão; alguns pontos como o 1 e 15 afastam-se um pouco da reta, porém não afetam o comportamento geral da distribuição, sendo plausível considerar que os resíduos do modelo seguem uma distribuição normal.
Questão 3: Um engenheiro está tentando otimizar a produção de um processo químico. Ele avaliou que as duas variáveis mais importantes foram a temperatura e a pressão do processo. Três níveis de cada fator foram selecionados e um experimento fatorial com duas repetições foi executado. Os dados foram os seguintes:
(a) Analise os dados do experimento e tire as conclusões apropriadas. Use alpha = 5%.
#Importando os dados
pqui <- read.table("dadosq3.txt",h=TRUE)
#Verificando os dados
str(pqui)
## 'data.frame': 18 obs. of 3 variables:
## $ y : num 90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
## $ press: int 200 200 215 215 230 230 200 200 215 215 ...
## $ temp : int 150 150 150 150 150 150 160 160 160 160 ...
summary(pqui)
## y press temp
## Min. :89.90 Min. :200 Min. :150
## 1st Qu.:90.20 1st Qu.:200 1st Qu.:150
## Median :90.40 Median :215 Median :160
## Mean :90.41 Mean :215 Mean :160
## 3rd Qu.:90.60 3rd Qu.:230 3rd Qu.:170
## Max. :90.90 Max. :230 Max. :170
pqui
## y press temp
## 1 90.4 200 150
## 2 90.2 200 150
## 3 90.7 215 150
## 4 90.6 215 150
## 5 90.2 230 150
## 6 90.4 230 150
## 7 90.1 200 160
## 8 90.3 200 160
## 9 90.5 215 160
## 10 90.6 215 160
## 11 89.9 230 160
## 12 90.1 230 160
## 13 90.5 200 170
## 14 90.7 200 170
## 15 90.8 215 170
## 16 90.9 215 170
## 17 90.4 230 170
## 18 90.1 230 170
#Convertendo Pressão e Temperatura para Fatores
pqui$press <-as.factor (pqui$press)
pqui$temp <-as.factor (pqui$temp)
#Conferindo
str(pqui)
## 'data.frame': 18 obs. of 3 variables:
## $ y : num 90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
## $ press: Factor w/ 3 levels "200","215","230": 1 1 2 2 3 3 1 1 2 2 ...
## $ temp : Factor w/ 3 levels "150","160","170": 1 1 1 1 1 1 2 2 2 2 ...
# Análise Gráfica dos Dados
interaction.plot(pqui$press,pqui$temp,pqui$y,type="b",pch=19,fixed=T,xlab="Pressão(psig)",ylab="Resultados"
#Estimação do Modelo:
pqui.aov<-aov(y~press*temp,data=pqui)
#Tabela da ANAVA
summary(pqui.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## press 2 0.7678 0.3839 21.594 0.000367 ***
## temp 2 0.3011 0.1506 8.469 0.008539 **
## press:temp 4 0.0689 0.0172 0.969 0.470006
## Residuals 9 0.1600 0.0178
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Considerações
Qualquer condição em relação à combinação de temperatura e pressão não afetam na eficiência do processo, uma vez que pr>F apresenta valores acima de 5% (47%) em relação ao nível de significância. Portanto, a hipótese nula não é rejeitada, já que quaisquer valores de pressão e temperatura apresentarão semelhança nos resultados de eficiência.
(b) Analise os resíduos do modelo ajustado e comente sobre a adequação do modelo.
#Gráfico de residuos x valores previstos
plot(pqui.aov, which=1)
#Gráfico qq norm
plot(pqui.aov, which=2)
#Teste de Shapiro Wilks:
shapiro.test(pqui.aov$residuals)
##
## Shapiro-Wilk normality test
##
## data: pqui.aov$residuals
## W = 0.8737, p-value = 0.02046
#Teste de Fligner Killeen: H0: Variânciados resíduos é homogênea
fligner.test(y~interaction(press,temp),data=pqui)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: y by interaction(press, temp)
## Fligner-Killeen:med chi-squared = 14.8694, df = 8, p-value =
## 0.06174
Observações
Observando os testes reaLizados e os gráficos obtidos, pode-se inferir que não há um bom ajuste de modelo para a distribuição dos resíduos, uma vez que o gráfico qqnorm apresenta distribuição anormal. Ainda, o gráfico para distribuição de resíduos apresentou distribuição homogênea, inferindo sobre as variâncias. Segundo o teste de shapiro-wilks há a rejeição da hipótese nula, uma vez que p-value inferior a 5% (0,02%). Já o teste de flingner apresenta p-value acima de 5% (6,1%), o que infere sobre a não rejeição da hipótese nula. Assim, há uma forte evidência de que o modelo não é adequado, devido à discrepância dos resultados.
(c) Sob quais condições dos fatores analisados o engenheiro deveria recomendar a operação do processo?
#Gráfico dos Efeitos Pacote effects
library(effects)
## Warning: package 'effects' was built under R version 3.1.3
#Gráficos dos Efeitos R base
plot.design(y~press*temp,data=pqui)
#Gráfico de Efeitos
plot(allEffects(pqui.aov))
Considerações
O engenheiro deveria recomendar, para melhores resultados de eficiência, a execução do processo sob pressão de 215 psig, e temperaturas a 150 ou 170 graus celsius, o que pode ser inferido no gráfico de efeitos R base.