title: ‘Exame 2: Análise de Dados’ author: “Fernanda Raggi” date: “Saturday, May 30, 2015” output: html_document —

QUESTÃO 01 - A resistência à tração de um determinado tipo de cimento está sendo analisada. Quatro técnicas de mistura possuem viabilidade econcômica para serem utilizadas. Os seguintes dados foram coletados:

tabq1

#Diretório

setwd("G:\\Fernanda")

#importando os dados

tecmix = read.table("dadosq1.txt", h=TRUE)

str(tecmix)
## 'data.frame':    16 obs. of  2 variables:
##  $ Tec   : Factor w/ 4 levels "Tec1","Tec2",..: 1 1 1 1 2 2 2 2 3 3 ...
##  $ Tracao: int  3129 3000 2865 2890 3200 3300 2975 3150 2800 2900 ...
tecmix
##     Tec Tracao
## 1  Tec1   3129
## 2  Tec1   3000
## 3  Tec1   2865
## 4  Tec1   2890
## 5  Tec2   3200
## 6  Tec2   3300
## 7  Tec2   2975
## 8  Tec2   3150
## 9  Tec3   2800
## 10 Tec3   2900
## 11 Tec3   2985
## 12 Tec3   3050
## 13 Tec4   2600
## 14 Tec4   2700
## 15 Tec4   2600
## 16 Tec4   2765
#pacotes de dados

library(asbio)
## Warning: package 'asbio' was built under R version 3.1.3
## Loading required package: tcltk
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.1.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.1.3
library(doBy)
## Warning: package 'doBy' was built under R version 3.1.3
## Loading required package: survival
## Warning: package 'survival' was built under R version 3.1.3

(a) Teste a hipótese de que as técnicas de mistura afetam a resistência a tração. Use α = 5%.

H0: As técnicas de mistura utilizadas apresentam médias de resistência a tração do cimento semelhantes;

Ha: Existe pelo menos uma técnica de mistura que apresenta média de resistência a tração do cimento diferente;

Estimação do modelo linear

modtecmix  <-  aov(Tracao~Tec,data = tecmix)
summary (modtecmix)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Tec          3 489740  163247   12.73 0.000489 ***
## Residuals   12 153908   12826                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Considerações Considerando que Pr(>F) < 0,05, a hipótese nula H0 foi rejeitada, uma vez que existe pelo menos uma técnica de mistura que leva à uma média de resistência à tração do cimento diferente das outras utilizadas. As técnicas de mistura utilizadas afetam a resistência à tração do cimento.

(b) Use o teste da diferença mininma significativa de Fisher com correção de bonferroni para fazer comparações entre os pares de médias.

test1 = LSD.test (modtecmix, "Tec", p.adj="bon", console=TRUE)
## 
## Study: modtecmix ~ "Tec"
## 
## LSD t Test for Tracao 
## P value adjustment method: bonferroni 
## 
## Mean Square Error:  12825.69 
## 
## Tec,  means and individual ( 95 %) CI
## 
##       Tracao       std r      LCL      UCL  Min  Max
## Tec1 2971.00 120.55704 4 2847.624 3094.376 2865 3129
## Tec2 3156.25 135.97641 4 3032.874 3279.626 2975 3300
## Tec3 2933.75 108.27242 4 2810.374 3057.126 2800 3050
## Tec4 2666.25  80.97067 4 2542.874 2789.626 2600 2765
## 
## alpha: 0.05 ; Df Error: 12
## Critical Value of t: 3.152681 
## 
## Least Significant Difference 252.4675
## Means with the same letter are not significantly different.
## 
## Groups, Treatments and means
## a     Tec2    3156 
## a     Tec1    2971 
## a     Tec3    2934 
## b     Tec4    2666
bar.group(test1$groups, ylim=c(0,3800), col="pink")

Considerações

De acordo com o teste de Fisher, utilizando 5% de probabilidade, as médias com a mesma letra não diferem entre si. Desta forma, é possível considerar semelhantes as técnicas de mistura 1, 2 e 3, já que possuem as médias de resistência à tração do cimento semelhantes entre si.

(c) Construa um gráfico quantil-quantil dos resíduos do modelo. Quais as conclusões sobre a validade da hipótese de normalidade?

#grafico qqnorm
plot (modtecmix, which=2) 

Considerações

De acordo com o gráfico Normal qqplot, foi possível observar que os pontos do gráfico que correspondem aos resíduos do modelo apresentam comportamento semelhante à reta, atestando distribuição normal.

  1. Faça um gráfico dos resíduos contra os valores previstos pelo modelo e comente o resultado.
#Residuos x Valores previstos = verificando o ajuste do modelo
plot (modtecmix, which=1) 

*Considerações**

Considerando o comportamento de distribuição, os valores apresentam resíduos com variância aparentemente homogênea, atestando bom ajuste de modelo, uma vez que os valores estão flutuando entorno de zero.

(c)Relate as conclusões finais do experimento.

As técnicas de mistura utilizadas apresentaram diferenças na resistência de tração do cimento, sendo que as técnicas 1, 2 e 3 não diferiram estatisticamente à 5% de probabilidade pelo teste de Fisher, comprovado pelos maiores valores de resistência à tração apresentados.Já a técnica 4 se diferenciou estatisticamente, apresentando menores valores de resistência à tração, comprovado pelo teste de Fisher com correção de bonferroni. Assim, a hipótese Ha foi confirmada, ou seja, existe pelo menos uma técnica de mistura que apresenta média de resistência a tração do cimento diferente,devendo-se utilizar as técnicas 1, 2 ou 3 para obter maior resistência, e não utilizar a 4, uma vez que apresenta menos resistência.

QUESTÃO 02 Um fabricante de ligas de alumínio produz refinadores de grãos em forma de lingote. A empresa produz usando em quatro fornos. Cada forno é conhecido por ter características operacionais únicas, portanto, qualquer experimento executado na fundição que envolva mais de um forno, irá considerá-los como um fator de perturbação. Os engenheiros responsáveis pelo processo de produção suspeitam que a velocidade de agitação afeta o tamanho de grão do produto. Cada forno pode ser executado em quatro taxas de agitação diferentes. Um delineamento em blocos aleatorizados foi para um refinador particular e o tamanho do grão resultante é exibido no quadro abaixo:

tabq2

(a) Há alguma evidência de que as taxas de agitação afetam o tamanho do grão?

Dados de entrada

refingr  <- read.table("dadosq2.txt", h=T)

# Boxplot: y x rpm
ggplot (refingr, aes(x=rpm, y=y, fill=rpm)) + geom_boxplot ()

## Boxplot: y x forno
ggplot (refingr, aes(x=Forno, y=y, fill=Forno)) + geom_boxplot ( )

interaction.plot (refingr$rpm, refingr$Forno, refingr$y, fixed=TRUE)

Considerações**

De acordo com os gráficos, foi possível perceber que quanto maior a rotação maior a variabilidade do tamanho dos grãos. Ainda, há uma relação de interação entre os valores de F2, F3, F4. Com isso, rejeita-se a hipótese nula de que não há interação, uma vez que H0 é diferente de zero.

Em relação ao refinamento, O Forno 1 é discrepante em relação aos demais, como demonstrado no gráfico yxforno.

(b) Faça os gráficos apropriados e execute testes para verificar a normalidade e homogeneidade de variância dos resíduos. Comente os resultados.

Estimacao do Modelo com blocagem dos fornos

mdbca  <- aov (y~rpm + Forno, data = refingr)
summary (mdbca)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## rpm          3  22.19    7.40   0.853 0.4995  
## Forno        3 165.19   55.06   6.348 0.0133 *
## Residuals    9  78.06    8.67                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Analise Grafica da Normalidade e Homogeneidade das Variâncias

plot (mdbca, which=1) #Residudos x Valores previstos

plot (mdbca, which=2) # grafico qqplot

# Teste de Shapiro Wilks
shapiro.test (mdbca$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  mdbca$residuals
## W = 0.9301, p-value = 0.2447

Considerações

Pelo gráfico de resíduos x valores previstos, nota-se que em geral os pontos se distribuem aleatoriamente em torno de zero e não muito distante deste, com exceção do ponto 1 que por não ter outros pontos na mesma região acima de zero acaba exercendo maior força na linha de tendência de homogeneidade de residuos, porém, ainda assim, é plausivel considerar um bom ajuste do modelo, pois apenas este ponto está destoando dos demais. O teste de Bartlett não é executado pois são necessárias pelo menos 2 observações em cada bloco.

Segundo o teste ANAVA,a hipótese nula (H0) não pode ser rejeitada, uma vez que as taxas de rotação não interferem no tamanho dos grãos, de acordo com o valor observado em pr>F (49,9%). Ainda, o p-value (24%) confirma normalidade entre a distribuição dos dados de resíduos, como demonstrado no teste de normalidade de Shapiro-wilks.

Pelo gráfico Normal qqplot observa-se que os pontos no gráfico (resíduos do modelo) tendem a seguir a reta padrão; alguns pontos como o 1 e 15 afastam-se um pouco da reta, porém não afetam o comportamento geral da distribuição, sendo plausível considerar que os resíduos do modelo seguem uma distribuição normal.

Questão 3: Um engenheiro está tentando otimizar a produção de um processo químico. Ele avaliou que as duas variáveis mais importantes foram a temperatura e a pressão do processo. Três níveis de cada fator foram selecionados e um experimento fatorial com duas repetições foi executado. Os dados foram os seguintes:

tabq3

(a) Analise os dados do experimento e tire as conclusões apropriadas. Use alpha = 5%.

#Importando os dados
pqui <- read.table("dadosq3.txt",h=TRUE)

#Verificando os dados
str(pqui)
## 'data.frame':    18 obs. of  3 variables:
##  $ y    : num  90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
##  $ press: int  200 200 215 215 230 230 200 200 215 215 ...
##  $ temp : int  150 150 150 150 150 150 160 160 160 160 ...
summary(pqui)
##        y             press          temp    
##  Min.   :89.90   Min.   :200   Min.   :150  
##  1st Qu.:90.20   1st Qu.:200   1st Qu.:150  
##  Median :90.40   Median :215   Median :160  
##  Mean   :90.41   Mean   :215   Mean   :160  
##  3rd Qu.:90.60   3rd Qu.:230   3rd Qu.:170  
##  Max.   :90.90   Max.   :230   Max.   :170
pqui
##       y press temp
## 1  90.4   200  150
## 2  90.2   200  150
## 3  90.7   215  150
## 4  90.6   215  150
## 5  90.2   230  150
## 6  90.4   230  150
## 7  90.1   200  160
## 8  90.3   200  160
## 9  90.5   215  160
## 10 90.6   215  160
## 11 89.9   230  160
## 12 90.1   230  160
## 13 90.5   200  170
## 14 90.7   200  170
## 15 90.8   215  170
## 16 90.9   215  170
## 17 90.4   230  170
## 18 90.1   230  170
#Convertendo Pressão e Temperatura para Fatores
pqui$press <-as.factor (pqui$press)
pqui$temp <-as.factor (pqui$temp)

#Conferindo
str(pqui)
## 'data.frame':    18 obs. of  3 variables:
##  $ y    : num  90.4 90.2 90.7 90.6 90.2 90.4 90.1 90.3 90.5 90.6 ...
##  $ press: Factor w/ 3 levels "200","215","230": 1 1 2 2 3 3 1 1 2 2 ...
##  $ temp : Factor w/ 3 levels "150","160","170": 1 1 1 1 1 1 2 2 2 2 ...
# Análise Gráfica dos Dados
interaction.plot(pqui$press,pqui$temp,pqui$y,type="b",pch=19,fixed=T,xlab="Pressão(psig)",ylab="Resultados"

#Estimação do Modelo:
pqui.aov<-aov(y~press*temp,data=pqui)

#Tabela da ANAVA
summary(pqui.aov)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## press        2 0.7678  0.3839  21.594 0.000367 ***
## temp         2 0.3011  0.1506   8.469 0.008539 ** 
## press:temp   4 0.0689  0.0172   0.969 0.470006    
## Residuals    9 0.1600  0.0178                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Considerações

Qualquer condição em relação à combinação de temperatura e pressão não afetam na eficiência do processo, uma vez que pr>F apresenta valores acima de 5% (47%) em relação ao nível de significância. Portanto, a hipótese nula não é rejeitada, já que quaisquer valores de pressão e temperatura apresentarão semelhança nos resultados de eficiência.

(b) Analise os resíduos do modelo ajustado e comente sobre a adequação do modelo.

#Gráfico de residuos x valores previstos
plot(pqui.aov, which=1) 

#Gráfico qq norm
plot(pqui.aov, which=2) 

#Teste de Shapiro Wilks: 
shapiro.test(pqui.aov$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  pqui.aov$residuals
## W = 0.8737, p-value = 0.02046
#Teste de Fligner Killeen: H0: Variânciados resíduos é homogênea
fligner.test(y~interaction(press,temp),data=pqui)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  y by interaction(press, temp)
## Fligner-Killeen:med chi-squared = 14.8694, df = 8, p-value =
## 0.06174

Observações

Observando os testes reaLizados e os gráficos obtidos, pode-se inferir que não há um bom ajuste de modelo para a distribuição dos resíduos, uma vez que o gráfico qqnorm apresenta distribuição anormal. Ainda, o gráfico para distribuição de resíduos apresentou distribuição homogênea, inferindo sobre as variâncias. Segundo o teste de shapiro-wilks há a rejeição da hipótese nula, uma vez que p-value inferior a 5% (0,02%). Já o teste de flingner apresenta p-value acima de 5% (6,1%), o que infere sobre a não rejeição da hipótese nula. Assim, há uma forte evidência de que o modelo não é adequado, devido à discrepância dos resultados.

(c) Sob quais condições dos fatores analisados o engenheiro deveria recomendar a operação do processo?

#Gráfico dos Efeitos Pacote effects
library(effects) 
## Warning: package 'effects' was built under R version 3.1.3
#Gráficos dos Efeitos R base
plot.design(y~press*temp,data=pqui)

#Gráfico de Efeitos
plot(allEffects(pqui.aov))

Considerações

O engenheiro deveria recomendar, para melhores resultados de eficiência, a execução do processo sob pressão de 215 psig, e temperaturas a 150 ou 170 graus celsius, o que pode ser inferido no gráfico de efeitos R base.