1.One way Anova

Décrire le jeu de données « ble.csv »

ble <- read.csv('ble.csv',header = T,stringsAsFactors = T,sep = ';')
head(ble,5)
##   parcelle variete phyto  rdt
## 1        1      V1  Avec 5652
## 2        2      V1  Avec 5583
## 3        3      V1  Avec 5612
## 4        4      V1  Avec 5735
## 5        5      V1  Avec 5704

Notre jeu de donnée est composé d’une variable quantitative le rendement, et de deux variable qualitatives que sont traitement phytosanitaire (phyto : Avec ou Sans) et la variété de blé (variét : V1, V2, V3, V4). Les parcelles c’est la population sur laquelle porte l’étude.

Définir la variable réponse et le ou les facteurs

La variable de réponse c’est le rendement et les facteurs ce sont les traitement phytosanitaire (phyto : Avec ou Sans) et la variété de blé (variét : V1, V2, V3, V4)

Boite à Moustache boxplot

J’utilise le package plotly pour avoir des graphes interactifs

#Appel de plotly
library(plotly)
boxFigure0 <-ble %>%  plot_ly(x=~variete,y=~rdt,type = 'box', boxpoints = 'outliers',boxmean =TRUE,color = ~variete) %>% 
  layout(xaxis = list(title = 'variete'))

boxFigure1 <-ble %>%  plot_ly(x=~phyto,y=~rdt,type = 'box', boxpoints = 'outliers',boxmean =TRUE , color = ~phyto) %>% 
  layout(xaxis = list(title = 'phyto'))

subplot(boxFigure0,boxFigure1,nrows = 2,titleX = T,margin = 0.1 ,titleY = T)

On peut déjà remarque qu’en moyenne, le rendement ne varie pas malgré le changement de modalité de la variable phyto. Donc cela laisse déduire que le traitement phytosanitaire n’a pas d’effet sur le rendement. Par ailleurs, pour la varieté, on voit une forte variation de la moyenne du rendement si on passe à une nouvelle variété. Donc la variété pourrait avoir un effet sur le rendement. L’anova nous en dira plus dans la suite !

Faire l’aov

OneWayAovPhyto <- aov(rdt~phyto,data = ble)
OneWayAovVariete <- aov(rdt~variete,data = ble)
"Pour phyto";summary(OneWayAovPhyto);"-----";"Pour Variete";summary(OneWayAovVariete)  
## [1] "Pour phyto"
##             Df  Sum Sq Mean Sq F value Pr(>F)
## phyto        1    1008    1008   0.041  0.839
## Residuals   78 1902223   24387
## [1] "-----"
## [1] "Pour Variete"
##             Df  Sum Sq Mean Sq F value   Pr(>F)    
## variete      3  851845  283948   20.52 7.67e-10 ***
## Residuals   76 1051387   13834                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretation

Comme le laissaient paraitre les boxplots , à un seuil de 5% le facteur variete a un effet sur le rendement (car la p-value inférieure à 5% ) tandis que le facteur phyto n’a pas d’effet sur le rendement (car p-Value supérieure à 5%)

La fonction anova

modelPhyto = lm(rdt~phyto,data = ble)
modelVarite = lm(rdt~variete,data = ble)
anovaPhyto = anova(modelPhyto)
anovaVariete = anova(modelVarite)
"Pour Phyto";anovaPhyto;"Pour Variete";anovaVariete
## [1] "Pour Phyto"
## Analysis of Variance Table
## 
## Response: rdt
##           Df  Sum Sq Mean Sq F value Pr(>F)
## phyto      1    1008  1008.2  0.0413 0.8394
## Residuals 78 1902223 24387.5
## [1] "Pour Variete"
## Analysis of Variance Table
## 
## Response: rdt
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## variete    3  851845  283948  20.525 7.674e-10 ***
## Residuals 76 1051387   13834                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

On constate que le résultat est le même que celui de la fonction aov sauf que cette dernière est plus directe

2.Two way anova

Lecture des données

sec= read.csv2("sec.csv")
head(sec,3)
##   mpm sec mach
## 1  33  v1   v1
## 2  31  v2   v1
## 3  34  v3   v1

Valeur de I,J,K,N

I = 4; J=5; K=2 et N=40

Les Boxplots

#Appel de plotly
library(plotly)
#boxplot(sec,mpm)
boxFigure2 <-sec %>%  plot_ly(x=~sec,y=~mpm,type = 'box', boxpoints = 'outliers',boxmean =TRUE,color = ~sec ) 
#boxplot(mach,mpm)
boxFigure3 <-sec %>%  plot_ly(x=~mach,y=~mpm,type = 'box', boxpoints = 'outliers',boxmean =TRUE, color = ~mach) 

subplot(boxFigure2,boxFigure3,nrows = 2,titleX = T,titleY = T,margin = 0.1)

Anova

twoWayAov=aov(mpm~sec*mach,data=sec)
summary(twoWayAov)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## sec          4  36.15    9.04   3.476   0.0260 *  
## mach         3 128.10   42.70  16.423 1.28e-05 ***
## sec:mach    12  77.65    6.47   2.489   0.0345 *  
## Residuals   20  52.00    2.60                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

effet des facteurs séparements

On voit bien que les deux facteurs sec et mach ont un effet sur mpm car leurs p-value < 5%.

effet de l’interactions des facteurs

L’effet de l’interactions est significatif pour un seuil de 5% , donc on va la conserver.