ble <- read.csv('ble.csv',header = T,stringsAsFactors = T,sep = ';')
head(ble,5)
## parcelle variete phyto rdt
## 1 1 V1 Avec 5652
## 2 2 V1 Avec 5583
## 3 3 V1 Avec 5612
## 4 4 V1 Avec 5735
## 5 5 V1 Avec 5704
Notre jeu de donnée est composé d’une variable quantitative le rendement, et de deux variable qualitatives que sont traitement phytosanitaire (phyto : Avec ou Sans) et la variété de blé (variét : V1, V2, V3, V4). Les parcelles c’est la population sur laquelle porte l’étude.
La variable de réponse c’est le rendement et les facteurs ce sont les traitement phytosanitaire (phyto : Avec ou Sans) et la variété de blé (variét : V1, V2, V3, V4)
J’utilise le package plotly pour avoir des graphes interactifs
#Appel de plotly
library(plotly)
boxFigure0 <-ble %>% plot_ly(x=~variete,y=~rdt,type = 'box', boxpoints = 'outliers',boxmean =TRUE,color = ~variete) %>%
layout(xaxis = list(title = 'variete'))
boxFigure1 <-ble %>% plot_ly(x=~phyto,y=~rdt,type = 'box', boxpoints = 'outliers',boxmean =TRUE , color = ~phyto) %>%
layout(xaxis = list(title = 'phyto'))
subplot(boxFigure0,boxFigure1,nrows = 2,titleX = T,margin = 0.1 ,titleY = T)
On peut déjà remarque qu’en moyenne, le rendement ne varie pas malgré le changement de modalité de la variable phyto. Donc cela laisse déduire que le traitement phytosanitaire n’a pas d’effet sur le rendement. Par ailleurs, pour la varieté, on voit une forte variation de la moyenne du rendement si on passe à une nouvelle variété. Donc la variété pourrait avoir un effet sur le rendement. L’anova nous en dira plus dans la suite !
OneWayAovPhyto <- aov(rdt~phyto,data = ble)
OneWayAovVariete <- aov(rdt~variete,data = ble)
"Pour phyto";summary(OneWayAovPhyto);"-----";"Pour Variete";summary(OneWayAovVariete)
## [1] "Pour phyto"
## Df Sum Sq Mean Sq F value Pr(>F)
## phyto 1 1008 1008 0.041 0.839
## Residuals 78 1902223 24387
## [1] "-----"
## [1] "Pour Variete"
## Df Sum Sq Mean Sq F value Pr(>F)
## variete 3 851845 283948 20.52 7.67e-10 ***
## Residuals 76 1051387 13834
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Comme le laissaient paraitre les boxplots , à un seuil de 5% le facteur variete a un effet sur le rendement (car la p-value inférieure à 5% ) tandis que le facteur phyto n’a pas d’effet sur le rendement (car p-Value supérieure à 5%)
modelPhyto = lm(rdt~phyto,data = ble)
modelVarite = lm(rdt~variete,data = ble)
anovaPhyto = anova(modelPhyto)
anovaVariete = anova(modelVarite)
"Pour Phyto";anovaPhyto;"Pour Variete";anovaVariete
## [1] "Pour Phyto"
## Analysis of Variance Table
##
## Response: rdt
## Df Sum Sq Mean Sq F value Pr(>F)
## phyto 1 1008 1008.2 0.0413 0.8394
## Residuals 78 1902223 24387.5
## [1] "Pour Variete"
## Analysis of Variance Table
##
## Response: rdt
## Df Sum Sq Mean Sq F value Pr(>F)
## variete 3 851845 283948 20.525 7.674e-10 ***
## Residuals 76 1051387 13834
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
On constate que le résultat est le même que celui de la fonction aov sauf que cette dernière est plus directe
Lecture des données
sec= read.csv2("sec.csv")
head(sec,3)
## mpm sec mach
## 1 33 v1 v1
## 2 31 v2 v1
## 3 34 v3 v1
I = 4; J=5; K=2 et N=40
#Appel de plotly
library(plotly)
#boxplot(sec,mpm)
boxFigure2 <-sec %>% plot_ly(x=~sec,y=~mpm,type = 'box', boxpoints = 'outliers',boxmean =TRUE,color = ~sec )
#boxplot(mach,mpm)
boxFigure3 <-sec %>% plot_ly(x=~mach,y=~mpm,type = 'box', boxpoints = 'outliers',boxmean =TRUE, color = ~mach)
subplot(boxFigure2,boxFigure3,nrows = 2,titleX = T,titleY = T,margin = 0.1)
twoWayAov=aov(mpm~sec*mach,data=sec)
summary(twoWayAov)
## Df Sum Sq Mean Sq F value Pr(>F)
## sec 4 36.15 9.04 3.476 0.0260 *
## mach 3 128.10 42.70 16.423 1.28e-05 ***
## sec:mach 12 77.65 6.47 2.489 0.0345 *
## Residuals 20 52.00 2.60
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
On voit bien que les deux facteurs sec et mach ont un effet sur mpm car leurs p-value < 5%.
L’effet de l’interactions est significatif pour un seuil de 5% , donc on va la conserver.