Plans d’expériences


Slides de présentation

La démarche statistique

la manière dont est menée l’expérience est essentielle pour que les résultats soient valides et traitables :

  • On se place dans le cadre d’un test triangulaire avec produits A, A, B.
  • il faut bien mettre des numéros différents sur les produits, à part si les juges sont totalement isolés.
  • Il faut absolument construire un modèle expérimentale, dans le cas de notre expérience, basé sur une loi binomiale. Cette loi s’explique comme suit et suit les probas suivantes:
  • Le juge perçoit la différence et coche la bonne case: \(P_r=1\)
    • Le juge ne perçoit pas la différence \((1-Pr)\), mais coche la bonne case: \(p=1/3\)
    • Le juge ne perçoit pas la différence et coche la mauvaise case: \(p=2/3\)

Le modèle est un modèle binomial \(B(75,p)\):

  • \(p(NRC=k) = C_{75}^{k}*p^k(1-p)^{(75-k)}\)
  • On a \(p=1/3+2/3*P_r\)
  • Dans le modèle se trouve Pr que l’on cherche
  • Pour faire notre étude, il faut faire des hypothèses que l’on teste: \(H_0\).

L’ennui là dedans, c’est que dans la realité, on a des contraintes dont le nombre peut vite devenir très élevé: contraintes de coût, de temps, d’organisation.

Les plans permettent de gagner du temps, d’avoir des résultats solides, et de se simplifier la vie.

Les Dangers !

  • La confusion d’effets: ne pas confondre l’effet juge et l’effet produit en faisant déguster les mêmes produits aux mêmes personnes. On ne peut pas expliquer les choses par la suite !
  • Ne jamais étudier les facteurs un à un car on oublie les interactions !! ex: Couple txt°C. Il faut prendre en compte la multidimmensionnalité des choses, on a souvent des surfaces de réponses plutôt que des plans !
  • Les plans sont ultra efficaces, mais jamais intuitifs ! (exemple du réglage d’une balance de Roberval)
  • Le danger des dogmes, exemple de la reglin simple:
    \(y=a+b*x+\varepsilon\). La précision de la réponse du modèle au point au point x est calculable à priori \(Var(\bar\beta)\).
  • On peut améliorer la précision des paramètres de 2 manières: - Placer les points expérimentaux aux bords du modèle (avec un point au milieu souvent, qui ne sert à rien d’ailleurs. - Augmenter ne nombre d’expérimentations, mais jusqu’à un certain point (ne pas perdre de l’énergie pour qlq centièmes de précision gagnée): (1+1/n)=1.1 pour n=10 et (1+1/n)=1.01 pour n=100. on gagne 0.09 pour 90 expériences en plus !!!! INUTILE.

Modèle linéaire

  • Corrélation entre paramètres et leurs précisions sont prévisibles à l’avance et dépendent de la structure expérimentale.
  • Un bon plan minimise la matrice \((X'X)^{-1}\)

Comme il n’existe pas de théorie génerale des contraintes, il n’existe pas de théorie génerale des plans d’experience On choisit ses plans en fonction des objectifs et des contraites particuliers.

Plans utiles en IAA

Plans factoriels complets

Inventés par le Grand Fischer.
Toutes les combinaisons sont testées, le nombre d’XP est donc égal au produit des nombres des niveaux.
On peut ensuite développer un modèle d’ANOVA là dessus.

Notion de ddl extrêmement importante, on imagine une table avec n jetons (n le nb d’expériences qu’on a fait). chaque paramètre calculé coute un jeton.

CONSTAT: difficulté à interpréter les interactions d’ordre élevé, IDEE: en profiter pour minimiser le nombre d’effets DANGER: confondre des effets. -> Les Plans fractionnels

Plans Fractionnels

Matrice de Hadamard

Pour chacun des facteurs, on prend deux niveau + et -.
On obtient ainsi une matrice de Hadamard.
On peut ainsi étudier 7 facteurs en 8 essais alors qu’il faudrait 128 xp en mode complet.
Cette matrice se construit à partir de la première ligne seulement, elle est construite par permutations circulaires, on avance vers la droite. C’est basé sur des générateurs d’effets, et cette matrice a des propriétés remarquables:

  • La matrice est équilibrée pour chaque facteur (4+ et 4-)
  • Les colonnes et les lignes sont orthogonales 2 à 2, le produit scalaire 2 à 2 est nul: Il n’y a aucune confusion d’effets.
  • On fait les expériences et récupère les y, qui permettent de calculer les coefficients des effets, et de les classer par valeur absolue croissante. On obtient ainsi un ordre d’importance des effets.

Attention, cela suppose la linéarité, ou du moins la monotonie (croissant ou décroissant). Une réponse du type quadratique (parabole…) ne sera pas bien appréhendée.

  • Le nombre d’expérience est toujours un multiple de 4, du fait de la contrainte d’équilibre (mêmes nombres de + et de -).
  • Le nombre d’expériences est égal au nombre de facteurs +1.
  • Quand on passe à un plan fractionnel, on commence par confondre ABC avec un 4eme facteur D. Par contre, à partir de ce moment là, on ne peut plus interpréter les interactions d’ordre 2 du fait des interactions qui découlent de cela !

Plans fractionnés \(3^{p-k} = n\) (3 niveaux)

  • On construit d’abord un plan complet à 2 facteurs, orthogonal donc.
  • On se sert ensuite des carrés latins 3x3:

1,2,3
3,2,1
3,1,2

ET

1,2,3
3,1,2
2,2,1

DONNE

11,22,33
23,31,12
32,13,21

On a toujours interêt à prendre le même nombre de niveau pour tous les facteurs. Ce nombre doit être adapté aux facteurs:

5 facteurs à 3 niveaux = 27 essais
5 facteurs à 4 niveaux = 16 essais

Savoir faire

  • On optimise le nombre d’essais en adaptant le nombre de facteurs.
  • Si on a 6 effets à tester, on prend la matrice de Hadamard à 8 essais entière puis on supprime la ligne qui nous arrange.

Les plans CENTRAL COMPOSITE

  • Objectif: trouver un optimum
  • Propriétés optimales d’estimation des interactions.

Propriétés: * Points sur les bords du domaines, disposés en étoile sur un cercle avec 2 points centraux (valeur = moyenne):

  • \(2^p\) points de l’hypercube
  • \(2p\) points du parallèlotope étoilé
  • 2 points centraux
  • On a ainsi \(n=2p+2p+2\) essais au total

Modèle quadratique !

Pour chacun des facteurs lors de la construction du plan, il suffit de choisir le min et le max. Tout s’enchaîne ensuite comme suit :

On suppose le cas à 2 facteurs

  • valeur mini: min
  • 1ere valeur intermédiaire: V2
  • valeur moyenne: moyenne
  • 2eme valeur int: V4
  • valeur max: max

\(V_2=moy-\sqrt{2}/2\) (moyenne - min)
\(V_4=moy+\sqrt{2}/2\) (moyenne - min)

Chaque facteur est utilisé à 5 niveaux différents.

Cas à plus de facteur (p) :

Hypercube avec des points qui sortent avec:

\(V_2=moy-\sqrt{p}/p\) (moyenne - min)

Il faut dessiner la surface ! mais attention !! il faut parfois transformer sa réponse pour avoir un optimum sensé ! ce n’est pas la valeur de la derivée en tant que tel qui compte, mais la valeur dans un domaine.

On imagine 12 facteurs à optimiser avec 5 facteurs experimentaux que l’on fait varier (caractéristiques de rondelles de pommes traitées en deshydratation par immersion dans un sirop sucré):

Plans de BOX BENHKEN

  • facteurs à 3 niveaux: moy, min, max.
  • nombre d’expériences égal à \(2p^2-2p+2\)
  • Il est un peu moins mathématiquement optimal que le Composite, car on ne peux pas tester le modèle (pas de ddl pour la résiduelle)
  • On le prend plutôt pour l’étude de 6 et 7 facteurs. En dessous, on fait du composite. en comparaison, pour 7 essais, on passe à 86 essais en BB au lieu de 144 pour un composite.

Plans de mélange / Mixture design

Réseau Simplex Centre de Scheffé:

  • On se situe en 3D, dans un plan representé par un triangle. On a 3 produits. ça se fait en 7 essais.
  • On ajuste un modèle sans constante.
  • On n’estime pas les termes carrés non plus
  • le modèle qu’on ajuste a 6 paramètres

ex: optimisation d’un vin par mélange de cépages. Attention, on est ici dans le cas de plans de type I dits sans contraintes. En effet, on peut mettre un seul vin, ça reste du vin. Si on pense à un exemple de pâte à choux, mettre de l’oeuf seul, de la farine seule ou un sucre seuls conduit à une abérrance

Plans avec contrainte

Plans de type III: Les contraintes, pas forcément orthogonaux génèrent un polyèdre, On prend alors les sommets. celà se fait via un algorithme comme FEDOROV ou MITCHELL. Type IV: Ingrédient majoritaire, dont on se débarasse pour faire un composite centré avec les ingrédients d’intérêt.

Attention, la D-Optimalité n’est pas suffisante. Elle est dans le cas de plans dicrets différente des autres optimalité comme la G-Opt.


Blocs incomplets équilibrés:

  • p produits étudiés avec un panel de
  • s sujets
  • k est le nombre de produits testés par chaque sujet
  • r est le nb de répetitions par produits (nombre de sujets testant un produit donnée)
  • \(\lambda\) est le nombre de fois où un couple de produits est noté (nb de sujets testant simultanément 2 produits différens)

On a alors 2 manière de compter le nombre de résultats: (1) \(p.r=s.k\)
(2) \(\lambda=\frac{r.(k-1)}{p-1}\) Ces 2 conditions sont nécessaires, mais pas forcément suffisantes.

Pour un plan incomplet, selon ses paramètres, on a 3 possibilités:

  • Le plan existe (COOL!)
  • Le plan n’existe pas, car on l’a demontré
  • On ne sait pas !

Il faut utiliser un des plans existants.

Ils sont construits par des lois uniformes ou par des carrés latins orthogonaux.
Un BIE simplifié reste un BIE.
Le traitement statistique est important.

Carrés latins de Williams

10 produits à faire tester, on fait des permutations circulaires sur les colonnes. > E est le coefficient d’efficacité avec \(E=\frac{p(k-1)}{k(p-1)}\)