11 décembre 2017
Dans l’enquête Histoire de Vie (INSEE, 2003), on pose aux enquêté·e·s la question suivante :
« En dehors du cadre scolaire ou professionnel, au cours des 12 derniers mois, avez-vous pratiqué alors que vous n’y étiez pas obligé(e) […] la cuisine ? ».
En croisant cette variable avec le genre, on obtient le tableau suivant.
Non | Oui | Sum | |
---|---|---|---|
Homme | 629 | 270 | 899 |
Femme | 490 | 611 | 1101 |
Sum | 1119 | 881 | 2000 |
Quelles conclusions peut-on en tirer ?
Voici le même tableau, cette fois-ci en pourcentages en ligne :
Non | Oui | Total | |
---|---|---|---|
Homme | 69.97 | 30.03 | 100 |
Femme | 44.50 | 55.50 | 100 |
Ensemble | 55.95 | 44.05 | 100 |
Parmi les femmes, 44,5% déclarent ne pas avoir pratiqué la cuisine comme un loisir, soit 11 points de moins par rapport à l’ensemble (56%) et 26 points de moins par rapport aux hommes (70%).
Parmi les hommes, 30% déclarent avoir pratiqué la cuisine comme un loisir, soit 14 points de moins par rapport à l’ensemble (44%) et 25 points de moins par rapport aux femmes (55%).
Nous pouvons donc en conclure que, dans notre échantillon, les femmes déclarent nettement plus souvent pratiquer la cuisine comme loisir que les hommes.
En revanche, ce tableau ne nous permet pas d’affirmer :
En effet, il y a une différence importante entre :
Imaginons la situation suivante :
Non | Oui | Sum | |
---|---|---|---|
Homme | 629 | 270 | 899 |
Femme | 490 | 611 | 1101 |
Sum | 1119 | 881 | 2000 |
Non | Oui | Sum | |
---|---|---|---|
Homme | 629 | 784 | 1413 |
Femme | 490 | 611 | 1101 |
Sum | 1119 | 881 | 2514 |
Que s’est-il passé dans le processus d’échantillonnage ?
Lors de l’échantillonnage précédent, nous avons malheureusement ignoré 514 hommes… qui auraient tous déclaré pratiquer la cuisine comme loisir. Si nous avions eu accès à la population dans son ensemble, nous aurions constaté que les hommes et les femmes ont déclaré pratiquer la cuisine comme loisir en proportions semblables.
Si notre échantillonnage est parfaitement aléatoire, ce cas de figure est peu probable mais pas impossible. En pratique, l’échantillonnage est rarement parfaitement aléatoire et comporte certainement des biais, peut-être certes moins prononcés que dans notre exemple.
La statistique descriptive ne permet donc pas de comprendre la répartition à l’échelle de la population, mais seulement à celle de l’échantillon.
Si le tableau croisé était effectué auprès d’une population exhaustive, pourrions-nous alors affirmer qu’il existe un lien entre les deux variables ?
S’il n’y avait pas de lien entre le genre et le loisir de cuisiner, il serait certes étonnant et rare d’observer un tel tableau, mais pas impossible − de la même manière qu’il serait étonnant mais pas improbable qu’une pièce non truquée produise 90 faces et seulement 10 piles au bout de 100 lancers.
La statistique descriptive ne permet donc pas d’affirmer un quelconque lien dans la population observée.
La statistique descriptive ne permet donc pas :
Cela ne signifie pas que la description est inutile, bien au contraire :
La statistique inférentielle a pour rôle d’aider les chercheur·e·s à prendre des décisions vis-à-vis de leurs hypothèses. Pour le dire simplement, la statistique descriptive essaie de décrire là où la statistique inférentielle essaie d’expliquer.
En particulier, la statistique inférentielle nous aide à décider de la probabilité d’obtenir nos données :
En revanche, la statistique inférentielle ne donne pas :
Le test d’hypothèse est une des méthodes de la statistique inférentielle qui permet de sortir de cette impasse.
Il suit toujours le même principe, mais se décline en différentes versions selon les hypothèses à tester et les variables considérées (principalement pour des raisons de calcul).
Dans le cadre du cours, nous verrons :
Reprenons notre exemple :
Non | Oui | Sum | |
---|---|---|---|
Homme | 629 | 270 | 899 |
Femme | 490 | 611 | 1101 |
Sum | 1119 | 881 | 2000 |
Pour savoir si genre et pratique de la cuisine comme loisir sont liés, nous allons tester l’hypothèse nulle suivante :
\((H0)\) : Les variables genre et cuisine sont indépendantes (pas de lien entre elles)
À partir de cette hypothèse nulle et de nos données, nous appliquons le test d’hypothèse qui donne la p-value.
C’est notamment par le calcul de cette valeur p que les tests d’hypothèses diffèrent entre eux. Nous verrons plus tard comment calculer cette valeur.
Pour l’instant, nous obtenons la p-value suivante pour le genre et la cuisine :
\[p \approx 0\]
Le test d’hypothèse à proprement parler est terminé. Il nous faut maintenant interpréter cette probabilité de 0 pour prendre une décision concernant notre hypothèse nulle.
Pour prendre une décision par rapport à une hypothèse, il est tentant d’interpréter \(p\) comme la probabilité que l’hypothèse soit vraie étant données nos observations. Dans notre exemple, cela signifierait que la probabilité que le genre et la cuisine soient indépendants est quasi nulle.
Attention ! Ce n’est pas ce résultat que fournit le test d’hypothèse. En effet, la valeur p donne la probabilité d’obtenir les données observées si l’hypothèse est vraie (nous donnerons une définition plus précise par la suite).
Dans notre exemple, \(p \approx 0\). Cela signifie donc que s’il n’y avait pas de lien entre le genre et le loisir de cuisiner, la probabilité d’observer une telle répartition genrée serait de 0. Autrement dit, s’il y avait indépendance entre genre et cuisine, il serait presque impossible de récolter ces données.
Nous avons maintenant une décision à prendre : rejeter \((H0)\) ou non en fonction de \(p\).
Le raisonnement est le suivant : si la probabilité \(p\) d’obtenir nos données en sachant \((H0)\) vraie est suffisamment petite, alors il serait très rare d’observer les données qui sont les nôtres.
Comment décider si \(p\) est suffisamment petite, c’est-à-dire si obtenir nos données si \((H0)\) est vraie s’avère être un événement suffisamment rare qu’il nous permet de rejeter \((H0)\) ?
Nous nous référons alors à un seuil de significativité (noté \(\alpha\)).
Ce seuil de significativité est fixé à \(0,05\) (c’est une norme scientifique et historique). Si \(p < \alpha\), alors l’effet constaté est significatif au sens statistique.
Revenons à notre exemple. Nous avions vu que \(p \approx 0\). Il ne nous reste plus qu’à terminer notre raisonnement :
Autrement dit, il est raisonnable de penser que cette répartition genrée des loisirs n’est due ni au hasard et ni à des biais d’échantillonnage.
Statistique descriptive : observation d’une variation conjointe de deux variables
Question de recherche : existe-t-il un lien significatif entre deux variables ?
Les deux exemples suivants sont également tirés de l’enquête Histoire De Vie (INSEE, 2003).
Pour chacun d’entre eux, on donne un tableau croisé et la valeur \(p\) issue du test d’hypothèse.
Reproduire toutes les étapes du raisonnement statistique, en partant du commentaire du tableau croisé et la formulation d’une question de recherche jusqu’au test d’hypothèse, son interprétation et sa conclusion.
« En dehors du cadre scolaire ou professionnel, au cours des 12 derniers mois, avez-vous pratiqué alors que vous n’y étiez pas obligé(e) […] aller au cinéma? ».
Non | Oui | Total | |
---|---|---|---|
Homme | 60.29 | 39.71 | 100 |
Femme | 57.40 | 42.60 | 100 |
Ensemble | 58.70 | 41.30 | 100 |
\[p \approx 0.208144\]
« […] Dans votre travail actuel, qu’est-ce qui l’emporte ? »
Insatisfaction | Equilibre | Satisfaction | Total | |
---|---|---|---|---|
Ouvrier | 16.74 | 46.03 | 37.24 | 100 |
Technicien ou autre | 11.11 | 41.41 | 47.47 | 100 |
Profession intermediaire | 10.28 | 40.19 | 49.53 | 100 |
Employe | 10.68 | 46.29 | 43.03 | 100 |
Cadre | 7.06 | 34.71 | 58.24 | 100 |
Ensemble | 11.55 | 42.96 | 45.48 | 100 |
\[p \approx 0.0024554\]
Pour rappel, le test d’hypothèse ne donne pas la probabilité que \((H0)\) est vraie. Soit les variables sont indépendantes, soit elles ne le sont pas.
En conséquence, lorsque l’on décide de rejeter \((H0)\) ou non, nous pouvons avoir tort ou raison dans les deux cas. On distingue alors deux types d’erreur :
\((H0)\) est vraie | \((H0)\) est fausse | |
---|---|---|
Rejet de \((H0)\) | Erreur de Type I (faux négatif) | Conclusion correcte |
Non rejet de \((H0)\) | Conclusion correcte | Erreur de Type II (faux positif) |
Évidemment, nous ne savons pas si \((H0)\) est vraie ou non au moment du test d’hypothèse, mais il faut savoir quel type d’erreur nous sommes susceptibles de commettre en fonction de notre conclusion.
Après avoir interprété le résultat du test d’hypothèse et avoir décidé de rejeter ou non l’hypothèse nulle, nous avons déterminé la significativité statistique d’un effet ou d’un lien entre deux variables.
Cette significativité statistique ne doit pas être confondue avec sa pertinence scientifique. D’une part, la décision prise peut être valide ou non (erreurs de type I ou II). D’autre part, ce n’est pas parce qu’un lien est significatif qu’il est pertinent pour notre réflexion.
Il convient donc de replacer le test d’hypothèse et sa conclusion dans un contexte plus large : existe-t-il d’autres travaux pour les confirmer ou les infirmer ? A-t-on d’autres éléments dans notre enquête qualitative ou quantitative qui pourraient contredire ou renforcer nos résultats ?
Le test d’hypothèse permet de déterminer si un effet ou un lien entre deux variables est significatif ou non.
En revanche, la significativité d’un effet ne nous renseigne pas sur son ampleur. Un lien significatif entre deux variables pourrait bien n’avoir qu’une amplitude faible.
D’où une autre limite du test d’hypothèse : nous ne pouvons pas comparer plusieurs tests d’hypothèses entre eux. Par exemple, il n’est pas possible de dire que le lien “genre/cuisine” est plus significatif que le lien “qualification/satisfaction au travail”. Soit un lien est significatif, soit il ne l’est pas.