Gabriel Alcaras
18 septembre 2017
Définitions : statistique, mesure, quantification ?
Prénotions (Durkheim, Les règles de la méthode sociologique) :
Utilité de la statistique : opposer au « bon sens » et à ses vérités indiscutées des faits (discutables ou non).
Exemple récent : Quality of evidence revealing subtle gender biases in science is in the eye of the beholder, 2015.
Les statistiques ne font-elles que montrer l'évidence ?
Paul Lazarsfeld, The American Soldier in Bourdieu, Chamboredon et Passeron, Le métier de sociologue :
… Ces propositions sont toutes invalidées par son enquête.
Pour Lazarsfeld, le « bon sens » ou le sentiment d'évidence sont des rationalisations a posteriori, qui se seraient également produites s'il avait présenté les vrais résultats d'emblée.
Comme tous les comportements humains sont concevables, il est important de savoir ce qui se passe réellement.
Le traitement statistique est indissociable de la production des données. Chaque type de traitement ou d'hypothèse requiert certains types de collecte des données, et inversement. Il n'existe donc pas de données ou de traitements « par défaut », ou miraculeux.
Pour simplifier, deux paradigmes se détachent :
Le premier est souvent considéré comme la référence de la méthode scientifique. Nous verrons ici que chacun a ses forces et ses faiblesses.
Dans le cas d'une expérience aléatoire parfaitement réalisée :
| Avantages | Inconvénients |
|---|---|
| Simplicité du traitement statistique | Complexité du dispositif expérimental |
| Isolation d'un effet « pur » | L'effet est artificiellement mis en avant (pas d'effets d'interactions complexes, comme dans le monde réel) |
| Validité interne (le phénomène est recréé dans l'expérience) | Généralisation à une population plus large parfois difficile |
| Puissance démonstrative | Potentiels problèmes éthiques |
Sans parler des expériences imparfaites.
Dans le cas d'un échantillon aléatoire parfaitement réalisé :
| Avantages | Inconvénients |
|---|---|
| Faisabilité de l'échantillonnage | Techniques statistiques plus complexes |
| Étude d'un phénomène en interaction avec d'autres | Trop de complexité pour distinguer le bruit du signal |
| Validité externe (les phénomènes observés sont généralisables à la population) | Risque de ne pas pouvoir départager corrélation et causalité |
Sans parler des échantillons biaisés… c'est-à-dire tous.
Le dispositif expérimental cherche, en général, à isoler un phénomène causal.
La causalité se référe à la nécessité d'une loi (logique, physique, éventuellement sociale, économique, etc.).
Définir cause et effet n'est pas dans les ambitions de ce cours. Notons simplement que les définitions sont multiples.
En particulier, une cause peut être déterministe (A cause toujours B) ou probabiliste (A augmente la probabilité de B).
En utilisant des données d'enquête, nous ne pouvons qu'observer des corrélations.
Une corrélation est une variation concomittante de deux phénomènes selon une relation statistique, le plus souvent linéaire.
Ce sont les méthodes statistiques qui peuvent éventuellement appuyer des explications causales.
Une corrélation peut être dûe :
Un principe moins intuitif :
Lahire Bernard, « Formes de la lecture etudiante et categories scolaires de l'entendement lectoral », Sociétés contemporaines 4/2002 (no 48) , p. 87-107. URL : www.cairn.info/revue-societes-contemporaines-2002-4-page-87.htm.
Les concepts de corrélation et de causalité donnent des règles pour articuler une réflexion logique autour des liens entre phénomènes.
Or ces derniers ne sont jamais directement données, mais sont étudiés par l'intermédiaire de variables.
L'argumentation logique ne fait donc pas tout : il faut également comprendre les variables dont elle est composée.
Quelles sont les usages de la quantification dans le texte de Bernard Lahire ?
Outil pour prouver une thèse sociologique :
La haute légitimité scolaire de la culture scientifique ne « protège » en rien des produits culturels les plus « populaires » dans un monde social encore largement dominé par les définitions littéraire et artistique de la culture.
Une réflexion sur la catégorie de « lecture » :
La situation des étudiants de formations scientifiques et techniques force à s’interroger sur les conditions de déclarabilité des pratiques de lecture et sur les catégories dominantes de l’entendement lectoral.
Quels sont les différentes variables utilisées par Lahire ? Que quantifient-elles ? Peut-on les regrouper ?
Quels sont les différentes variables utilisées par Lahire ? Que quantifient-elles ? Peut-on les regrouper ?
| Variables | Quantifie… | Type |
|---|---|---|
| Type d'études | Culture scientifique | Variable établie |
| PCS des parents | Milieu d'origine | Variable établie |
| Nombre et genre de livres lus | Pratiques de lecture | Variable spécifique |
| Achat d'ouvrages | Investissements financiers | Variable spécifique |
| Emprunt en bibliothèque | Habitude scolaire | Variable spécifique |
Variables établies : crées une institution (juridique comme l'état civil, statistique comme l'INSEE, etc.). Exemple : le cas emblématique des nomenclatures professionnelles, les PCS.
Variables spécifiques : plus ou moins originales, elles sont crées par le statisticien ou le chercheur pour élucider une problématique précise.
Selon Lahire, quelles sont les limites de ses variables spécifiques ?