Méthodes quantitatives

Gabriel Alcaras
25 septembre 2017

Séance 3 - Comprendre les variables

  1. Des données aux bases de données
  2. Les types de variable
  3. Les variables en pratique

Des données aux bases de données

Données

Donnée : information sur un individu.

Individu : unité statistique fondamentale. Entité à propos de laquelle on collecte des informations (également observation).

Variable : série de données collectée sur un ensemble d'individu, renseignant la même information.

Exemples de données

On interroge trois personnes :

  • Dominique est un homme de 50 ans.
  • Camille est une femme de 20 ans.
  • Marie est une femme de 40 ans.

Exercice : Dans cet exemple, identifiez :

  • Les individus
  • Les données
  • Les variables

Base de données

Série de variables à propos des mêmes individus.

Une base de donnée est un tableau contenant :

  • en ligne, les individus (un individu par ligne)
  • en colonne, les variables (une variable par colonne)
  • dans chaque cellule, la valeur que prend une variable pour un individu

L'individu statistique

Individu au sens statistique est une entité, mais pas nécessairement une personne.

Autres possibilités fréquentes

  • un pays, une région
  • une institution (établissement, entreprise)
  • un ménage

Mais aussi plus généralement une unité d'observation

  • un texte (si la population est un corpus)
  • un objet (si la population est un ensemble d'objets)

Données brutes et données agrégées

Données brutes : séries de valeurs associées à des individus. Informations telles qu'elles sont recueillies.

Données agrégées : chiffres produits par une analyse de donnée.

Dans le langage courant, on utilise souvent le terme “donnée” dans le second sens.

Exemple : un sondage mesure les intentions de vote d'un échantillon d'électeurs lors de la prochaine élection. On qualifiera de donnée l'affirmation “15 % des électeurs interrogés affirment vouloir voter pour le candidat X.” Il s'agit d'une donnée agrégée

Les types de variables

Variable qualitative / quantitative

Quelle est la nature de l'information récoltée ?

  • Une mesure => variable quantitative
  • Une catégorie => variable qualitative

Variables qualitatives

Également variable nominale ou variable catégorielle. Les valeurs sont des catégories.

Modalités = ensemble des valeurs possibles pour une variable qualitative.

Cas particulier :

variables qualitatives ordonnées (parfois opposées aux variables catégorielles) = les modalités peuvent être classées dans un ordre logique.

Variables quantitatives

Mesure numérique. Composée d'une mesure (un nombre) et d'une unité.

Variable quantitative discrète : nombre restreint de valeurs possibles.

Variable quantitative continue : nombre de valeurs possibles important.

En pratique

Ouvrir le fichier cpes_quanti_s3_r_decouverte.R.

Pour la prochaine fois

Lire : Céline Bessière et Frédérique Houseaux, « Suivre des enquêteurs », Genèses, n o 29, 1997, p. 100–114.