Premiers pas

Author

Marie Lesclingand

Published

January 7, 2026

1 Découverte de l’environnement RStudio

Ce script est une prise en main du logiciel R, via l’interface RStudio

1.1 Le projet

Avant de démarrer :

  • Créer un répertoire QUANTI dans l’explorateur de fichiers ou le finder :
  • Créer à l’intérieur trois sous-dossiers :
    • DATA
    • DOCS
    • TAB_FIG
  • Enregistrer la base de données dans DATA, les fichiers de documentation de la base dans DOCS

Puis créer un projet RStudio à partir de ce répertoire existant (QUANTI)

1.2 Le script

Tout commentaire doit être précédé d’un #

Structurer le script en titrant avec les —-

1.3 L’interface RStudio

Les quatre cadrans principaux :

  • Cadran haut-gauche : Script : sauvegarde des instructions
  • Cadran haut-bas : Console : écriture et résultats des instructions
  • Cadran haut-droite : Environnement/Historique/Connexions : affichage des bases et objets utilisés
  • Cadran bas-droite :Fichiers/Graphiques/Paquets/Aide/Visualiseur/Présentation : explorateur, visualisation des packages, de l’aide et des graphiques et tableaux

1.4 Les fonctions de base

1.4.1 Comme une calculatrice

Exemple : calcul de la somme 2+2

2+2
[1] 4

Autres exemples de calculs simples : différence, produit et quotient

5-10
[1] -5
78*5
[1] 390
95/86
[1] 1.104651

1.4.2 Stockage de valeurs dans des objets vecteurs

On peut stocker une valeur dans un objet pour pouvoir la réutiliser ensuite facilement :

Exemple : création du vecteur x qui prend la valeur 2

x<-2

Calcul de x+10 avec affichage du résultat

x+10
[1] 12

On peut aussi créer un vecteur avec une série de valeurs :

Exemple : création d’un vecteur ages suite à une petite enquête auprès de 16 étudiants

ages<-c(19, 20, 20, 20, 20, 20, 20, 21, 20, 19, 19, 20, 20, 20, 19, 19)

Affichage du vecteur ages

```{r}
ages
```

Exemple : création d’un vecteur annais à partir du vecteur ages qui donne l’année de naissance en fonction de l’âge

annais=2025-ages

Affichage du vecteur annais

annais
 [1] 2006 2005 2005 2005 2005 2005 2005 2004 2005 2006 2006 2005 2005 2005 2006
[16] 2006

Exemple : Création du vecteur genre qui saisit les genre des étudiants enquêtés

genre<-c("homme", "femme", "femme", "femme", "femme", "homme", "femme", "femme", "femme", "femme", "homme", "femme", "femme", "homme", "femme", "femme") 

Affichage du vecteur genre

genre
 [1] "homme" "femme" "femme" "femme" "femme" "homme" "femme" "femme" "femme"
[10] "femme" "homme" "femme" "femme" "homme" "femme" "femme"

Remarque : tous les nouveaux objets apparaissent dans la fenêtre Environnement

1.4.3 Quelques fonctions

Valeur minimale (min)

  • Exemple : la plus petite valeur pour une variable numérique
min(ages)
[1] 19
  • Exemple : la première valeur par ordre alphabétique pour une variable catégorielle numérique
min(genre)
[1] "femme"

Valeur maximale (max)

  • Exemple : la plus grande valeur pour une variable numérique
max(ages)
[1] 21
  • Exemple : la dernière valeur par ordre alphabétique pour une variable catégorielle
max(genre)
[1] "homme"

Valeurs minimale et maximale

  • Exemple : min et max de la variable annais
range(annais)
[1] 2004 2006
  • Exemple : min et max de la variable ages
range(ages)
[1] 19 21

Quelques indicateurs sur les variables numériques

  • Moyenne
mean(ages) 
[1] 19.75
  • Médiane
median(ages) 
[1] 20
  • Principaux indicateurs
summary(ages) 
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  19.00   19.00   20.00   19.75   20.00   21.00 

1.5 Les packages ou extensions

  • Nouvelles fonctionnalités utiles aux différentes étapes de préparation, d’analyse et de valorisation

  • Deux étapes :

    • Installation avec l’instruction install.packages(“nompackage”) : à faire une seule fois
    • Chargement du package installé : à écrire au début de chaque script avec l’instruction library
    • Exemple : l’extension tidyverse

install.packages(“tidyverse”)

library(tidyverse)

1.6 Aide

  • help.start() pour afficher le sommaire de l’aide (fenêtre en bas à droite)

  • help(mean) pour afficher l’aide sur la fonction mean

Dans l’onglet Aide (cadran en bas à droite), pour chaque fonction, infos sur le package dans lequel elle est {}, son utilité et des exemples d’utilisation

2 Importation d’une base, sélection de variables et sauvegarde

2.1 Importation de bases au format csv ou xls

  • Avoir enregistré les bases récupérées dans le sous-dossier DATA du répertoire QUANTI

  • Selon le format de la base (xls ou csv), on utilisera les instructions readxls ou readr

  • On peut aussi passer par le bouton de la fenêtre Environnement et copier le code

    • Exemple 1 : fichier .csv
    bn1 <- read_delim("../DATA/barometre-du-numerique-2024.csv", 
                     delim = ";", escape_double = FALSE, locale = locale(), 
                     trim_ws = TRUE)
    • Exemple 2 : fichier .xls

      • Avoir installé le package readxls
      library(readxl)
      • Importation de la base
      bn2 <- read_excel("../DATA/barometre-du-numerique-2024.xlsx")

2.2 Visionnage et premières explorations de la base

  • Affichage de la base dans un nouvel onglet
View(bn2) 
  • Nombre d’observations (lignes) et de variables (colonnes)
dim(bn2) 
[1] 4066  236
  • Affichage des noms de toutes les variables
names(bn2) 
  [1] "IDENT"          "RECUEIL"        "ANNEENQ"        "POND"          
  [5] "AGE6FUZ"        "AGGLO5"         "REGION"         "TYPLOG"        
  [9] "TYPLOG2"        "NBPERS"         "NBPERS5"        "SITUEMP"       
 [13] "EMP_CF"         "EXERCPRO"       "PCS8EGO"        "PCS8_CF"       
 [17] "SALCOMP"        "TEMPSTRA"       "DIPLOME_CF"     "DIPL5"         
 [21] "TYPOSQT"        "TELFIXE"        "TABLETTE"       "TABLET2"       
 [25] "MICRO2"         "PTSMART2"       "SMARTPHO"       "TELMODET"      
 [29] "TELMOB"         "FRQINTER"       "FRQHANG1"       "FRQHANG2"      
 [33] "FRQAPPLI"       "INTERNET"       "TYPCONN2"       "ENCEINTE"      
 [37] "CONNEC1"        "CONNEC1_NOWEB"  "CONNEC2"        "CONNEC2_NOWEB" 
 [41] "CONNEC3"        "CONNEC3_NOWEB"  "CONNEC4"        "CONNEC4_NOWEB" 
 [45] "FREQORDI"       "FREQTAB"        "FREQFIXE"       "FREQMOB"       
 [49] "FREQALEX"       "FREQTOT"        "US_JOB"         "US_ADMI"       
 [53] "US_ACHAT"       "FREQACHA"       "MISSWEB"        "TYPRADIO2"     
 [57] "NBTIC1"         "NBTIC1_5"       "NBTIC2"         "NBTIC2_5"      
 [61] "NBTIC3"         "NBTIC3_5"       "NBTIC5"         "NBTIC5_5"      
 [65] "NBTIC6"         "NBTIC6_5"       "NBTIC7"         "NBTIC7_5"      
 [69] "NBOLD1"         "NBOLD1_5"       "NBOLD2"         "NBOLD2_5"      
 [73] "NBOLD3"         "NBOLD3_5"       "NBOLD5"         "NBOLD5_5"      
 [77] "NBOLD6"         "NBOLD6_5"       "NBOLD7"         "NBOLD7_5"      
 [81] "FREINWEB1"      "FREINWEB2"      "FREINWEB3"      "FREINWEB4"     
 [85] "FREINWEB5"      "ANSMART"        "CHANSMAR"       "KEEPSMAR"      
 [89] "NBDATA"         "FREINWEB"       "REGLTELE"       "REGLWEB"       
 [93] "REGLJEU"        "LIVRNUM"        "REVTOT7"        "SEXE"          
 [97] "TICNEW_CORR"    "TICOLD_CORR"    "TICLOVE_CORR"   "PREINSTA"      
[101] "WHYPREIN"       "MICROPERSO"     "MICROPRO"       "SMARTACCESS_1" 
[105] "SMARTACCESS_2"  "FORFAIT2"       "MOBPRIX"        "WEBTARIF"      
[109] "CHAT2_1_CORR"   "CHAT2_2_CORR"   "RESOC"          "CGUFACEB2"     
[113] "OPICGU1"        "OPICGU2"        "SIGNAL2"        "OPISIGN1"      
[117] "OPISIGN2"       "OPISIGN3"       "NETFLIX2"       "INTERNEFFET"   
[121] "NUMLIMIT_1"     "NUMLIMIT_2"     "NUMLIMIT_3"     "NUMLIMIT_4"    
[125] "NUMLIMIT_5"     "NBDATA_CORR"    "HR_PHONE"       "HR_PHONE_7"    
[129] "NOMTEMP1"       "NOMTEMP1_AUTRE" "NAVISMAR2"      "NAVDEF1"       
[133] "NAVDEF2"        "NAVDEF3"        "VIEUSMAR2"      "MOBNEG"        
[137] "WHYMOBNEG"      "MOBNEG2_1"      "MOBNEG2_2"      "USDONNEE"      
[141] "PLUSDONNEE"     "MOINSDONNEE"    "WHYMOINSDONNEE" "WEBNEG"        
[145] "WHYWEBNEG"      "WEBNEG2_1"      "WEBNEG2_2"      "AGEC1FIX"      
[149] "AGEC1MOB"       "FRQAGEC1FIX"    "FRQAGEC1MOB"    "AGEC2FIX"      
[153] "AGEC2MOB"       "FRQAGEC2FIX"    "FRQAGEC2MOB"    "AGEC3FIX"      
[157] "AGEC3MOB"       "HR_ECRAN2"      "HR_ECRAN2_7"    "OPITPSECRAN"   
[161] "REGLSMA"        "CONFIA"         "IA_CREA"        "IA_ENV"        
[165] "IA_EMPL"        "IA_EDU"         "US_MAPS"        "US_LOG"        
[169] "US_RDV"         "US_ITIN"        "PETITION"       "ACHANET1"      
[173] "ACHANET2"       "ACHANET4"       "ACHANET5"       "ACHANET6"      
[177] "VINTED_1"       "VINTED_2"       "PREFSOCI"       "CLIQUERPLAT"   
[181] "PAYPHON"        "PREFPAY"        "PREFACT"        "PREFSHOP"      
[185] "PREFALIM"       "PREFLIVR"       "MISSPHONE"      "RSFREQ1"       
[189] "RSFREQ2"        "RSFREQ3"        "OCCASCGU"       "UTILCGU"       
[193] "WHYNOSIG"       "CLOUD1"         "CLOUD2"         "CLOUDWHY1"     
[197] "CLOUDWHY2"      "TYPTELE"        "TYPTV2"         "MODTV1"        
[201] "MODTV2"         "MODTV3"         "MODTV4"         "MODTV5"        
[205] "MODTV6"         "EQIPTV1"        "EQIPTV2"        "EQIPTV3"       
[209] "EQIPTV4"        "EQIPTV5"        "EQIPTV6"        "APPLITV1"      
[213] "APPLITV2"       "WHYTVORDI1"     "WHYTVORDI2"     "RADIOIP3"      
[217] "RADIOIP4"       "TYPMUS"         "TYPINFO"        "TYPDEBAT"      
[221] "TYPSPORT"       "TYPRIRE"        "CRAINTNUM"      "ACCONUM"       
[225] "WHEREACCONUM1"  "WHEREACCONUM2"  "WHYDIFFADMIN1"  "WHYDIFFADMIN2" 
[229] "WHYDIFFADMIN3"  "WHYDIFFADMIN4"  "WHYDIFFADMIN5"  "WHYDIFFADMIN6" 
[233] "WHYDIFFADMIN7"  "WHYDIFFADMIN8"  "WHYDIFFADMIN9"  "PIX"           

2.3 Sélection des variables

  • Variables de contrôle et de pondération : IDENT et POND

  • Variables d’intérêt : variables sur les équipements numériques, les objets connectés et les pratiques liées à l’IA : INTERNET FREQTOT MICROPERSO MICROPRO TABLETTE SMARTPHO HR_ECRAN2 HRPHONE ENCEINTE CONNEC1 CONNEC2 CONNEC3 CONNEC4 CHAT_1 CHAT_2

  • Variables socio-démographiques : variables individuelles, ménage et macro : AGE6FUZ SEXE PCS8EGO DIPL5 NBPERS AGGLO5

  • Utilisation de la fonction select et création d’une nouvelle base

bns<-select(bn2,IDENT, POND, INTERNET, FREQTOT, MICROPERSO, MICROPRO, TABLETTE, SMARTPHO, HR_ECRAN2, HR_PHONE, ENCEINTE, CONNEC1, CONNEC2, CONNEC3, CONNEC4, CHAT2_1_CORR, CHAT2_2_CORR, AGE6FUZ, SEXE, PCS8EGO, DIPL5, NBPERS, AGGLO5)

23 variables sélectionnées

dim(bns) 
[1] 4066   23

2.4 Sauvegarde de la base au format RData

Stockage de la base dans le sous-dossier DATA

save(bns,file = "../DATA/bns.RData")

La nouvelle base s’affiche dans l’onglet Environnement du cadran en haut à droite

Avant de se lancer dans les analyses de nos données, il faut maintenant préparer notre base (cf. DataPreparation.R)