Préparation laboratoire 1

Author

Camille Melançon

Introduction

RStudio est un environnement spécialement conçu pour travailler avec le langage de programmation R, largement utilisé pour l’analyse statistique, la visualisation de données et la création de modèles prédictifs.

Travail préalable

  1. Créer un dossier « SN1 » sur votre lecteur One Drive. Dans ce dossier, créer un autre dossier appelé « Laboratoires »;

  2. Télécharger le fichier de données YYY.xlsx sur LÉA puis le déplacer dans ce dossier ;

  3. Créer un nouveau fichier R et le nommer prélab1.r

Téléchargement et installation de librairies

Une librairie est un ensemble de fonctions créées soit par un auteur commun, soit pour des besoins spécifiques. Pour nos besoins, nous allons utiliser quatre librairies :

  1. Pour installer les librairies, cliquer sur Tools, puis Install Packages…

  2. Dans le deuxième espace de la boîte de dialogue, inscrire « readxl,tibble,dplyr,ggplot2 »  (voir image ci-dessus);

  3. S’assurer que la boîte « Install dependencies » est cochée, cliquer sur Install (voir Figure 1)

Figure 1

Il est maintenant temps de charger les librairies nécéssaires pour ce laboratoire:

library(readxl) #importer données Excel
library(tibble) #affichage de données
library(dplyr) #pour construire des tableaux de données regroupées

Attachement du package : 'dplyr'
Les objets suivants sont masqués depuis 'package:stats':

    filter, lag
Les objets suivants sont masqués depuis 'package:base':

    intersect, setdiff, setequal, union

Les # nous permettent d’écrire des commentaires, c’est-à-dire des mots/phrases qui seront ignorés par RStudio lors de l’exécution du script.

Importation de données

Il faut tout d’abord indiquer à R où se trouve le fichier de données sur l’ordinateur.

  1. Cliquer sur Session, puis Set Working Directory… puis Choose Directory;

  2. Sélectionner le répertoire où se trouve le fichier de données. Vous devriez obtenir une fenêtre console semblable à celle ci-dessous, adaptée à votre propre répertoire (Figure 2);

  3. Copier/coller la dernier ligne dans votre script 

Figure 2
setwd("C:/Users/camille.melancon/OneDrive - Cegep de Lanaudiere/Cours/SN1/Labos")

Ces lignes de commande (librairies et répertoires) seront à inscrire dans chaque nouveau script, pour chacun des laboratoires.

Pour importer les données, nous utiliserons la commande read_excel

edifices<-read_excel("fred.xlsx",sheet=2)
New names:
• `` -> `...14`
• `` -> `...15`

Figure 3