RStudio est un environnement spécialement conçu pour travailler avec le langage de programmation R, largement utilisé pour l’analyse statistique, la visualisation de données et la création de modèles prédictifs.
Travail préalable
Créer un dossier « SN1 » sur votre lecteur One Drive. Dans ce dossier, créer un autre dossier appelé « Laboratoires »;
Télécharger le fichier de données YYY.xlsx sur LÉA puis le déplacer dans ce dossier ;
Créer un nouveau fichier R et le nommer prélab1.r
Téléchargement et installation de librairies
Une librairie est un ensemble de fonctions créées soit par un auteur commun, soit pour des besoins spécifiques. Pour nos besoins, nous allons utiliser quatre librairies :
Pour installer les librairies, cliquer sur Tools, puis Install Packages…
Dans le deuxième espace de la boîte de dialogue, inscrire « readxl,tibble,dplyr,ggplot2 » (voir image ci-dessus);
S’assurer que la boîte « Install dependencies » est cochée, cliquer sur Install (voir Figure 1)
Figure 1
Il est maintenant temps de charger les librairies nécéssaires pour ce laboratoire:
library(readxl) #importer données Excellibrary(tibble) #affichage de donnéeslibrary(dplyr) #pour construire des tableaux de données regroupées
Attachement du package : 'dplyr'
Les objets suivants sont masqués depuis 'package:stats':
filter, lag
Les objets suivants sont masqués depuis 'package:base':
intersect, setdiff, setequal, union
Les # nous permettent d’écrire des commentaires, c’est-à-dire des mots/phrases qui seront ignorés par RStudio lors de l’exécution du script.
Importation de données
Il faut tout d’abord indiquer à R où se trouve le fichier de données sur l’ordinateur.
Cliquer sur Session, puis Set Working Directory… puis Choose Directory;
Sélectionner le répertoire où se trouve le fichier de données. Vous devriez obtenir une fenêtre console semblable à celle ci-dessous, adaptée à votre propre répertoire (Figure 2);
Copier/coller la dernier ligne dans votre script
Figure 2
setwd("C:/Users/camille.melancon/OneDrive - Cegep de Lanaudiere/Cours/SN1/Labos")
Ces lignes de commande (librairies et répertoires) seront à inscrire dans chaque nouveau script, pour chacun des laboratoires.
Pour importer les données, nous utiliserons la commande read_excel