1 Présentation du langage R

Le langage de programmation R est un outil particulièrement puissant pour les calculs statistiques et l’analyse des données. Il est très utilisé dans le milieu de la recherche scientifique mais aussi dans le monde du Business. R peut être utilisé pour des tâches telles que la modélisation statistique, la visualisation des données, l’apprentissage automatique (Machine Learning), l’analyse des séries temporelles, les études économétriques, l’analyse quantitative, le traitement des données textuelles, etc. De plus, plusieurs packages ont été développé dans R afin de faciliter la création de data products (applications web interactives, rapports dynamiques, tableaux de bords, sites web et blogs, etc.) destinés à l’automatisation des tâches et à la communication des résultats d’un projet. R n’est donc pas un simple langage de programmation comme les autres mais plutôt un environnement intégré et complet pour la conception, la réalisation et la vulgarisation d’un projet concernant l’analyse des données.

L’environnement R possède plusieurs avantages dont voici une liste non-exhaustive :

  • R est un outil open-source pouvant s’exécuter dans plusieurs systèmes d’exploitation dont Linux, Windows et MacOS ;

  • R est très efficace pour le traitement et le stockage des données (y compris les données volumineuses type BigData) ;

  • R possède de nombreuses fontionnalités intrinsèques facilitant les études scientifiques ;

  • il est vrai et admis que R est extrêmement puissant pour accomplir des études statistiques. Par ailleurs cette puissance de R est étendue (par des packages) aux tâches plus complexes comme l’apprentissage automatique (Machine Learning), l’apprentissage profond (Deep Learning), le traitement du langage naturel (Natural Langage Processing ou NLP), etc.

  • R possède des librairies puissantes telles que R Markdown pour la création de documents (articles scientifiques, livres, rapports d’études, etc.) de très haute qualité et R Shiny pour la création d’applications web intercatives et à forte valeur ajoutée.

  • etc.

Les avantages cités ci-dessus et d’autres encore font de R une suite d’outils intégrés et cohérents pour le bonheur de ses utilisateurs.

2 Installation de l’environnement de travail

Pour travailler dans R, vous devez préalablement installer et configurer votre environnement de travail. Vous devez installer séparément R et RStudio dans votre ordinateur.

2.1 Téléchargement et installation de R

Vous pouvez télécharger R sur son site officiel.

  1. Choisir la version de R correspondante à votre système d’exploitation

Les étapes ci-dessous illustrent le téléchargement et l’installation de R pour PC Windows. L’installation de R dans Linux et MACOS se fait pratiquement suivant les mêmes étapes que celles de Windows.

  1. Cliquez sur install R for the first time

Même si vous aviez déjà installé R une fois dans votre ordinateur, vous pouvez quand même cliquez sur ce lien.

  1. Cliquez sur Download R 4.0.5 for Windows et choisissez un dossier dans votre PC pour enregistrer l’application.

Au moment où nous écrivons ce livre, la dernière version de R est la 4.0.5. Mais cela ne change rien quant au contenu de ce livre au cas où vous avez une autre version. De plus, le livre est régulièrement actualisé pour tenir compte d’éventuelles mises à jour des fonctionnalités de R.

Une fois que l’application a été téléchargé, ouvrez-le puis démarrer l’installation.

  1. Choisissez la langue d’installation et cliquez sur OK

  1. Cliquez sur Suivant

  1. Cliquez encore sur Suivant

  1. Cliquez encore sur Suivant

  1. Cliquez sur Non (accepter les valeurs par défaut) puis sur Suivant

  1. Cliquez encore sur Suivant

  1. Cliquez encore sur Suivant pour lancer l’installation

Une fois que la progression d’installation de l’application est complète :

  1. Cliquez sur Terminer pour fermer l’assistant d’installation

2.2 Téléchargement et installation de RStudio

RStudio est l’environnement de développement intégré (Integrated Development Environment ou IDE) le plus utilisé pour écrire du code R. Il est simple d’utilisation mais très puisant et efficace pour gérer différentes tâches. Vous pouvez télécharger RStudio en vous rendant sur son site officiel

  1. Une fois sur la page officielle de RStudio, cliquez sur DOWNLOAD

  1. Télécharger RStudio Desktop

Il existe plusieurs versions de RStudio. Toutes les tâches effectuées dans ce livre peuvent être effectuées avec RStudio Desktop qui est non seulement une version gratuite mais aussi la plus utilisée. Néanmoins les versions commerciales de RStudio (RStudio Desktop Pro et RStudio Server Pro) présentent des fonctionnalités additionnelles qui sont intéressantes pour des entreprises.

Le site web détecte automatiquement le système d’exploitation de votre ordinateur et vous propose de télécharger la version de RStudio correspondante.

3 Utilisation de RStudio

Une fois que vous avez installé R et RStudio dans votre ordinateur, vous pouvez maintenant commencer à écrire du code en utilisant RStudio comme IDE. L’interface de RStudio se présente comme suit :

Cette interface est composée de :

  1. Editeur du code : c’est à ce niveau que vous écrivez votre script (ensemble de lignes de commandes sous forme de fichier texte) R. Pour exécuter votre script, sélectionnez les lignes et cliquez sur Run

  2. Console : La console affiche les commandes qui ont été déjà exécutées. Soulignons que vous pouvez aussi écrire et exécuter une commande directement dans la console en appuyant sur la touche Entrée de votre clavier ;

  3. Espace de travail et Historique des variables : cette fenêtre affiche l’historique (noms et valeurs) de toutes les variables. L’historique s’actualise à chaque exécution de votre code ;

  4. Fichiers et Graphiques : cette fenêtre montre les fichiers se trouvant dans votre répertoire de travail et affiche aussi les différents graphiques.

Merci d’avoir lu cet article.

Josué AFOUDA

Retrouvez-moi sur :