Atelier 4 : Instructions

2023-05-24

Instructions de devoir

  1. Téléchargez d’abord le dépôt du cours ici ou en cliquant sur le bouton pertinent sur la page du devoir.

  2. Si vous êtes sur un PC, allez dans votre dossier de téléchargements, faites un clic droit sur le fichier zip téléchargé et cliquez sur “extraire tout”. (Si vous êtes sur un Mac, vous pouvez directement cliquer sur le dossier téléchargé)

  3. Cliquez ensuite sur le fichier Projet RStudio dans le dossier décompressé pour ouvrir le projet dans RStudio.

  4. Depuis le volet Fichiers de RStudio, explorez les sous-dossiers “data” et “rmd”.

  5. Dans le sous-dossier “rmd”, les instructions pour votre exercice sont décrites (ce sont les mêmes instructions que vous voyez ici). Il y a aussi un rapport exemple que vous pouvez utiliser comme référence.

  6. Dans le sous-dossier “data”, l’ensemble de données sur lequel vous allez travailler s’appelle “india_tb_pathways_and_costs.csv”. L’autre ensemble de données est uniquement à titre d’exemple.

  7. Votre tâche sera de créer un court rapport basé sur Rmarkdown comparant la distribution de DEUX variables CATÉGORIELLES dans l’ensemble de données des voies de la tuberculose en Inde. Par exemple, vous pourriez comparer

    • Le niveau d’éducation et l’habitude de fumer

    • L’emploi et le lieu de visite

    • La consommation d’alcool et le diabète

  8. Le rapport doit contenir ces quatre choses :

    1. Un graphique créé avec {ggplot2}/{esquisse}

    2. Un tableau créé avec {flextable} (Vous pouvez consulter le livre de flextable pour des astuces)

    3. Au moins une utilisation de code R inline dans le Rmd.

    4. Au moins une possible zone d’amélioration mentionnée.

  9. Tricotez votre rapport en un fichier HTML ou PDF valide. Lorsque vous tricotez votre fichier, veuillez désactiver l’écho de code sur tous les blocs, afin d’obtenir une sortie soignée.

  10. Pour soumettre votre travail, veuillez créer un fichier zip de votre dossier et téléchargez-le sur notre page de devoirs. Assurez-vous que le dossier contient à la fois votre fichier Rmd et votre fichier HTML ou PDF tricoté.

    Send to zip file on Windows
    Send to zip file on Windows

Commentaire de l’enseignant

Utilisation de patchwork

Le package patchwork vous permet de combiner plusieurs graphiques en un seul, ce qui peut faciliter la comparaison des graphiques et maintenir votre visualisation de données propre et organisée.

Regardons un exemple simple. Supposons que nous avons deux graphiques appelés plot1 et plot2 :

# charger les packages requis
pacman::p_load(tidyverse, patchwork)

# Créer plot1
plot1 <- ggplot(mtcars, aes(x = mpg, y = hp)) +
         geom_point() 

# Créer plot2
plot2 <- ggplot(mtcars, aes(x = mpg, y = disp)) +
         geom_point()

# Combinez les tracés verticalement avec patchwork
combined_plot <- plot1 / plot2
combined_plot

Dans cet exemple, l’opérateur / est utilisé pour organiser les tracés verticalement, avec plot1 en haut et plot2 en bas.

Si vous vouliez que les tracés soient disposés horizontalement, vous utiliseriez l’opérateur + à la place :

# Combinez les tracés horizontalement avec patchwork
combined_plot_2 <- plot1 + plot2
combined_plot_2

Code Inline

En R markdown, nous utilisons une syntaxe spécifique pour inclure du code R inline, qui est du code R qui s’exécute dans le texte de votre document. Pour utiliser du code R inline, nous incluons simplement le code R entre des accents graves et le précédons d’un r comme ceci

Nous avons trouvé qu'il y avait `r your_code_here` cas dans la Catégorie B.

Une utilisation courante du code R inline est d’accéder et d’afficher des éléments spécifiques à partir d’un objet de données tel qu’une matrice ou un dataframe. Pour accéder à un élément spécifique, nous utilisons des crochets [] avec les indices de ligne et de colonne. Par exemple, si nous avons une matrice m, nous pouvons accéder à l’élément à la ligne 2, colonne 3 comme suit : m[2, 3].

Prenons un exemple avec un tableau Markdown. Supposons que nous avons un tableau comme suit :

Catégorie Compte
A 10
B 20
C 30

Si nous voulons afficher le compte pour la Catégorie B dans notre texte, nous pourrions écrire quelque chose comme ceci dans notre script Rmarkdown (pas dans un bloc de code) :

Nous avons trouvé qu'il y avait `r counts[2, 2]` cas dans la Catégorie B.

Lorsque ce document R Markdown est tricoté, il s’affiche comme :

“Nous avons trouvé qu’il y avait 20 cas dans la Catégorie B.”