Instructions pour le devoir
Téléchargez d’abord le dépôt de cours ici ou en cliquant sur le bouton correspondant sur la page du devoir.
Si vous êtes sur un PC, allez dans votre dossier Téléchargements, cliquez avec le bouton droit sur le fichier zip téléchargé, puis cliquez sur “Extraire tout”. (Si vous êtes sur un Mac, vous pouvez cliquer directement sur le dossier téléchargé)
Cliquez ensuite sur le fichier du projet RStudio dans le dossier dézippé pour ouvrir le projet dans RStudio.
Dans le volet Fichiers de RStudio, explorez les sous-dossiers “data” et “rmd”.
Dans le sous-dossier “rmd”, les instructions pour votre exercice sont décrites (ce sont les mêmes instructions que celles que vous voyez ici). Il y a aussi un exemple de rapport que vous pouvez utiliser comme référence.
Dans le sous-dossier “data”, l’ensemble de données sur lequel vous allez travailler s’appelle “india_tb_pathways_and_costs.csv”. L’autre ensemble de données n’est là qu’à titre d’exemple.
Votre tâche consistera à créer un court rapport basé sur rmarkdown comparant la distribution de DEUX VARIABLES CATÉGORIELLES dans l’ensemble de données sur les voies d’accès à la tuberculose en Inde. Par exemple, vous pourriez comparer :
Niveau d’éducation et habitude tabagique
Emploi et lieu de visite
Consommation d’alcool et diabète
Le rapport doit contenir ces quatre éléments :
Un graphique créé avec {ggplot2} / {esquisse}
Un tableau créé avec {flextable} (Vous pouvez consulter le livre flextable pour des conseils)
Au moins une utilisation de code R inline dans le fichier Rmd.
Au moins une zone d’amélioration possible mentionnée.
Compilez votre rapport en un fichier HTML ou PDF valide. Lorsque vous compilez votre fichier, veuillez désactiver l’écho de code sur tous les chunks, afin d’obtenir une sortie nette.
Pour soumettre votre travail, veuillez créer une archive zip de votre dossier et téléchargez-la sur notre page de devoir. Assurez-vous que le dossier contient à la fois votre fichier Rmd et votre fichier HTML ou PDF compilé.
Envoyer vers le fichier zip sous Windows
Commentaires de l’enseignant
Utiliser patchwork
Le package patchwork permet de combiner plusieurs
graphiques en un seul, ce qui peut simplifier la comparaison de
graphiques et garder vos visualisations de données propres et
organisées.
Regardons un exemple simple. Supposons que nous ayons deux graphiques
appelés plot1 et plot2 :
# Charger les packages requis
pacman::p_load(tidyverse, patchwork)
# Créer plot1
plot1 <- ggplot(mtcars, aes(x = mpg, y = hp)) +
geom_point()
# Créer plot2
plot2 <- ggplot(mtcars, aes(x = mpg, y = disp)) +
geom_point()
# Combiner les graphiques verticalement avec patchwork
combined_plot <- plot1 / plot2
combined_plotDans cet exemple, l’opérateur / est utilisé pour
disposer les graphiques verticalement, avec plot1 en haut
et plot2 en bas.
Si vous vouliez que les graphiques soient disposés horizontalement,
vous utiliseriez l’opérateur + à la place :
# Combiner les graphiques horizontalement avec patchwork
combined_plot_2 <- plot1 + plot2
combined_plot_2Code R inline
Dans R markdown, nous utilisons une syntaxe spécifique pour inclure
du code R inline, c’est-à-dire du code R qui s’exécute dans le texte de
votre document. Pour utiliser le code R inline, nous incluons simplement
le code R entre des backticks et le faisons précéder de r
comme ceci :
Une utilisation courante du code R inline est d’accéder à des
éléments spécifiques d’un objet de données tel qu’une matrice ou un
dataframe et de les afficher. Pour accéder à un élément spécifique, nous
utilisons des crochets [] avec les indices de ligne et de
colonne. Par exemple, si nous avons une matrice m, nous
pouvons accéder à l’élément de la ligne 2, colonne 3 comme suit :
m[2, 3].
Prenons un exemple avec un tableau Markdown. Supposons que nous ayons le tableau suivant :
| Catégorie | Nb cas |
|---|---|
| A | 10 |
| B | 20 |
| C | 30 |
Si nous voulons afficher le nombre de cas pour la Catégorie B dans notre texte, nous pourrions écrire quelque chose comme ceci dans notre script Rmarkdown (pas dans un chunk de code) :
Lorsque ce document R Markdown est compilé, il affichera :
“Nous avons trouvé qu’il y avait 20 cas dans la Catégorie B.”