seq(1,20) # Première manière (ceci est un commentaire) [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1:20 # Autre manière de créer cette séquence de nommbres [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
On peut écrire du texte en gras et en italique. On peut écrire des formules mathématiques en \(\LaTeX\).
Par exemple une intégrale
\[ \int_{-\infty}^{+\infty}e^{-x^2}dx=\sqrt{\pi} \]
Si vous voulez exécuter des codes en R, il suffit de créer un chunk. Le chunk qui suit affiche les nombres entiers de 1 à 20.
seq(1,20) # Première manière (ceci est un commentaire) [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1:20 # Autre manière de créer cette séquence de nommbres [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Si on veut afficher les années des coupes du monde de football de 1970 (Mexico) et 2026 (Amérique)
seq(1970,2026,4) # Est une fonction de base de R [1] 1970 1974 1978 1982 1986 1990 1994 1998 2002 2006 2010 2014 2018 2022 2026
Nous allons apprendre à coder avec R mais en utilsant de manière intensive le “Tidyvese”.
Faisons un histogramme de la variable mpg
On commence par un histogramme très basique et on fera ensuite du ggplot de tidyverse.
dfcars$mpg|>hist(main="Histogramme de MPG pour les 32 voitures")dfcars |>
filter(mpg >= 30 & mpg <= 35) mpg cyl disp hp drat wt qsec vs am gear carb
Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2
Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
library(ggthemes)
dfcars |> ggplot(aes(x = mpg)) +
geom_histogram(fill ="red",binwidth =5,col="black")+
ggtitle("Histogramme de MPG")+
ylab("Nombre de voitures")+
theme_economist()library(tidyverse)
library(readr)keno_202511 <- read_delim("keno_202511.csv",
delim = ";", escape_double = FALSE, col_types = cols(date_de_forclusion = col_skip(),
...23 = col_skip()), trim_ws = TRUE)New names:
• `` -> `...23`
# Un tibble c'est une sorte de data frame secifique au tidyverse
table4a <- tibble(
country = c("A", "B", "C"),
`1999` = c(700, 37000, 212000),
`2000` = c(2000, 80000, 213000)
)
table4a# A tibble: 3 × 3
country `1999` `2000`
<chr> <dbl> <dbl>
1 A 700 2000
2 B 37000 80000
3 C 212000 213000
table4a |> pivot_longer(cols = 2:3, names_to ="year",
values_to = "cases")# A tibble: 6 × 3
country year cases
<chr> <chr> <dbl>
1 A 1999 700
2 A 2000 2000
3 B 1999 37000
4 B 2000 80000
5 C 1999 212000
6 C 2000 213000
keno_longer<-keno_202511|>select(-c(1,"multiplicateur","numero_jokerplus","devise"))|>pivot_longer(cols=2:17,names_to ="boule",
names_prefix = "boule",values_to = "Numéro")
keno_longer# A tibble: 1,600 × 3
date_de_tirage boule Numéro
<chr> <chr> <dbl>
1 10/02/2026 1 12
2 10/02/2026 2 13
3 10/02/2026 3 17
4 10/02/2026 4 20
5 10/02/2026 5 22
6 10/02/2026 6 23
7 10/02/2026 7 26
8 10/02/2026 8 27
9 10/02/2026 9 39
10 10/02/2026 10 42
# ℹ 1,590 more rows
keno_202511 <- keno_202511 %>%
mutate(date_de_tirage = as.Date(date_de_tirage, format = "%d/%m/%Y"))
keno_202511 %>%
summarise(
date_min = format(min(date_de_tirage), "%d/%m/%Y"),
date_max = format(max(date_de_tirage), "%d/%m/%Y")
)# A tibble: 1 × 2
date_min date_max
<chr> <chr>
1 03/11/2025 10/02/2026
keno_long <- keno_202511 %>%
select(-annee_numero_de_tirage, -devise, -numero_jokerplus) %>%
pivot_longer(
cols = boule1:boule16,
names_to = "boule",
names_prefix = "boule",
names_transform = list(boule = as.integer),
values_to = "numero"
)
table_freq <- keno_long %>%
count(numero, name = "Nombre de sorties") %>%
complete(numero = 1:56, fill = list(`Nombre de sorties` = 0)) %>%
arrange(numero)
library(knitr)
table_freq %>%
kable(
col.names = c("Numéro", "Nombre de sorties"),
caption = "Fréquence d'apparition des numéros (Keno novembre 2025)"
)| Numéro | Nombre de sorties |
|---|---|
| 1 | 30 |
| 2 | 26 |
| 3 | 28 |
| 4 | 32 |
| 5 | 17 |
| 6 | 21 |
| 7 | 37 |
| 8 | 23 |
| 9 | 33 |
| 10 | 30 |
| 11 | 28 |
| 12 | 28 |
| 13 | 38 |
| 14 | 35 |
| 15 | 21 |
| 16 | 23 |
| 17 | 33 |
| 18 | 19 |
| 19 | 38 |
| 20 | 24 |
| 21 | 29 |
| 22 | 20 |
| 23 | 29 |
| 24 | 29 |
| 25 | 27 |
| 26 | 28 |
| 27 | 36 |
| 28 | 33 |
| 29 | 26 |
| 30 | 35 |
| 31 | 29 |
| 32 | 24 |
| 33 | 24 |
| 34 | 25 |
| 35 | 29 |
| 36 | 24 |
| 37 | 29 |
| 38 | 31 |
| 39 | 27 |
| 40 | 27 |
| 41 | 38 |
| 42 | 30 |
| 43 | 25 |
| 44 | 30 |
| 45 | 25 |
| 46 | 32 |
| 47 | 31 |
| 48 | 30 |
| 49 | 32 |
| 50 | 30 |
| 51 | 30 |
| 52 | 29 |
| 53 | 32 |
| 54 | 24 |
| 55 | 33 |
| 56 | 24 |
Comment citer une référence bibligraphique dans Quarto
Je vous montre comment citer une référence bibligrahique avec BibTex
Nous allons cite l’article de Wickham et al. (2019) comme exemple.
Le tidyverse est un ensemble de packages R dédiés à la data science. Ces packages reposent sur une même philosophie, une même grammaire et des structures de données communes, ce qui permet de manipuler, transformer et visualiser les données de façon simple et harmonisée.
Nous installons Tidyverse pour pouvoir les utiliser. On doit ensuite appeler le package.
Petite illustraion. Chargeons des données disponibles dans R.
Manipulation standard de data frame dans R
Les mêmes manipulations mais avec le tidyverse avec utilisation de pipes.
Calculer des statistiques avec tidyverse