## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.4.1 ✔ purrr 1.0.1
## ✔ tibble 3.1.8 ✔ dplyr 1.0.10
## ✔ tidyr 1.2.1 ✔ stringr 1.4.1
## ✔ readr 2.1.2 ✔ forcats 0.5.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
##
## Attachement du package : 'plotly'
##
##
## L'objet suivant est masqué depuis 'package:ggplot2':
##
## last_plot
##
##
## L'objet suivant est masqué depuis 'package:stats':
##
## filter
##
##
## L'objet suivant est masqué depuis 'package:graphics':
##
## layout
Importation des données ————————————————-
Producteur originaire : SNCF Voyageurs
Trains <- read_csv("C:/Users/Ko/OneDrive/Nanterre/S2/Projet collaboratif/Regularities_by_liaisons_Trains_France.csv")
## Rows: 7806 Columns: 32
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (4): Departure station, Arrival station, Comment (optional) delays on a...
## dbl (27): Year, Month, Average travel time (min), Number of expected circula...
## lgl (1): Comment (optional) delays at departure
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Quelles sont les gares les plus touchées par les retards au
départ et leurs causes ?
## Warning: Removed 49 rows containing missing values (`position_stack()`).

Sur les 10 premières gares qui ont le plus de retard au départ, il y
a les 4 gares de Paris, Lyon, Marseille, Lille, Bordeaux, Rennes et
Strasbourg, soit des grandes villes françaises.
On peut constater que cela est dû au grand nombre de voyageurs au
départ de ces villes grâce à leur nombre d’habitants beaucoup plus
supérieur aux autres villes en France.
La probabilité que des retards aient lieu à cause de différents
facteurs est donc plus grande.
Les causes de retard au départ
## Warning: Removed 196 rows containing missing values (`position_stack()`).

On remarque que les causes principales de retard au départ de ces
gares sont des facteurs externes (temps, obstacles, colis suspects,
mouvements sociaux etc…) à plus de 25%, à l’exception des gares de Paris
Montparnasse et Bordeaux St Jean.
Ces derniers ont pour cause principale de retard les problèmes
d’infrastructure. Dans chacune de ces gare, ce pourcentage s’élève à
plus de 30% soit presqu’un tiers.
Quelles sont les gares les plus touchées par les retards à
l’arrivée et leurs causes ?
## Warning: Removed 49 rows containing missing values (`position_stack()`).

On retrouve encore une fois les gares des plus grandes villes de
France qui sont les plus touchées par les retards à l’arrivée, la Gare
de Lyon à Paris en première place, avec plus de 54 000 trains en retard
sur 5 ans.
On garde donc la même hypothèse : le grand nombre de voyageurs à
destination de ces villes renforce la probabilité de retard.
Les causes des retards à l’arrivée
## Warning: Removed 196 rows containing missing values (`position_stack()`).
