## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.4.1      ✔ purrr   1.0.1 
## ✔ tibble  3.1.8      ✔ dplyr   1.0.10
## ✔ tidyr   1.2.1      ✔ stringr 1.4.1 
## ✔ readr   2.1.2      ✔ forcats 0.5.2 
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## 
## Attachement du package : 'plotly'
## 
## 
## L'objet suivant est masqué depuis 'package:ggplot2':
## 
##     last_plot
## 
## 
## L'objet suivant est masqué depuis 'package:stats':
## 
##     filter
## 
## 
## L'objet suivant est masqué depuis 'package:graphics':
## 
##     layout

Importation des données ————————————————-

Producteur originaire : SNCF Voyageurs

Trains <- read_csv("C:/Users/Ko/OneDrive/Nanterre/S2/Projet collaboratif/Regularities_by_liaisons_Trains_France.csv")
## Rows: 7806 Columns: 32
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr  (4): Departure station, Arrival station, Comment (optional) delays on a...
## dbl (27): Year, Month, Average travel time (min), Number of expected circula...
## lgl  (1): Comment (optional) delays at departure
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Quelles sont les gares les plus touchées par les retards au départ et leurs causes ?

## Warning: Removed 49 rows containing missing values (`position_stack()`).

Sur les 10 premières gares qui ont le plus de retard au départ, il y a les 4 gares de Paris, Lyon, Marseille, Lille, Bordeaux, Rennes et Strasbourg, soit des grandes villes françaises.

On peut constater que cela est dû au grand nombre de voyageurs au départ de ces villes grâce à leur nombre d’habitants beaucoup plus supérieur aux autres villes en France.

La probabilité que des retards aient lieu à cause de différents facteurs est donc plus grande.

Les causes de retard au départ

## Warning: Removed 196 rows containing missing values (`position_stack()`).

On remarque que les causes principales de retard au départ de ces gares sont des facteurs externes (temps, obstacles, colis suspects, mouvements sociaux etc…) à plus de 25%, à l’exception des gares de Paris Montparnasse et Bordeaux St Jean.

Ces derniers ont pour cause principale de retard les problèmes d’infrastructure. Dans chacune de ces gare, ce pourcentage s’élève à plus de 30% soit presqu’un tiers.

Quelles sont les gares les plus touchées par les retards à l’arrivée et leurs causes ?

## Warning: Removed 49 rows containing missing values (`position_stack()`).

On retrouve encore une fois les gares des plus grandes villes de France qui sont les plus touchées par les retards à l’arrivée, la Gare de Lyon à Paris en première place, avec plus de 54 000 trains en retard sur 5 ans.

On garde donc la même hypothèse : le grand nombre de voyageurs à destination de ces villes renforce la probabilité de retard.

Les causes des retards à l’arrivée

## Warning: Removed 196 rows containing missing values (`position_stack()`).