Introduction

Ce jeu de données est issu de SNCF Open Data et a été nettoyé par Gaétan Dubuc, un data scientist chez Fogo (version anglaise). Il se compose de 32 colonnes d’informations pour chaque ligne de train par mois, pour toutes les lignes TGV de l’année 2015 à 2020. Dans le cadre de ce projet collaboratif, après avoir effectué une analyse générale, nous allons nous concentrer sur les informations relatives à la durée des trajets, aux trains en retard et à leurs fréquences, en visualisant leur relation. Ainsi, nous voulons tenter de trouver des corrélations qui expliqueraient la quantité de retard, la répartition des lignes selon les gares ou encore les pics de fréquentation de trains.

I. Analyse sommaire

1. La circulation moyenne de trains par mois entre 2015 et 2020

## # A tibble: 6 × 2
##    Year circulations_moyenne
##   <dbl>                <dbl>
## 1  2015                 289.
## 2  2016                 278.
## 3  2017                 291.
## 4  2018                 266.
## 5  2019                 257.
## 6  2020                 172.

En créant une nouvelle colonne montrant le nombre moyen de circulations prévues, on peut comparer les moyennes pour chaque année. Ce qui est intéressant, c’est que le chiffre a fortement diminué depuis 2020, année où la pandémie de Covid-19 s’est propagée dans le monde entier. Jusqu’à 2020, le nombre moyen de trajets TGV par mois était de 276,2.

2. L’annulation moyenne de trains par mois

## # A tibble: 6 × 2
##    Year annulations_moyenne
##   <dbl>               <dbl>
## 1  2015               0.690
## 2  2016               4.63 
## 3  2017               2.85 
## 4  2018              20.3  
## 5  2019               6.74 
## 6  2020              12.5

Comparé aux autres années, nous constatons une forte augmentation des annulations en 2018 et en 2020. Selon nos recherches, de nombreuses annulations ont eu lieu en raison de grandes grèves contre la réforme ferroviaire qui ont eu lieu d’avril à juin 2018. (Source) En 2020, le Covid-19 a contribué à cette augmentation des annulations.

2-1. Quelles sont les lignes les plus impactées par les annulations?

## # A tibble: 130 × 4
## # Groups:   Departure station [59]
##    `Departure station`  `Arrival station`    moyenne moyenne_annulations
##    <chr>                <chr>                  <dbl>               <dbl>
##  1 BORDEAUX ST JEAN     PARIS MONTPARNASSE      717.                29.8
##  2 PARIS MONTPARNASSE   BORDEAUX ST JEAN        668.                24.6
##  3 LYON PART DIEU       MARNE LA VALLEE         252.                24.0
##  4 RENNES               PARIS MONTPARNASSE      558.                20.6
##  5 LYON PART DIEU       MARSEILLE ST CHARLES    488.                19.5
##  6 PARIS MONTPARNASSE   RENNES                  551.                19.2
##  7 PARIS NORD           LILLE                   557.                18.0
##  8 MARNE LA VALLEE      LYON PART DIEU          296.                17.9
##  9 LILLE                PARIS NORD              546.                17.7
## 10 MARSEILLE ST CHARLES LYON PART DIEU          473.                17.7
## # … with 120 more rows

Suite à la question 2, on était curieux de savoir quelles lignes étaient le plus impactées par les annulations. Dans le tableau, les deux liaisons entre Bordeaux Saint Jean et Paris Montparnasse occupent respectivement les première et deuxième places. D’ailleurs, les dix premières liaisons sont toutes entre les grandes villes qui proposent plus de trains.

3. Les trajets les plus longs et les plus courts

## # A tibble: 7,806 × 3
##    duree_heures `Departure station`  `Arrival station`   
##           <dbl> <chr>                <chr>               
##  1        13.1  STRASBOURG           NANTES              
##  2         8.21 MADRID               MARSEILLE ST CHARLES
##  3         8.02 MADRID               MARSEILLE ST CHARLES
##  4         8.02 MADRID               MARSEILLE ST CHARLES
##  5         8.02 MADRID               MARSEILLE ST CHARLES
##  6         8.02 MADRID               MARSEILLE ST CHARLES
##  7         7.98 MADRID               MARSEILLE ST CHARLES
##  8         7.87 MADRID               MARSEILLE ST CHARLES
##  9         7.85 MADRID               MARSEILLE ST CHARLES
## 10         7.73 MARSEILLE ST CHARLES MADRID              
## # … with 7,796 more rows

On constate que le trajet le plus long est celui entre Strasbourg et Nantes, d’une durée de 13H01min. Il y a sûrement eu des problèmes anomaux mais qui ne sont pas mentionnées. Si nécessaire, on peut supprimer cette donnée très atypique pour une visualisation plus lisible. En revanche, les liaisons entre Madrid et Marseille occupent le deuxième au dixième rang, ce qui signifie que le trajet entre ces deux villes est normalement le plus long.

## # A tibble: 7,806 × 3
##    `Average travel time (min)` `Departure station` `Arrival station`
##                          <dbl> <chr>               <chr>            
##  1                        35.9 BARCELONA           PARIS LYON       
##  2                        46.0 PARIS EST           REIMS            
##  3                        46.0 PARIS EST           REIMS            
##  4                        46.0 PARIS EST           REIMS            
##  5                        46.0 PARIS EST           REIMS            
##  6                        46.0 PARIS EST           REIMS            
##  7                        46.0 PARIS EST           REIMS            
##  8                        46.0 PARIS EST           REIMS            
##  9                        46.0 PARIS EST           REIMS            
## 10                        46.0 REIMS               PARIS EST        
## # … with 7,796 more rows

Il y a également une donnée étrange qui montre une durée de trajet de 35 minutes entre Barcelone et Paris Lyon. Si on ignore cette donnée, le trajet le plus court est celui entre Paris Est et Reims. ## 5. Quelle est la durée des trajets au départ de Paris ?

Nous regardons la durée pour chaque connexion au départ des différentes gares Paris.

## # A tibble: 6 × 3
##    Year trajet_moyen heures_trajet
##   <dbl>        <dbl>         <dbl>
## 1  2015         162.          2.69
## 2  2016         162.          2.70
## 3  2017         147.          2.46
## 4  2018         135.          2.26
## 5  2019         136.          2.27
## 6  2020         137.          2.29

## # A tibble: 6 × 3
##    Year trajet_moyen heures_trajet
##   <dbl>        <dbl>         <dbl>
## 1  2015         76.2          1.27
## 2  2016         77.0          1.28
## 3  2017         74.0          1.23
## 4  2018         75.5          1.26
## 5  2019         76.1          1.27
## 6  2020         78.3          1.31

## # A tibble: 6 × 3
##    Year trajet_moyen heures_trajet
##   <dbl>        <dbl>         <dbl>
## 1  2015         179.          2.98
## 2  2016         180.          3.00
## 3  2017         191.          3.19
## 4  2018         197.          3.28
## 5  2019         198.          3.29
## 6  2020         193.          3.22

## # A tibble: 6 × 3
##    Year trajet_moyen heures_trajet
##   <dbl>        <dbl>         <dbl>
## 1  2015        103.           1.72
## 2  2016         98.8          1.65
## 3  2017        114.           1.91
## 4  2018        114.           1.90
## 5  2019        121.           2.02
## 6  2020        123.           2.05

Les trajets sont relativement courts et à partir de 2016, la moyenne diminue. Les destinations au départ de Montparnasse vont vers le Grand Ouest ce qui explique la courte durée.

Les heures moyennes de trajets au départ de Paris Nord varient entre 1h23 et 1h31, ce qui est encore plus court puisque les destinations ne sont pas très éloignées.

Au départ de la Gare de Lyon à Paris, les trajets durent en moyenne 3h.

Depuis Paris Est, les trajets sont en moyenne de 1h30 et 2h, on a des destiantions très proches, situées avant le Grand Est comme des destinations allemandes.

En fonction des gares de départ nous constatons que le temps de trajet est différent mais reste relativement court puisque entre les grandes gares il y a principalement des TGV qui circulent.

Les liaisons comprenant Paris sont donc rapides et il est possible que les individus favorisent ce moyen de locomotion pour partir à proximité pendant les weekends par exemple.

4. Combien de trains était en retard ?

Data summary
Name Trains$Number of late tra…
Number of rows 7806
Number of columns 1
_______________________
Column type frequency:
numeric 1
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
data 0 1 63.52 78.82 0 12 33 84 591 ▇▁▁▁▁

En moyenne, 63.5 trains par mois étaient présentaient un retard au départ.

## # A tibble: 2 × 2
##   `\`Number of late trains at departure\` < 1`     n
##   <lgl>                                        <int>
## 1 FALSE                                         7669
## 2 TRUE                                           137

Parmi 7806 lignes de trains de 2015 à 2020, il y a 137 lignes qui n’étaient jamais en retard au départ.

## # A tibble: 2 × 2
##   `\`Number of late trains at departure\` > 500`     n
##   <lgl>                                          <int>
## 1 FALSE                                           7797
## 2 TRUE                                               9
## # A tibble: 7,806 × 32
##     Year Month Departu…¹ Arriv…² Avera…³ Numbe…⁴ Numbe…⁵ Numbe…⁶ Avera…⁷ Avera…⁸
##    <dbl> <dbl> <chr>     <chr>     <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>
##  1  2019    10 PARIS MO… BORDEA…   150.      784      41     591    5.80    4.48
##  2  2019     9 PARIS MO… BORDEA…   151.      806       4     562    5.49    3.69
##  3  2020     2 PARIS MO… BORDEA…   148.      716       6     562    2.63    1.97
##  4  2020     2 PARIS NO… LILLE      66.4     597       6     558    4.01    3.77
##  5  2019    11 PARIS MO… BORDEA…   146.      738      29     548    6.53    4.92
##  6  2020     1 PARIS NO… LILLE      66.3     596      25     532    4.50    4.17
##  7  2019     6 LYON PAR… PARIS …   121.      625      25     503    4.21    3.51
##  8  2019    10 LYON PAR… PARIS …   121.      622      15     503    4.56    3.75
##  9  2019     6 PARIS MO… BORDEA…   152.      774       7     501    7.85    4.95
## 10  2019     9 LYON PAR… PARIS …   121.      601       5     482    3.69    2.95
## # … with 7,796 more rows, 22 more variables:
## #   `Comment (optional) delays at departure` <lgl>,
## #   `Number of trains late on arrival` <dbl>,
## #   `Average delay of late arriving trains (min)` <dbl>,
## #   `Average delay of all arriving trains (min)` <dbl>,
## #   `Comment (optional) delays on arrival` <chr>,
## #   `% trains late due to external causes (weather, obstacles, suspicious packages, malevolence, social movements, etc.)` <dbl>, …

Cependant, sur un mois, 9 lignes avaient plus de 500 trains en retard au départ et sur ces 9, 7 lignes partaient de Paris et 2 partaient de Lyon.

II. Analyse du retard

1. Y a-t-il une relation entre la durée moyenne du trajet et la proportion de retard au départ ?

Nous créons une nouvelle colonne pour connaître le nombre de trains qui ont effectivement circulé et la nommons number_trains.

Pour analyser le pourcentage du nombre de trains, nous divisons le nombre de trains en retard au départ par le nombre de trains effectivement circulés et créons une nouvelle colonne nommé prct_retard_depart.

## [1] -0.02471527

On a fait le test de corrélation entre la durée moyenne de trajet et le pourcentage du retard au départ, mais on ne voit pas une corrélation significative ni sur le graphe, ni dans le résultat de test (Le calcul de coefficient de corrélation = -0.02)

## [1] 0.6713209

Mais, lorsqu’on analyse le nuage de points par année, on voit que les années les plus récentes sont plus présentes vers le haut du graphique donc leur taux de retard est plus élevé que celui des années précédentes. Le résultat du test de corrélation entre les deux données est aussi positif (R = 0.65).

Pour voir le détail, on a vu le pourcentage moyen du retard au départ par chaque année en utilisant le filtre et le skim du tidyverse. En conséquence, le pourcentage moyen est de 9.27% en 2015; 10.8% en 2016; 12.1% en 2017; 28.2% en 2018; 50.7% en 2019 et 65.8% en 2020.

Le pourcentage du retard augmente au fur et à mesure des années. Cette augmentation s’accélère à partir de 2019. Les raisons peuvent être multiples et se superposent sûrement : les grèves de 2019 montrent le mécontentement des salariés face aux emplois supprimés, aux salaires et aux conditions de travail. Selon le “Bilan social 2019” de la SNCF, 7000 postes ont été supprimés entre 2017 et 2019.

Source : (https://www.francetvinfo.fr/economie/transports/sncf/sncf-7-000-emplois-supprimes-entre-2017-et-2019-les-syndicats-toujours-plus-inquiets_4225075.html))

2. Parmi les trains au départ de Paris, quelle gare a le plus de retard ?

  • PARIS MONTPARNASSE

A Paris Montparnasse, on compte 1056 lignes comptabilisant un retard moyen de 14.8 minutes.

  • PARIS EST

A Paris Est, la gare réalise des trajets sur 396 lignes et présente un retard moyen de 15.7 minutes.

  • PARIS LYON

Pour la gare de Paris Lyon, il y a eu des trajets sur 1614 lignes avec un retard moyen de 16.1 minutes.

  • PARIS NORD

Enfin, entre 2015 et 2020, la gare de Paris Nord a réalisé des trajets sur 264 lignes et présente un retard moyen de 18.1 minutes

Il y a une grande différence de nombre de trajets mensuels et annuels au départ des différentes gares de Paris.

Paris Montparnasse comptabilise près de 4 fois plus de liaisons qu’a Paris Nord et Paris Lyon 6 fois plus.

Malgré le nombre inférieurs de lignes, la moyenne du retard est plus importante au départ de Paris Nord qu’au départ des 3 autres gares. Elle représente 4 minutes de plus que la moyenne des retard des trains au départ de d’autres villes.

3. Quelles sont les gares les plus touchées par les retards au départ et leurs causes ?

Sur les 10 premières gares qui ont le plus de retard au départ, il y a les 4 gares de Paris, Lyon, Marseille, Lille, Bordeaux, Rennes et Strasbourg, soit des grandes villes françaises.
On peut constater que cela est dû au grand nombre de voyageurs au départ de ces villes grâce à leur nombre d’habitants beaucoup plus supérieur aux autres villes en France. La probabilité que des retards aient lieu à cause de différents facteurs est donc plus grande.

4.Les causes de rétard au départ

On remarque que les causes principales de retard au départ de ces gares sont des facteurs externes (temps, obstacles, colis suspects, mouvements sociaux etc…) à plus de 25%, à l’exception des gares de Paris Montparnasse et Bordeaux St Jean. Ces derniers ont pour cause principale de retard les problèmes d’infrastructure. Dans chacune de ces gare, ce pourcentage s’élève à plus de 30% soit presqu’un tiers.

5. Quelles sont les gares les plus touchées par les retards au départ et leurs causes ?

On retrouve encore une fois les gares des plus grandes villes de France qui sont les plus touchées par les retards à l’arrivée, la Gare de Lyon à Paris en première place, avec plus de 54 000 trains en retard sur 5 ans. On garde donc la même hypothèse : le grand nombre de voyageurs à destination de ces villes renforce la probabilité de retard.

Les causes des retards à l’arrivée

Parmi les différentes causes du retard, nous avons pu distinguer plusieurs facteurs par rapport a celles des gares de départ.

On remarque encore une fois que la cause principale des retards à l’arrivée comme au départ de la gare de Paris Montparnasse est un problème d’infrastructure, avec plus de 30 000 trains en retard pour cette cause, soit plus de la moitié.

On distingue également une autre cause à l’arrivée qui n’était pas présente au départ qui est la gestion du trafic (Traffic management) à la gare Paris Est (31% des causes de retard).

III. Analyse des fréquences

1. Quels sont les trajets les plus fréquentés par an ?

## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2015     8 BORDEAUX ST JEAN    PARIS MONTPARNASSE           691
##  2  2015     3 BORDEAUX ST JEAN    PARIS MONTPARNASSE           682
##  3  2015    12 BORDEAUX ST JEAN    PARIS MONTPARNASSE           678
##  4  2015    10 BORDEAUX ST JEAN    PARIS MONTPARNASSE           678
##  5  2015     7 BORDEAUX ST JEAN    PARIS MONTPARNASSE           676
##  6  2015     9 BORDEAUX ST JEAN    PARIS MONTPARNASSE           663
##  7  2015     5 BORDEAUX ST JEAN    PARIS MONTPARNASSE           663
##  8  2015     4 BORDEAUX ST JEAN    PARIS MONTPARNASSE           661
##  9  2015     7 PARIS MONTPARNASSE  BORDEAUX ST JEAN             655
## 10  2015     8 PARIS MONTPARNASSE  BORDEAUX ST JEAN             655

En 2015, les trains ont été les plus nombreux sur la ligne Bordeaux Saint Jean - Paris Montparnasse avec plus de 600 trajets par mois dans les deux sens.

Les 10 premières lignes sont entre ces 2 gares.

## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2016    12 PARIS MONTPARNASSE  BORDEAUX ST JEAN             691
##  2  2016     7 BORDEAUX ST JEAN    PARIS MONTPARNASSE           689
##  3  2016     8 BORDEAUX ST JEAN    PARIS MONTPARNASSE           685
##  4  2016     7 PARIS MONTPARNASSE  BORDEAUX ST JEAN             671
##  5  2016    10 BORDEAUX ST JEAN    PARIS MONTPARNASSE           667
##  6  2016    12 BORDEAUX ST JEAN    PARIS MONTPARNASSE           657
##  7  2016     9 BORDEAUX ST JEAN    PARIS MONTPARNASSE           654
##  8  2016     8 PARIS MONTPARNASSE  BORDEAUX ST JEAN             653
##  9  2016    11 BORDEAUX ST JEAN    PARIS MONTPARNASSE           644
## 10  2016     7 AVIGNON TGV         PARIS LYON                   643

En 2016, la tendance est la même. Avec les mois de décembre et d’août ayant le plus de trains par mois.

Mais en 10ème position on a 643 trains qui sont partis de Avignon vers Paris en juillet 2016 (mois du Festival d’Avignon).

## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2017    10 BORDEAUX ST JEAN    PARIS MONTPARNASSE           869
##  2  2017    11 BORDEAUX ST JEAN    PARIS MONTPARNASSE           848
##  3  2017     9 BORDEAUX ST JEAN    PARIS MONTPARNASSE           839
##  4  2017    12 BORDEAUX ST JEAN    PARIS MONTPARNASSE           826
##  5  2017    10 PARIS MONTPARNASSE  BORDEAUX ST JEAN             814
##  6  2017    11 PARIS MONTPARNASSE  BORDEAUX ST JEAN             786
##  7  2017     8 BORDEAUX ST JEAN    PARIS MONTPARNASSE           779
##  8  2017     9 PARIS MONTPARNASSE  BORDEAUX ST JEAN             778
##  9  2017    12 PARIS MONTPARNASSE  BORDEAUX ST JEAN             757
## 10  2017     7 BORDEAUX ST JEAN    PARIS MONTPARNASSE           756

En 2017, on retrouve seulement des lignes entre Bordeaux et Paris, avec 100 à 200 trains en plus par mois que les 2 années précédentes. Il y a peut-être plus de données sur cette année-là .

On remarque aussi une forte offre de trains sur la fin d’année, tous les mois sont compris entre juillet et décembre. On imagine beaucoup de circulations l’été et au moment des vacances scolaires et des fêtes de fin d’année.

## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2018     1 BORDEAUX ST JEAN    PARIS MONTPARNASSE           865
##  2  2018     3 BORDEAUX ST JEAN    PARIS MONTPARNASSE           843
##  3  2018    12 BORDEAUX ST JEAN    PARIS MONTPARNASSE           830
##  4  2018    10 BORDEAUX ST JEAN    PARIS MONTPARNASSE           795
##  5  2018    11 BORDEAUX ST JEAN    PARIS MONTPARNASSE           788
##  6  2018     9 BORDEAUX ST JEAN    PARIS MONTPARNASSE           783
##  7  2018     1 PARIS MONTPARNASSE  BORDEAUX ST JEAN             768
##  8  2018     2 BORDEAUX ST JEAN    PARIS MONTPARNASSE           762
##  9  2018    12 PARIS MONTPARNASSE  BORDEAUX ST JEAN             757
## 10  2018     3 PARIS MONTPARNASSE  BORDEAUX ST JEAN             733

En 2018, la situation semble assez similaire, mais il y a davantage de trains en début d’année (entre janvier et mars), surtout des trains provenant de Bordeaux à destination de Paris.

## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2019     3 BORDEAUX ST JEAN    PARIS MONTPARNASSE           868
##  2  2019     1 BORDEAUX ST JEAN    PARIS MONTPARNASSE           861
##  3  2019     5 BORDEAUX ST JEAN    PARIS MONTPARNASSE           846
##  4  2019     9 BORDEAUX ST JEAN    PARIS MONTPARNASSE           839
##  5  2019     6 BORDEAUX ST JEAN    PARIS MONTPARNASSE           833
##  6  2019     4 BORDEAUX ST JEAN    PARIS MONTPARNASSE           810
##  7  2019     9 PARIS MONTPARNASSE  BORDEAUX ST JEAN             802
##  8  2019     7 BORDEAUX ST JEAN    PARIS MONTPARNASSE           799
##  9  2019     3 PARIS MONTPARNASSE  BORDEAUX ST JEAN             797
## 10  2019     5 PARIS MONTPARNASSE  BORDEAUX ST JEAN             794
## # A tibble: 10 × 5
##     Year Month `Departure station` `Arrival station`  number_trains
##    <dbl> <dbl> <chr>               <chr>                      <dbl>
##  1  2020     2 BORDEAUX ST JEAN    PARIS MONTPARNASSE           759
##  2  2020     2 PARIS MONTPARNASSE  BORDEAUX ST JEAN             710
##  3  2020     1 BORDEAUX ST JEAN    PARIS MONTPARNASSE           619
##  4  2020     2 PARIS MONTPARNASSE  RENNES                       597
##  5  2020     2 LYON PART DIEU      PARIS LYON                   597
##  6  2020     2 PARIS LYON          LYON PART DIEU               593
##  7  2020     2 PARIS NORD          LILLE                        591
##  8  2020     6 PARIS MONTPARNASSE  BORDEAUX ST JEAN             577
##  9  2020     1 PARIS NORD          LILLE                        571
## 10  2020     1 PARIS MONTPARNASSE  BORDEAUX ST JEAN             568

Les trajets entre Bordeaux et Paris restent en top 3. Mais on a davantage de villes différentes : Rennes, Lyon, Lille dans les 10 lignes qui proposent le plus de trains par mois. Toutes ont un départ ou une arrivée de/à Paris. L’offre est cependant un peu réduite par rapport aux 2 années précédentes, sûrement en lien avec la pandémie et les confinements puisque le mois ayant une offre plus élevée de trains est surtout le mois de février, avant le premier confinement.

Comparons la ligne la plus fréquentée de chaque année avec les autres années.

## # A tibble: 6 × 5
##    Year Month `Departure station` `Arrival station`  number_trains
##   <dbl> <dbl> <chr>               <chr>                      <dbl>
## 1  2015     8 BORDEAUX ST JEAN    PARIS MONTPARNASSE           691
## 2  2016    12 PARIS MONTPARNASSE  BORDEAUX ST JEAN             691
## 3  2017    10 BORDEAUX ST JEAN    PARIS MONTPARNASSE           869
## 4  2018     1 BORDEAUX ST JEAN    PARIS MONTPARNASSE           865
## 5  2019     3 BORDEAUX ST JEAN    PARIS MONTPARNASSE           868
## 6  2020     2 BORDEAUX ST JEAN    PARIS MONTPARNASSE           759

Entre 2015 et 2020, la connexion entre Paris et Bordeaux a été la plus nombreuse. A partir de 2017, le nombre de trains mensuel partant de Bordeaux en direction de Paris a augmenté de plus de 150.

2. La fréquentation est-elle plus importante en été ou en hiver ?

Créons une colonne “saison” pour réunir les mois de janvier et décembre en hiver et ceux de juillet et août en été.

Chaque année, on peut apercevoir un “foyer” en hiver aux alentours de 250 trains mais certaines lignes proposent une dizaine de trains par mois tandis que d’autres plus de 600. En été, le “foyer” de concentration semble un peu plus élargi: entre 100 et 350. Seules les années 2017 à 2019 dépassent le pallier de 750 trains mensuels. En 2020 cependant, aucun train d’été n’est représenté puisque le jeu de données ne comprend pas ces mois-là.

Sur les deux périodes (été et hiver), l’offre est plus conséquente pour les trajets reliant Paris à Bordeaux comme vu précédemment par année. Davantage de trains circulent en décembre et en janvier qu’en été, sûrement à cause des fêtes de fin d’années. Le train est peut être moins fréquenté en été puisque les individus favoriseraient des trajets de plus longue distance (par avion par exemple).

Conclusion

La SNCF propose un service très centralisé. Les trajets à l’offre la plus nombreuse sont toujours au départ ou à l’arrivée de Paris, délaissant les lignes possibles entre les villes françaises. Cependant, les nombreux retards et annulations par mois sont parfois alarmants et soulèvent des questions sur la qualité des infrastructures proposées par ce quasi unique service disponible. De plus, la cause extérieure étant responsable de nombreux retards, qu’en est-il de la reconnaissance de ces travailleurs grâce à qui tous ces trajets sont possibles ?