1 Sujet :

La présente étude s’intéresse au développement européen dans les diférents pays de l’union européenne, et plus précisément, à l’emploi selon les divers secteurs d’activités.

1.1 Groupe d’étude :

Les individus sont 26 pays européens (lesdonnées datent de 1979, ce qui expliquent les noms de certains pays) représentés par leur nom sur lesquels ont été mesurées 9 variables:

  • Agri : pourcentage de travailleurs employés dans l’agriculture,
  • Mines : pourcentage de travailleurs employés dans les mines,
  • Usines : pourcentage de travailleurs employés dans les usines,
  • Elec : pourcentage de travailleurs employés dans les usines de production électrique,
  • Constru : pourcentage de travailleurs employés dans la construction
  • IndServ : pourcentage de travailleurs employés dans les entreprises de services,
  • Finance : pourcentage de travailleurs employés dans la finance
  • Social : pourcentage de travailleurs employés dans le domaine social
  • Transport : pourcentage de travailleurs employés dans le domaine du transport.

1.2 objectif :

Notre travail de recherche consistera à trouver des points de convergences entre certaines variables, les regrouper entre elles, afin de faciliter la visualisation des données.

2 Méthodologie :

Pour atteindre notre objectif d’étude, nous nous appuierons sur la méthode de l’ACP (analyse par composante principale). Cette dernière consiste : à réduire la dimensionnalité d’un jeu de données tout en conservant l’essentiel de l’information. Elle permet d’identifier les axes majeurs de variation, de détecter les corrélations entre variables, et de projeter les observations dans un espace simplifié. En mobilisant cette méthode, nous pourrons visualiser les structures du développement européen et mieux comprendre les dynamiques sectorielles qui influencent l’employabilité.

2.1 matrice de corrélation :

Ici, il est difficile d’observer entre les pays des corrélations entre secteur qui soit vraiment corrélé très négativement. En revanche, on cosntate des corrélations négatives entre certains facteurs comme par exemple : le secteur de l’agriculture et celui du social ou encore les emplois dans les entreprises de services.

Nous allons représenter l’Analyse en Composantes Principales (ACP) selon deux angles complémentaires : par individus et par variables. Cette double visualisation permettra de regrouper les variables de manière plus lisible, tout en révélant les structures latentes du jeu de données.

2.2 ACP par individus et par variables :

D’après le cercle de corrélation de l’ACP (analyse des composantes principales), on distingue 5 orientations pour nos 9 variables. Par exemple, le secteur social et celui de l’entreprise de service ou encore la construction, le transport, l’electricité et les emplois dans les usines s’orientent tous les 4 dans une autre même direction. On sait désormais quelles variables peuvent être regroupées ensembles (grâce aux directions des flèches de chaques variables)

Le premier axe factoriel (Dim1) extrait par l’Analyse en Composantes Principales explique 40,6% de la variance totale du jeu de données. Le second axe factoriel (Dim2) explique quant à lui, 24.1% de la variance totale.

3 Tableau des composantes principales :

Sur le diagramme en barre, on constate que le coude se situe au niveau de la troisième et la quatrième composante. Ainsi, je choisirai donc de conserver les 3 premières composantes qui cumulent 64.8% de l’inertie totale. Intéressons-nous maintenant à savoir quel variables portent ces trois principales composantes que j’ai choisis de retenir.

4 Tableau de contribution des variables pour les trois dimensions retenues :

Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
Agr. 23.6632935 3.4736694 0.6653298 2.1350975 5.0498025
Mines 0.6544707 35.1823515 5.2477114 0.4991491 6.8391381
Usines 14.4984956 7.0677528 0.5492626 16.0395735 19.5954274
Electric. 6.8329469 4.1597912 44.0444986 2.6784618 28.8528747
Construction 11.2317285 0.0000008 34.4669088 7.6124385 18.8891347
Ind..Serv. 9.4621174 19.1252668 0.6786444 8.7316443 0.7893322
Finance 6.8463454 17.6613226 11.7861086 9.2809117 0.0516915
Social 11.5112379 12.6113199 2.5532644 18.4519357 13.0804970
Transport 15.2993641 0.7185250 0.0082715 34.5707878 6.8521019

Par le biais de ce tableau de données, on constate que le premier axe est porté principalement par l’emploi dans l’agriculture et les usines. Dans la réalité, il est difficile pourtant de trouver un lien clair entre ces deux activités. Le second axe quant à lui, est porté par les emplois dans les mines ainsi que dans les entreprises de services. Enfin, le troisième et dernier axe est soutenu par les emplois dans les usines de production électriques.

5 Conclusion :

L’utilisation de l’ACP dans le cadre de notre étude nous a permis, sur la base de nos 9 variables, d’en distinguer 3 groupes majeures importants. Notre cercle de corrélation et le nuage de nos individus nous ont permis d’observer avec clarté les dynamiques attendus.

Dans le cercle, l’employabilité dans les secteurs du transport, de l’electricité, de la construction et dans les usines se retrouvent corrélés (modérément) avec une certaine proximité entre ces milieux. Ainsi, nous pourrions voir derrière ces regroupements, une polarisation des activités socio-économiques au sein des pays membres de l’union européenne.