1 Sujet :

La présente étude s’intéresse au développement européen dans les diférents pays de l’union européenne, et plus précisément, à l’emploi selon les divers secteurs d’activités.

1.1 Groupe d’étude :

Les individus sont 26 pays européens (lesdonnées datent de 1979, ce qui expliquent les noms de certains pays) représentés par leur nom sur lesquels ont été mesurées 9 variables:

  • Agri : pourcentage de travailleurs employés dans l’agriculture,
  • Mines : pourcentage de travailleurs employés dans les mines,
  • Usines : pourcentage de travailleurs employés dans les usines,
  • Elec : pourcentage de travailleurs employés dans les usines de production électrique,
  • Constru : pourcentage de travailleurs employés dans la construction
  • IndServ : pourcentage de travailleurs employés dans les entreprises de services,
  • Finance : pourcentage de travailleurs employés dans la finance
  • Social : pourcentage de travailleurs employés dans le domaine social
  • Transport : pourcentage de travailleurs employés dans le domaine du transport.

1.2 objectif :

Notre travail de recherche consistera à trouver des points de convergences entre certaines variables, les regrouper entre elles, afin de faciliter la visualisation des données.

2 Méthodologie :

Pour atteindre notre objectif d’étude, nous nous appuierons sur la méthode de l’ACP (analyse par composante principale). Cette dernière consiste : à réduire la dimensionnalité d’un jeu de données tout en conservant l’essentiel de l’information. Elle permet d’identifier les axes majeurs de variation, de détecter les corrélations entre variables, et de projeter les observations dans un espace simplifié. En mobilisant cette méthode, nous pourrons visualiser les structures du développement européen et mieux comprendre les dynamiques sectorielles qui influencent l’employabilité.

2.1 matrice de corrélation :

Ici, il est difficile d’observer entre les pays des corrélations entre secteur qui soit vraiment corrélé très négativement. En revanche, on cosntate des corrélations négatives entre certains facteurs comme par exemple : le secteur de l’agriculture et celui du social ou encore les emplois dans les entreprises de services.

Nous allons représenter l’Analyse en Composantes Principales (ACP) selon deux angles complémentaires : par individus et par variables. Cette double visualisation permettra de regrouper les variables de manière plus lisible, tout en révélant les structures latentes du jeu de données.

2.2 ACP par individus et par variables :

D’après le cercle de corrélation de l’ACP (analyse des composantes principales), on distingue 5 orientations pour nos 9 variables. Par exemple, le secteur social et celui de l’entreprise de service ou encore la construction, le transport, l’electricité et les emplois dans les usines s’orientent tous les 4 dans une autre même direction. On sait désormais quelles variables peuvent être regroupées ensembles (grâce aux directions des flèches de chaques variables)

Le premier axe factoriel (Dim1) extrait par l’Analyse en Composantes Principales explique 40,6% de la variance totale du jeu de données. Le second axe factoriel (Dim2) explique quant à lui, 24.1% de la variance totale.

3 Tableau des composantes principales :

Sur le diagramme en barre, on constate que le coude se situe au niveau de la troisième et la quatrième composante. Ainsi, je choisirai donc de conserver les 2 premières composantes qui cumulent 64.8% de l’inertie totale. Intéressons-nous maintenant à savoir quel variables portent ces trois principales composantes que j’ai choisis de retenir.

4 Tableau de contribution des variables pour les deux dimensions retenues :

Tableau des contributions des variables aux deux premières dimensions
Variables Contribution Dim 1 Contribution Dim 2
Agr. 23.6632935 3.4736694
Transport 15.2993641 0.7185250
Usines 14.4984956 7.0677528
Social 11.5112379 12.6113199
Construction 11.2317285 0.0000008
Ind..Serv. 9.4621174 19.1252668
Finance 6.8463454 17.6613226
Electric. 6.8329469 4.1597912
Mines 0.6544707 35.1823515

Par le biais de ce tableau de données, on constate que le premier axe est porté principalement par l’emploi dans l’agriculture et les usines. Dans la réalité, il est difficile pourtant de trouver un lien clair entre ces deux activités. Le second axe quant à lui, est porté par les emplois dans les mines ainsi que dans les entreprises de services.

5 Conclusion :

L’utilisation de l’ACP dans le cadre de notre étude nous a permis, sur la base de nos 9 variables, d’en distinguer 2 groupes majeures importants. Notre cercle de corrélation et le nuage de nos individus nous ont permis d’observer avec clarté les dynamiques attendus.

Dans le cercle, l’employabilité dans les secteurs du transport, de l’electricité, de la construction et dans les usines se retrouvent corrélés (modérément) avec une certaine proximité entre ces milieux. Ainsi, nous pourrions voir derrière ces regroupements, une polarisation des activités socio-économiques au sein des pays membres de l’union européenne.