La présente étude s’intéresse au développement européen dans les diférents pays de l’union européenne, et plus précisément, à l’emploi selon les divers secteurs d’activités.
Les individus sont 26 pays européens (lesdonnées datent de 1979, ce qui expliquent les noms de certains pays) représentés par leur nom sur lesquels ont été mesurées 9 variables:
Notre travail de recherche consistera à trouver des points de convergences entre certaines variables, les regrouper entre elles, afin de faciliter la visualisation des données.
Pour atteindre notre objectif d’étude, nous nous appuierons sur la méthode de l’ACP (analyse par composante principale). Cette dernière consiste : à réduire la dimensionnalité d’un jeu de données tout en conservant l’essentiel de l’information. Elle permet d’identifier les axes majeurs de variation, de détecter les corrélations entre variables, et de projeter les observations dans un espace simplifié. En mobilisant cette méthode, nous pourrons visualiser les structures du développement européen et mieux comprendre les dynamiques sectorielles qui influencent l’employabilité.
Ici, il est difficile d’observer entre les pays des corrélations entre secteur qui soit vraiment corrélé très négativement. En revanche, on cosntate des corrélations négatives entre certains facteurs comme par exemple : le secteur de l’agriculture et celui du social ou encore les emplois dans les entreprises de services.
Nous allons représenter l’Analyse en Composantes Principales (ACP) selon deux angles complémentaires : par individus et par variables. Cette double visualisation permettra de regrouper les variables de manière plus lisible, tout en révélant les structures latentes du jeu de données.
D’après le cercle de corrélation de l’ACP (analyse des composantes principales), on distingue 5 orientations pour nos 9 variables. Par exemple, le secteur social et celui de l’entreprise de service ou encore la construction, le transport, l’electricité et les emplois dans les usines s’orientent tous les 4 dans une autre même direction. On sait désormais quelles variables peuvent être regroupées ensembles (grâce aux directions des flèches de chaques variables)
Le premier axe factoriel (Dim1) extrait par l’Analyse en Composantes Principales explique 40,6% de la variance totale du jeu de données. Le second axe factoriel (Dim2) explique quant à lui, 24.1% de la variance totale.
Sur le diagramme en barre, on constate que le coude se situe au niveau de la troisième et la quatrième composante. Ainsi, je choisirai donc de conserver les 3 premières composantes qui cumulent 64.8% de l’inertie totale. Intéressons-nous maintenant à savoir quel variables portent ces trois principales composantes que j’ai choisis de retenir.
| Dim.1 | Dim.2 | Dim.3 | Dim.4 | Dim.5 | |
|---|---|---|---|---|---|
| Agr. | 23.6632935 | 3.4736694 | 0.6653298 | 2.1350975 | 5.0498025 |
| Mines | 0.6544707 | 35.1823515 | 5.2477114 | 0.4991491 | 6.8391381 |
| Usines | 14.4984956 | 7.0677528 | 0.5492626 | 16.0395735 | 19.5954274 |
| Electric. | 6.8329469 | 4.1597912 | 44.0444986 | 2.6784618 | 28.8528747 |
| Construction | 11.2317285 | 0.0000008 | 34.4669088 | 7.6124385 | 18.8891347 |
| Ind..Serv. | 9.4621174 | 19.1252668 | 0.6786444 | 8.7316443 | 0.7893322 |
| Finance | 6.8463454 | 17.6613226 | 11.7861086 | 9.2809117 | 0.0516915 |
| Social | 11.5112379 | 12.6113199 | 2.5532644 | 18.4519357 | 13.0804970 |
| Transport | 15.2993641 | 0.7185250 | 0.0082715 | 34.5707878 | 6.8521019 |
Par le biais de ce tableau de données, on constate que le premier axe est porté principalement par l’emploi dans l’agriculture et les usines. Dans la réalité, il est difficile pourtant de trouver un lien clair entre ces deux activités. Le second axe quant à lui, est porté par les emplois dans les mines ainsi que dans les entreprises de services. Enfin, le troisième et dernier axe est soutenu par les emplois dans les usines de production électriques.
L’utilisation de l’ACP dans le cadre de notre étude nous a permis, sur la base de nos 9 variables, d’en distinguer 3 groupes majeures importants. Notre cercle de corrélation et le nuage de nos individus nous ont permis d’observer avec clarté les dynamiques attendus.
Dans le cercle, l’employabilité dans les secteurs du transport, de l’electricité, de la construction et dans les usines se retrouvent corrélés (modérément) avec une certaine proximité entre ces milieux. Ainsi, nous pourrions voir derrière ces regroupements, une polarisation des activités socio-économiques au sein des pays membres de l’union européenne.