Data set : Insertion professionnelle des diplômés de Master
Lien : https://www.data.gouv.fr/fr/datasets/insertion-professionnelle-des-diplomes-de-master-en-universites-et-etablissements-assimil-0/
data <- read.csv2(file.choose())
head(data)## annee diplome numero_de_l_etablissement etablissement
## 1 2010 MASTER LMD 0211237F Dijon - Bourgogne
## 2 2010 MASTER LMD 0251215K Besançon - Franche-Comté
## 3 2010 MASTER LMD 0211237F Dijon - Bourgogne
## 4 2010 MASTER LMD 0171463Y La Rochelle
## 5 2010 MASTER LMD 0171463Y La Rochelle
## 6 2010 MASTER LMD 0311382J Toulouse 1 - Capitole
## code_de_l_academie academie code_du_domaine domaine
## 1 A07 Dijon SHS Sciences humaines et sociales
## 2 A03 Besançon DEG Droit, économie et gestion
## 3 A07 Dijon SHS Sciences humaines et sociales
## 4 A13 Poitiers STS Sciences, technologies et santé
## 5 A13 Poitiers STS Sciences, technologies et santé
## 6 A16 Toulouse DEG Droit, économie et gestion
## code_de_la_discipline
## 1 disc07
## 2 disc04
## 3 disc08
## 4 disc15
## 5 disc16
## 6 disc05
## discipline
## 1 Ensemble sciences humaines et sociales
## 2 Gestion
## 3 Histoire-géographie
## 4 Sciences de l'ingénieur
## 5 Informatique
## 6 Autres formations juridiques, économiques et de gestion
## situation remarque nombre_de_reponses taux_de_reponse
## 1 30 mois après le diplôme 134 78
## 2 30 mois après le diplôme 44 76
## 3 30 mois après le diplôme 10 79
## 4 30 mois après le diplôme 32 62
## 5 30 mois après le diplôme 17 52
## 6 30 mois après le diplôme 9 71
## poids_de_la_discipline taux_dinsertion
## 1 24 90
## 2 12 91
## 3 2 ns
## 4 16 100
## 5 9 ns
## 6 2 ns
## emplois_cadre_ou_professions_intermediaires emplois_stables
## 1 77 58
## 2 79 85
## 3 ns ns
## 4 97 97
## 5 ns ns
## 6 ns ns
## emplois_a_temps_plein salaire_net_median_des_emplois_a_temps_plein
## 1 80 1560
## 2 100 ns
## 3 ns ns
## 4 100 ns
## 5 ns ns
## 6 ns ns
## salaire_brut_annuel_estime de_diplomes_boursiers taux_de_chomage_regional
## 1 24300 33.00 9.7
## 2 ns 38.00 9.9
## 3 ns 33.00 9.7
## 4 ns 36.00 9.8
## 5 ns 36.00 9.8
## 6 ns 30.00 10.4
## salaire_net_mensuel_median_regional emplois_cadre
## 1 1710 nd
## 2 1730 nd
## 3 1710 nd
## 4 1670 nd
## 5 1670 nd
## 6 1730 nd
## emplois_exterieurs_a_la_region_de_luniversite femmes
## 1 nd nd
## 2 nd nd
## 3 nd nd
## 4 nd nd
## 5 nd nd
## 6 nd nd
## salaire_net_mensuel_regional_1er_quartile
## 1
## 2
## 3
## 4
## 5
## 6
## salaire_net_mensuel_regional_3eme_quartile cle_etab
## 1 Dijon - Bourgogne_30
## 2 Besançon - Franche-Comté_30
## 3 Dijon - Bourgogne_30
## 4 La Rochelle_30
## 5 La Rochelle_30
## 6 Toulouse 1 - Capitole_30
## cle_disc
## 1 disc07_30
## 2 disc04_30
## 3 disc08_30
## 4 disc15_30
## 5 disc16_30
## 6 disc05_30
table(data$domaine)##
## Droit, économie et gestion
## 120 2236
## Lettres, langues, arts Masters enseignement
## 460 429
## Sciences humaines et sociales Sciences, technologies et santé
## 2050 2678
table(data$discipline)##
##
## 120
## Économie
## 413
## Autres formations juridiques, économiques et de gestion
## 351
## Autres sciences humaines et sociales
## 477
## Autres sciences, technologies et santé
## 393
## Droit
## 455
## Ensemble formations juridiques, économiques et de gestion
## 540
## Ensemble sciences humaines et sociales
## 562
## Ensemble sciences, technologies et santé
## 545
## Gestion
## 477
## Histoire-géographie
## 416
## Information communication
## 341
## Informatique
## 473
## Lettres, langues, arts
## 460
## Masters enseignement
## 325
## Masters enseignement : premier degré
## 42
## Masters enseignement : second degré, CPE...
## 62
## Psychologie
## 254
## Sciences de l'ingénieur
## 383
## Sciences de la vie et de la terre
## 435
## Sciences fondamentales
## 449
table(data$academie)##
## Aix-Marseille Amiens Besançon
## 145 244 137 151
## Bordeaux Caen Clermont-Ferrand Corse
## 298 137 194 106
## Créteil Dijon Grenoble Guadeloupe
## 500 145 316 114
## La Réunion Lille Limoges Lyon
## 124 584 122 417
## Montpellier Nancy-Metz Nantes Nice
## 356 139 381 237
## Orléans-Tours Paris Poitiers Reims
## 266 573 240 175
## Rennes Rouen Strasbourg Toulouse
## 449 239 255 321
## Versailles
## 608
Question 1
### on regarde la classe des vecteurs
class(data$discipline)## [1] "character"
class(data$taux_de_reponse)## [1] "integer"
Gestion des données manquantes
summary(data)## annee diplome numero_de_l_etablissement etablissement
## Min. :2010 Length:7973 Length:7973 Length:7973
## 1st Qu.:2011 Class :character Class :character Class :character
## Median :2012 Mode :character Mode :character Mode :character
## Mean :2012
## 3rd Qu.:2013
## Max. :2014
##
## code_de_l_academie academie code_du_domaine domaine
## Length:7973 Length:7973 Length:7973 Length:7973
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## code_de_la_discipline discipline situation remarque
## Length:7973 Length:7973 Length:7973 Length:7973
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## nombre_de_reponses taux_de_reponse poids_de_la_discipline taux_dinsertion
## Min. : 0.0 Min. : 0.00 Length:7973 Length:7973
## 1st Qu.: 15.0 1st Qu.: 65.00 Class :character Class :character
## Median : 35.0 Median : 73.00 Mode :character Mode :character
## Mean : 120.5 Mean : 72.18
## 3rd Qu.: 80.0 3rd Qu.: 81.00
## Max. :12584.0 Max. :100.00
## NA's :47 NA's :169
## emplois_cadre_ou_professions_intermediaires emplois_stables
## Length:7973 Length:7973
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## emplois_a_temps_plein salaire_net_median_des_emplois_a_temps_plein
## Length:7973 Length:7973
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## salaire_brut_annuel_estime de_diplomes_boursiers taux_de_chomage_regional
## Length:7973 Length:7973 Length:7973
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
##
## salaire_net_mensuel_median_regional emplois_cadre
## Length:7973 Length:7973
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## emplois_exterieurs_a_la_region_de_luniversite femmes
## Length:7973 Length:7973
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## salaire_net_mensuel_regional_1er_quartile
## Length:7973
## Class :character
## Mode :character
##
##
##
##
## salaire_net_mensuel_regional_3eme_quartile cle_etab
## Length:7973 Length:7973
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## cle_disc
## Length:7973
## Class :character
## Mode :character
##
##
##
##
table(data$taux_dinsertion) # trois modalités marquant une valeur manquante: "", "nd", et "ns"##
## 100 56 60 61 62 63 64 65 66 67 68 69 70 71 72
## 180 143 1 1 1 1 2 3 1 6 9 10 17 16 26 13
## 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88
## 25 39 25 46 57 74 82 77 117 111 161 171 184 196 213 220
## 89 90 91 92 93 94 95 96 97 98 99 nd ns
## 235 301 282 253 277 265 195 154 198 139 50 88 3308
data$taux_dinsertion <- as.character(data$taux_dinsertion)
table(data$emplois_a_temps_plein) # trois modalités marquant une valeur manquante: "", "nd", et "ns"##
## 100 39 41 42 44 45 46 47 48 50 51 52 53 54 55
## 180 521 1 1 1 1 3 2 4 3 2 4 4 10 2 7
## 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
## 8 3 9 11 12 9 7 12 10 12 8 13 23 14 14 20
## 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87
## 16 18 22 25 25 32 32 25 42 54 54 58 55 76 73 74
## 88 89 90 91 92 93 94 95 96 97 98 99 nd ns
## 83 74 108 146 127 161 194 260 306 399 422 247 148 3686
data$emplois_a_temps_plein <- as.character(data$emplois_a_temps_plein)
table(data$salaire_net_mensuel_median_regional) # deux modalités marquant une valeur manquante: "." et "nd"##
## . 1580 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780
## 56 15 105 119 79 188 111 112 267 179 486 141 553 702 85 856
## 1790 1800 1810 1820 1830 1840 1870 1950 1990 2020 2050 2070 2090 nd
## 202 271 174 342 837 178 72 14 421 422 425 426 15 120
# on retire les données avec des valeurs manquantes
data2 <- data[data$taux_dinsertion != "ns" & data$taux_dinsertion != "nd" & data$taux_dinsertion != "" & data$emplois_a_temps_plein != "ns" & data$emplois_a_temps_plein != "nd" & data$emplois_a_temps_plein != "" & data$salaire_net_mensuel_median_regional != "nd" & data$salaire_net_mensuel_median_regional != ".",]
### on met les vecteurs au format 'numeric' (pour pouvoir calculer les moyennes)
data2$taux_dinsertion <- as.numeric(data2$taux_dinsertion)
data2$emplois_a_temps_plein <- as.numeric(data2$emplois_a_temps_plein)
data2$salaire <- as.numeric(data2$salaire_net_mensuel_median_regional)On construit le tableau avec la fonction aggregate
# taux d'insertion moyen par discipline
taux_dinsertion <- aggregate(data2$taux_dinsertion, list(discipline=data2$discipline), mean)
taux_dinsertion## discipline x
## 1 96.72603
## 2 Économie 88.29730
## 3 Autres formations juridiques, économiques et de gestion 88.25688
## 4 Autres sciences humaines et sociales 84.56970
## 5 Autres sciences, technologies et santé 91.02273
## 6 Droit 90.12108
## 7 Ensemble formations juridiques, économiques et de gestion 89.91921
## 8 Ensemble sciences humaines et sociales 85.58656
## 9 Ensemble sciences, technologies et santé 89.10791
## 10 Gestion 91.78989
## 11 Histoire-géographie 82.63291
## 12 Information communication 87.63699
## 13 Informatique 95.56489
## 14 Lettres, langues, arts 85.53846
## 15 Masters enseignement 97.21053
## 16 Masters enseignement : premier degré 96.19355
## 17 Masters enseignement : second degré, CPE... 97.68750
## 18 Psychologie 89.49123
## 19 Sciences de l'ingénieur 90.84868
## 20 Sciences de la vie et de la terre 83.59677
## 21 Sciences fondamentales 88.37984
# taux d'emplois à temps plein moyen par discipline
emplois_a_temps_plein <- aggregate(data2$emplois_a_temps_plein , list(discipline=data2$discipline), mean)
emplois_a_temps_plein## discipline x
## 1 91.13699
## 2 Économie 96.07207
## 3 Autres formations juridiques, économiques et de gestion 95.20183
## 4 Autres sciences humaines et sociales 89.04242
## 5 Autres sciences, technologies et santé 92.40909
## 6 Droit 95.00448
## 7 Ensemble formations juridiques, économiques et de gestion 96.50437
## 8 Ensemble sciences humaines et sociales 81.97933
## 9 Ensemble sciences, technologies et santé 96.14149
## 10 Gestion 98.06117
## 11 Histoire-géographie 86.87342
## 12 Information communication 89.45205
## 13 Informatique 99.36641
## 14 Lettres, langues, arts 83.45701
## 15 Masters enseignement 90.80861
## 16 Masters enseignement : premier degré 86.41935
## 17 Masters enseignement : second degré, CPE... 94.31250
## 18 Psychologie 61.84211
## 19 Sciences de l'ingénieur 98.60526
## 20 Sciences de la vie et de la terre 94.74731
## 21 Sciences fondamentales 97.27132
# salaire moyen par discipline
salaire <- aggregate(data2$salaire, list(discipline=data2$discipline), mean)
salaire## discipline x
## 1 1817.671
## 2 Économie 1812.432
## 3 Autres formations juridiques, économiques et de gestion 1838.440
## 4 Autres sciences humaines et sociales 1840.424
## 5 Autres sciences, technologies et santé 1805.833
## 6 Droit 1829.821
## 7 Ensemble formations juridiques, économiques et de gestion 1816.659
## 8 Ensemble sciences humaines et sociales 1834.599
## 9 Ensemble sciences, technologies et santé 1815.252
## 10 Gestion 1818.165
## 11 Histoire-géographie 1825.949
## 12 Information communication 1850.205
## 13 Informatique 1817.710
## 14 Lettres, langues, arts 1839.819
## 15 Masters enseignement 1799.617
## 16 Masters enseignement : premier degré 1745.484
## 17 Masters enseignement : second degré, CPE... 1755.312
## 18 Psychologie 1821.228
## 19 Sciences de l'ingénieur 1812.500
## 20 Sciences de la vie et de la terre 1798.172
## 21 Sciences fondamentales 1810.930
# tableau avec 'data.frame'
tableau <- data.frame(taux_dinsertion, emplois_a_temps_plein$x, salaire$x)
tableau## discipline x
## 1 96.72603
## 2 Économie 88.29730
## 3 Autres formations juridiques, économiques et de gestion 88.25688
## 4 Autres sciences humaines et sociales 84.56970
## 5 Autres sciences, technologies et santé 91.02273
## 6 Droit 90.12108
## 7 Ensemble formations juridiques, économiques et de gestion 89.91921
## 8 Ensemble sciences humaines et sociales 85.58656
## 9 Ensemble sciences, technologies et santé 89.10791
## 10 Gestion 91.78989
## 11 Histoire-géographie 82.63291
## 12 Information communication 87.63699
## 13 Informatique 95.56489
## 14 Lettres, langues, arts 85.53846
## 15 Masters enseignement 97.21053
## 16 Masters enseignement : premier degré 96.19355
## 17 Masters enseignement : second degré, CPE... 97.68750
## 18 Psychologie 89.49123
## 19 Sciences de l'ingénieur 90.84868
## 20 Sciences de la vie et de la terre 83.59677
## 21 Sciences fondamentales 88.37984
## emplois_a_temps_plein.x salaire.x
## 1 91.13699 1817.671
## 2 96.07207 1812.432
## 3 95.20183 1838.440
## 4 89.04242 1840.424
## 5 92.40909 1805.833
## 6 95.00448 1829.821
## 7 96.50437 1816.659
## 8 81.97933 1834.599
## 9 96.14149 1815.252
## 10 98.06117 1818.165
## 11 86.87342 1825.949
## 12 89.45205 1850.205
## 13 99.36641 1817.710
## 14 83.45701 1839.819
## 15 90.80861 1799.617
## 16 86.41935 1745.484
## 17 94.31250 1755.312
## 18 61.84211 1821.228
## 19 98.60526 1812.500
## 20 94.74731 1798.172
## 21 97.27132 1810.930
names(tableau) <- c("discipline", "taux_dinsertion", "emplois_a_temps_plein", "salaire")
tableau## discipline taux_dinsertion
## 1 96.72603
## 2 Économie 88.29730
## 3 Autres formations juridiques, économiques et de gestion 88.25688
## 4 Autres sciences humaines et sociales 84.56970
## 5 Autres sciences, technologies et santé 91.02273
## 6 Droit 90.12108
## 7 Ensemble formations juridiques, économiques et de gestion 89.91921
## 8 Ensemble sciences humaines et sociales 85.58656
## 9 Ensemble sciences, technologies et santé 89.10791
## 10 Gestion 91.78989
## 11 Histoire-géographie 82.63291
## 12 Information communication 87.63699
## 13 Informatique 95.56489
## 14 Lettres, langues, arts 85.53846
## 15 Masters enseignement 97.21053
## 16 Masters enseignement : premier degré 96.19355
## 17 Masters enseignement : second degré, CPE... 97.68750
## 18 Psychologie 89.49123
## 19 Sciences de l'ingénieur 90.84868
## 20 Sciences de la vie et de la terre 83.59677
## 21 Sciences fondamentales 88.37984
## emplois_a_temps_plein salaire
## 1 91.13699 1817.671
## 2 96.07207 1812.432
## 3 95.20183 1838.440
## 4 89.04242 1840.424
## 5 92.40909 1805.833
## 6 95.00448 1829.821
## 7 96.50437 1816.659
## 8 81.97933 1834.599
## 9 96.14149 1815.252
## 10 98.06117 1818.165
## 11 86.87342 1825.949
## 12 89.45205 1850.205
## 13 99.36641 1817.710
## 14 83.45701 1839.819
## 15 90.80861 1799.617
## 16 86.41935 1745.484
## 17 94.31250 1755.312
## 18 61.84211 1821.228
## 19 98.60526 1812.500
## 20 94.74731 1798.172
## 21 97.27132 1810.930
library(knitr)
kable(tableau)| discipline | taux_dinsertion | emplois_a_temps_plein | salaire |
|---|---|---|---|
| 96.72603 | 91.13699 | 1817.671 | |
| Économie | 88.29730 | 96.07207 | 1812.432 |
| Autres formations juridiques, économiques et de gestion | 88.25688 | 95.20183 | 1838.440 |
| Autres sciences humaines et sociales | 84.56970 | 89.04242 | 1840.424 |
| Autres sciences, technologies et santé | 91.02273 | 92.40909 | 1805.833 |
| Droit | 90.12108 | 95.00448 | 1829.821 |
| Ensemble formations juridiques, économiques et de gestion | 89.91921 | 96.50437 | 1816.659 |
| Ensemble sciences humaines et sociales | 85.58656 | 81.97933 | 1834.599 |
| Ensemble sciences, technologies et santé | 89.10791 | 96.14149 | 1815.252 |
| Gestion | 91.78989 | 98.06117 | 1818.165 |
| Histoire-géographie | 82.63291 | 86.87342 | 1825.949 |
| Information communication | 87.63699 | 89.45205 | 1850.205 |
| Informatique | 95.56489 | 99.36641 | 1817.710 |
| Lettres, langues, arts | 85.53846 | 83.45701 | 1839.819 |
| Masters enseignement | 97.21053 | 90.80861 | 1799.617 |
| Masters enseignement : premier degré | 96.19355 | 86.41935 | 1745.484 |
| Masters enseignement : second degré, CPE… | 97.68750 | 94.31250 | 1755.312 |
| Psychologie | 89.49123 | 61.84211 | 1821.228 |
| Sciences de l’ingénieur | 90.84868 | 98.60526 | 1812.500 |
| Sciences de la vie et de la terre | 83.59677 | 94.74731 | 1798.172 |
| Sciences fondamentales | 88.37985 | 97.27132 | 1810.930 |
Question 2
# on sélectionne Psychologie
data3 <- data2[data2$discipline == "Psychologie",]
# on recalcule la moyenne des trois variables
taux_dinsertion_psycho <- aggregate(data3$taux_dinsertion, list(academie=data3$academie), mean)
emplois_a_temps_plein_psycho <- aggregate(data3$emplois_a_temps_plein , list(academie=data3$academie), mean)
salaire_psycho <- aggregate(data3$salaire, list(academie=data3$academie), mean)
# on construit le tableau
tableau_psycho <- data.frame(taux_dinsertion_psycho, emplois_a_temps_plein_psycho$x, salaire_psycho$x)
names(tableau_psycho) <- c("academie", "taux_dinsertion", "emplois_a_temps_plein", "salaire")
tableau_psycho## academie taux_dinsertion emplois_a_temps_plein salaire
## 1 89.12500 61.62500 1842.500
## 2 Aix-Marseille 81.25000 64.37500 1800.000
## 3 Amiens 95.50000 70.75000 1811.250
## 4 Bordeaux 89.28571 59.85714 1717.143
## 5 Caen 91.71429 68.71429 1747.143
## 6 Créteil 85.33333 59.83333 2034.167
## 7 Dijon 86.00000 72.66667 1763.333
## 8 Grenoble 92.30000 64.00000 1784.000
## 9 Lille 92.12500 72.12500 1796.250
## 10 Lyon 89.50000 52.75000 1795.000
## 11 Montpellier 89.75000 55.75000 1711.250
## 12 Nancy-Metz 90.50000 65.00000 1765.000
## 13 Nantes 93.90000 58.10000 1715.000
## 14 Nice 87.28571 54.57143 1794.286
## 15 Orléans-Tours 90.66667 60.00000 1786.667
## 16 Paris 89.86667 60.33333 2030.000
## 17 Poitiers 90.00000 60.16667 1706.667
## 18 Rennes 87.87500 57.62500 1710.000
## 19 Strasbourg 89.50000 57.37500 1780.000
## 20 Toulouse 86.75000 53.12500 1771.250
## 21 Versailles 89.25000 78.25000 2032.500
kable(tableau_psycho)| academie | taux_dinsertion | emplois_a_temps_plein | salaire |
|---|---|---|---|
| 89.12500 | 61.62500 | 1842.500 | |
| Aix-Marseille | 81.25000 | 64.37500 | 1800.000 |
| Amiens | 95.50000 | 70.75000 | 1811.250 |
| Bordeaux | 89.28571 | 59.85714 | 1717.143 |
| Caen | 91.71429 | 68.71429 | 1747.143 |
| Créteil | 85.33333 | 59.83333 | 2034.167 |
| Dijon | 86.00000 | 72.66667 | 1763.333 |
| Grenoble | 92.30000 | 64.00000 | 1784.000 |
| Lille | 92.12500 | 72.12500 | 1796.250 |
| Lyon | 89.50000 | 52.75000 | 1795.000 |
| Montpellier | 89.75000 | 55.75000 | 1711.250 |
| Nancy-Metz | 90.50000 | 65.00000 | 1765.000 |
| Nantes | 93.90000 | 58.10000 | 1715.000 |
| Nice | 87.28571 | 54.57143 | 1794.286 |
| Orléans-Tours | 90.66667 | 60.00000 | 1786.667 |
| Paris | 89.86667 | 60.33333 | 2030.000 |
| Poitiers | 90.00000 | 60.16667 | 1706.667 |
| Rennes | 87.87500 | 57.62500 | 1710.000 |
| Strasbourg | 89.50000 | 57.37500 | 1780.000 |
| Toulouse | 86.75000 | 53.12500 | 1771.250 |
| Versailles | 89.25000 | 78.25000 | 2032.500 |