La datavisualisation au CEREQ

Le CEREQ : Qui sommes-nous ?

🏛️ Le CEREQ en bref

  • Créé en 1971
  • Établissement public sous tutelle du Ministère de l’Éducation nationale et du Ministère du Travail
  • Basé à Marseille, ~100 agents

🎯 Notre mission

Mieux connaître et comprendre les liens entre formation, travail et emploi

  • Construire des enquêtes statistiques originales
  • Conduire études, recherches et évaluations
  • Diffuser les connaissances auprès d’un large public

👥 Au service de…

  • Professionnels
  • Décideurs
  • Partenaires sociaux
  • Acteurs de la formation et du travail

Les deux départements

🗂️ DFC — Département Formation et Certification

  • Analyse des dispositifs de formation tout au long de la vie
  • Production de données statistiques (France & Europe)
  • Étude de l’offre de formation et de certification
  • Enquêtes auprès des entreprises :
    • EFE (Enquête Formation Employeur)
    • CVTS (Enquête européenne sur la formation en entreprise)

📊 DEEVA — Département Entrées et Évolutions dans la Vie Active

  • Expertise sur la transition école → emploi
  • Analyse des parcours d’insertion des jeunes
  • Évaluation des politiques publiques
  • Enquête phare : Génération
    • Lancée à la fin des années 90
    • Tous les 4 ans, une nouvelle cohorte
    • Tous niveaux et domaines de formation
    • Suivi des trajectoires d’insertion

Pourquoi R Shiny ?

🔓 Un logiciel libre

  • Open source, gratuit et accessible
  • Transparence et indépendance vis-à-vis des outils propriétaires

🔄 Une transition stratégique

  • Objectif d’abandonner SAS au profit de R
  • Shiny comme premier projet concret pour accompagner cette migration
  • Montée en compétences progressive

👥 Une communauté active

  • Large communauté mondiale
  • Nombreux packages et ressources
  • Communauté francophone dynamique (R users, Rzine…)
  • Facilite la résolution de problèmes

Deux approches de développement

🤝 DEEVA — Prestataire ARDATA

  • Cabinet reconnu dans la communauté R
  • Créateur du package {ggiraph}
  • Le Céreq en position de maître d’ouvrage
  • Expertise technique de haut niveau

🛠️ DFC — Développement en interne

  • Basé sur le code DEEVA comme point de départ
  • CSS commun pour une identité visuelle cohérente
  • Montée en compétences pour assurer la maintenance autonome

🔗 Une cohérence entre les deux départements

Mutualisation du CSS · Réutilisation du code · Versionnage via Git

Organisation interne

🏛️ Un copil dédié

Réunions régulières associant :

  • La direction scientifique
  • La communication
  • Un représentant DFC
  • Un représentant DEEVA

📐 Conception en amont

  • Maquettage avant développement
  • Échanges avec ARDATA
  • Travail sur les champs, définitions et précision statistique

✏️ Éditorialisation

  • Jusqu’où guider l’utilisateur ?
  • Niveau minimal mais nécessaire
  • Éviter les surinterprétations
  • Préserver la neutralité de l’établissement

Un équilibre entre accessibilité et rigueur statistique

Quel public visé ?

Public Attentes
🔬 Chercheurs Rigueur, détails méthodologiques
📰 Journalistes Lisibilité, données extractibles
🏛️ Décideurs Synthèse, messages clairs
👨‍👩‍👧 Parents d’élèves Accessibilité, vulgarisation
👥 Grand public Simplicité, pertinence

⚠️ Un arbitrage structurant

Le choix du public conditionne :

  • Le niveau d’éditorialisation
  • Le degré de contextualisation
  • Les choix d’interface et de design

💡 Enseignement

Définir le public cible en amont est un prérequis à toute décision de conception

Hébergement sur shinyapps.io

☁️ Le choix initial

  • Hébergement cloud managé par Posit
  • Mise en ligne rapide
  • Sans infrastructure serveur dédiée
  • Choix pragmatique pour démarrer

💰 Un coût qui a pesé

  • Passage nécessaire à la formule premium
  • Coût : 4 600 $/an
  • Abonnement abandonné
  • Retour à la version gratuite

🏠 Internalisation envisagée

  • Héberger sur les serveurs du Céreq
  • Freiné par :
    • Un service informatique de petite taille
    • Un manque de moyens

Limites de Shiny et passage à Quarto

⚠️ Les défauts de Shiny

  • Nécessite un serveur actif en permanence
  • Lenteur de chargement des applications
  • Dépendance à l’hébergement (shinyapps.io)

✅ Les avantages de Quarto

  • Fichiers statiques → plus besoin de serveur
  • Chargement beaucoup plus rapide
  • Hébergement simplifié et gratuit (GitHub Pages…)
  • Meilleure pérennité des documents
  • Facilite le partage et la diffusion
  • Document reproductible

Exemples d’applications développées

📊 DFC — Formation continue

🔗 La formation continue en Europe

🔗 Les chiffres clés par secteur en France

Données issues de l’enquête EFE — efforts de formation par secteur d’activité

📊 DEEVA — Insertion professionnelle

🔗 Les chiffres clés par diplôme

Enquête Génération 2017 — suivi à 3 et 6 ans

🔗 Les disparités régionales

⚠️ Choix éditorial fort : textes d’accompagnement pour guider la lecture et éviter les surinterprétations