Objectif : Connaître le taux d’abstention par aire géographique des bureaux de vote (BV) à Marseille.
Plan d’action :
Importer les données du taux d’abstention par BV (au second tour des élections municipales de 2020) issues de : https://www.data.gouv.fr/datasets/municipales-2020-resultats-2nd-tour/
Importer les données des aires géographiques par BV issues de : https://www.data.gouv.fr/datasets/proposition-de-contours-des-bureaux-de-vote/
Restreindre les données aux BV de Marseille
Joindre les données par un identifiant BV, en s’assurant qu’il est cohérent entre les deux bases.
En restreignant à Marseille, il y a 480 bureaux de vote uniques avec des résultats d’élection.
Concernant les bureaux de vote avec une aire géographique estimée, il y a 476 identifiants uniques, pour chacun des 3 formats d’identifiants fournis.
Pour joindre les données de contours et de résultats électoraux, il faut s’assurer qu’on utilise une clé qui identifie les mêmes BV dans chaque base de données. Les résultats électoraux sont fournis par le MIOM, sans explication sur l’identifiant BV. Les contours sont fournis par l’INSEE, sans explication sur LES identifiants BV. Par contre, l’INSEE fournit une table de correspondance entre différents identifiants BV, avec une documentation. https://www.data.gouv.fr/datasets/bureaux-de-vote-et-adresses-de-leurs-electeurs/
Cette documentation indique que la variable id_brut_miom est l’“identifiant unique dans le système d’information centralisant les résultats électoraux du ministère de l’Intérieur (SIE1) du bureau de vote associé à l’adresse” et est “Construit comme suit : code-commune-ref_code-miom-du-bv-dans-la-commune.” (appelons le le format MIOM). En utilisant cet identifiant comme clé, on peut donc déjà joindre avec confiance la table d’équivalence de l’INSEE avec la base des résultats électoraux du MIOM.
Ensuite, on se sert des équivalences pour ajouter les contours.
Grâce à la documentation de la table d’équivalence, on comprend que dans contours, il y a deux identifiants distincts:
codeBureauVote au format codeDepartementcodeCommune_numeroBureauVote (“format MIOM”)
id_bv qui concatenne un autre format de code département-commune et une version “nettoyée” du numéro de bureau de vote (“format REU / INSEE”).
Comme chacun de ces formats est présent dans table d’équivalence, on peut joindre une fois par chacun comme clé. Si on obtient le même résultat, on peut avoir confiance dans la jointure entre les résultats électoraux et contours.
Pour 474 BVs on a une correspondance fiable entre les données de résultats électoraux du MIOM et les contours de l’INSEE.
On a utilisé la “Table de correspondance expérimentale et ponctuelle des référentiels de bureaux de vote” proposée par l’Insee et l’Etalab et la documentation associée (dictionnaire-donnees-bv.pdf et methodology.pdf Annexe B. à ce lien : https://www.data.gouv.fr/datasets/bureaux-de-vote-et-adresses-de-leurs-electeurs/) afin vérifier la crédibilité de la correspondance entre les identifiants dans les deux bases à apairer.