Analyse Exploratoire — World Bank ID4D

Identité Numérique & Inclusion dans le Monde — EDA Complète

Équipe Data Science: KENKOU Marê DAVE Christian, SAMA FARIDA, ATTOH-AHOIN Victor, BANSAH Chekinah, AKOUNDA Abner

22 juin 2026

Introduction

Contexte & Enjeux

Pourquoi l’identité légale est-elle cruciale ?

L’identité légale est le socle de l’accès aux droits fondamentaux : sans elle, un individu n’existe pas aux yeux de l’État.

Elle conditionne l’accès à :

  • La santé — soins, vaccinations, sécurité sociale
  • L’éducation — inscription scolaire, diplômes
  • La citoyenneté — vote, participation civique
  • L’économie — ouverture de compte, crédit, emploi formel
  • Le numérique — services en ligne, identité digitale

« Ne pas avoir d’identité, c’est être invisible pour son propre pays. »

L’ampleur du problème

Personnes sans ID légale ~850 millions
Enfants non enregistrés / an ~166 millions
Pays couverts par ID4D 148 pays
ODD cible directe ODD 16.9

L’ODD 16.9 engage les États à fournir une identité légale à tous d’ici 2030 — nous sommes encore loin du compte.

Objectifs de l’Analyse

Questions de recherche

Cette EDA cherche à répondre à 5 questions centrales :

① Quelle est la couverture mondiale ? Cartographier les taux d’ID et identifier les pays les plus exclus.

② Quelles fractures structurelles existent ? Analyser les inégalités de genre, de lieu de résidence et de revenus.

③ Comment évolue la situation ? Mesurer la progression (ou régression) sur la période disponible.

④ Où en est l’identité numérique ? Évaluer le fossé entre ID classique et identité numérique.

⑤ Peut-on regrouper les pays en profils ? Clustering K-means pour identifier des typologies d’exclusion.

Périmètre de l’analyse

Table 1
Source des données World Bank ID4D Survey
Période couverte 2006 – 2024
Pays analysés 148 pays / territoires
Indicateurs 11 indicateurs clés
Unité d'analyse Pays (moyennes agrégées)
Méthodes utilisées EDA + Tests Spearman + K-means

Les analyses portent sur les données agrégées par pays. L’unité est le pourcentage de population, non les individus.

️ Sommaire

Partie 1 — Les Données

  • Présentation du dataset
  • Nettoyage & préparation
  • KPIs globaux

Partie 2 — Possession d’Identité

  • Vue globale (distribution mondiale)
  • Pays les plus avancés / les plus exclus

Partie 3 — Fractures d’Accès

  • Écart de genre
  • Fracture urbain–rural
  • Fracture par revenus
  • Raisons de l’absence d’ID

Partie 4 — Numérique & Évolution

  • Identité numérique dans le monde
  • Enregistrement des naissances
  • Évolution temporelle · Synthèse

Partie 5 — Analyses Avancées (nouveau)

  • Qualité des données & valeurs manquantes
  • Progression temporelle par pays (Δ)
  • Indicateurs peu exploités
  • Corrélation & clustering K-means

Partie 1 — Le Dataset

Présentation du Dataset

Colonne Type Description
REF_AREA_LABEL Texte Pays observé (199 pays)
INDICATOR_LABEL Texte Indicateur mesuré (11 indicateurs)
SEX_LABEL Catégorie Sexe : Total / Male / Female
AGE_LABEL Catégorie Tranche d'âge concernée
URBANISATION_LABEL Catégorie Zone : Total / Urban area / Rural area
TIME_PERIOD Entier Année d'observation (2006–2024)
OBS_VALUE Décimal Valeur de l'indicateur (%)
COMP_BREAKDOWN_1_LABEL Catégorie Sous-groupe : revenu, raison, etc.


148 Pays couverts

254 322 Observations brutes

7 403 Observations valides

2006 → 2024 Période couverte

Nettoyage des Données

Problèmes détectés

246 919 lignes supprimées (OBS_VALUE manquant)

TIME_PERIOD stocké comme texte au lieu d’entier

Multiples niveaux de désagrégation (sexe, zone, revenu) mélangés dans les mêmes lignes

Risque de double comptage si on ne filtre pas sur la ligne “Total” de référence

11 indicateurs différents empilés dans un seul fichier long

Solutions appliquées

filter(!is.na(OBS_VALUE)) → suppression des lignes sans mesure

as.integer(TIME_PERIOD) → conversion en année numérique

Filtre baseline : SEX="Total", URBAN="Total", BREAKDOWN="Total" pour les vues globales

Sous-datasets dédiés : id_own, dig_id, birth, no_id

Pivots dédiés pour calculer les écarts (genre, zone, revenu)

KPIs Globaux — Vue d’Ensemble

89% Possession d’ID — Moyenne Mondiale

148 Pays analysés

46.1% Identité numérique

91.6% Naissances enregistrées


1.7 pp Écart de Genre Moyen

1.6 pp Écart Urbain–Rural Moyen

Partie 2 — Possession d’Identité

Distribution Mondiale de la Possession d’ID

Figure 1

1 pays ont un taux de possession d’ID inférieur à 30%, contre 98 pays au-dessus de 90%.

Pays les Plus Exclus / les Plus Avancés

Figure 2

Écart maximal de 75.7 points entre South Sudan (24.1%) et Iceland (99.9%).

Partie 3 — Fractures d’Accès

Inégalité de Genre

Figure 3

L’écart de genre dépasse 20 points dans plusieurs pays, en particulier au Yémen, au Tchad et en Afghanistan.

Fracture Urbain–Rural

Figure 4

La fracture urbain-rural atteint son maximum dans des pays comme le Laos, le Mozambique et le Soudan du Sud.

Fracture par Niveau de Revenus

Figure 5

L’écart moyen mondial entre les 60% les plus riches et les 40% les plus pauvres est de 2.8 points de pourcentage.

Pourquoi les Gens N’ont-ils pas d’Identité ?

Figure 6

Le coût et le manque de documents requis sont, en moyenne mondiale, les premières barrières citées par les personnes sans identité.

Raisons par Pays — Top 10 les Plus Touchés

Figure 7

Partie 4 — Numérique & Évolution

Identité Numérique dans le Monde

Figure 8

Moyenne mondiale de 46.1% pour l’identité numérique, avec 15 pays en dessous de 20%.

ID Classique vs ID Numérique

Figure 9

Enregistrement des Naissances

Figure 10

5 pays enregistrent moins de la moitié de leurs enfants à la naissance — premier acte d’identité d’un être humain.

Évolution Temporelle — Le Monde Progresse-t-il ?

Figure 11

Trajectoires Individuelles — Pays Sélectionnés

Figure 12

Partie 5 — Analyses Avancées

Qualité des Données — Valeurs Manquantes

Figure 13

97.1% des observations brutes sont manquantes. Ce biais de collecte est plus fort sur les indicateurs numériques que sur la possession d’ID.

Qui Progresse le Plus ? — Analyse du Δ Temporel

Figure 14

Malawi est le champion de la progression avec +73.1 points entre 2017 et 2024. Certains pays régressent toutefois, signe d’instabilité institutionnelle.

Indicateurs Peu Exploités — Usages & Risques

Figure 15

44.4% des pays disposent d’un système d’identité numérique en ligne · 77.5% ont un système de vérification numérique. L’absence d’ID bloque surtout l’accès aux élections et aux services financiers.

Corrélation — ID Classique & ID Numérique

Figure 16

La corrélation de Spearman est ρ = 0.242 (p = 0.07) — la relation est forte mais non linéaire : certains pays ont un taux d’ID classique élevé mais restent très en retard sur le numérique.

Clustering K-means — Profils de Pays

Figure 17

Clustering — Tableau des Profils

Table 2
Profil Pays ID classique (%) ID numérique (%) Naissances enr. (%) Écart genre (pp) Écart urbain-rural (pp)
Avancés, fracture numérique 1 96.3 16.0 85.1 -0.7 1.5
En développement, forte fracture 17 94.5 34.0 99.9 -0.3 0.1
Très avancés & inclusifs 11 97.5 86.9 99.9 -0.4 -0.3
Très exclus 1 57.7 42.2 100.0 9.6 -7.7

Le clustering révèle 4 profils distincts — des pays très avancés et inclusifs jusqu’aux pays très exclus où ID classique, numérique et enregistrement des naissances sont tous bas simultanément.

Synthèse & Recommandations

Tableau de Bord Final

Figure 18

Recommandations Politiques

Accès de base à l’identité

Programmes nationaux gratuits dans les pays à taux d’ID < 30% (Soudan du Sud, Malawi, Liberia)

Bureaux d’état civil mobiles en zone rurale (Laos, Mozambique, Soudan du Sud)

Genre

Enregistrement ciblé des femmes dans les pays à fort écart (Yémen, Tchad, Afghanistan)

Coût & démarches

Gratuité de l’obtention d’un ID (Guinée, Ghana, Mozambique)

Simplifier les prérequis documentaires, surtout en Afrique subsaharienne

Numérique & naissances

Enregistrement systématique à la maternité (Yémen, Mozambique, Nigéria)

Investir dans l’infrastructure numérique des pays en développement

Synthèse Finale

Dimension Insight clé
Taux mondial ID 89% en moyenne
Pays le + exclu South Sudan (24.1%)
Pays le + avancé Iceland (99.9%)
Écart de genre 1.7 points en moyenne
Écart urbain-rural 1.6 points en moyenne
Écart de revenus 2.8 points en moyenne
Identité numérique 46.1% en moyenne mondiale
Naissances enregistrées 91.6% en moyenne mondiale
Plus grande progression Malawi (+73.1 pp)
Corrélation ID/Numérique ρ = 0.242 (Spearman)
Pays avec ID numérique 44.4% des pays couverts


148 Pays analysés

7 403 Observations exploitées

14 axes d’analyse couverts

Merci !



Des questions ?