1 Présentation générale

Le logement constitue un enjeu économique et social majeur, au cœur des dynamiques territoriales et des conditions de vie des ménages. Dans ce contexte, l’identification des zones de tension du marché locatif où l’accès au logement devient difficile au regard des loyers, de l’offre disponible et du niveau de revenu représente un élément essentiel pour comprendre le fonctionnement des marchés locaux du logement.

Ce projet propose une analyse data-driven et reproductible des tensions du marché locatif en France à l’échelle communale, à partir de trois sources publiques complémentaires :

L’objectif est de transformer ces informations en indicateurs lisibles et comparables, afin de mettre en évidence les contrastes territoriaux et de proposer une lecture synthétique des situations locales du marché locatif.

La Problématique de notre étude est: Comment mesurer et cartographier les tensions du marché locatif à partir d’indicateurs simples, reproductibles et interprétables économiquement ?

1.1 Objectifs du projet

Le projet poursuit les objectifs suivants :

  1. Construire une base communale harmonisée à partir de données publiques (loyers, vacance, revenus).
  2. Produire des indicateurs descriptifs du marché locatif et de l’effort d’accès au logement.
  3. Élaborer un indice synthétique de tension locative permettant une comparaison entre territoires.
  4. Proposer une lecture territoriale à travers des visualisations et une cartographie.
  5. Mettre à disposition un outil d’exploration interactif (Shiny) permettant de filtrer, visualiser et “faire parler” les indicateurs, afin d’accélérer la production de notes, chiffrages et diagnostics.

2 Présentation de la base de données

L’analyse repose sur la construction d’une base de données communale issue de la fusion de trois sources publiques complémentaires, chacune apportant une dimension spécifique du marché locatif : niveau des loyers, disponibilité de l’offre et capacité financière des ménages.

1. Carte des loyers – DHUP

La première source mobilisée est la Carte des loyers, diffusée par la Direction de l’Habitat, de l’Urbanisme et des Paysages (DHUP). Cette base fournit des estimations du loyer d’annonce au mètre carré pour les logements locatifs privés.

L’étude retient les loyers des appartements de trois pièces, considérés comme représentatifs du marché locatif courant et permettant une comparaison homogène entre territoires. Ces loyers sont issus d’un modèle statistique reposant sur les observations disponibles et doivent être interprétés comme des ordres de grandeur du niveau local des loyers.

Les principales variables utilisées sont : - le code commune INSEE, utilisé pour la fusion des bases ; - le loyer d’annonce médian au m², indicateur central du niveau de tension locative ; - le nombre d’observations locales, permettant de filtrer les estimations les moins robustes.

2. Base LOVAC – Logements vacants

La deuxième source est la base LOVAC (Logements Vacants), produite à partir des données fiscales et administratives. Elle permet d’évaluer le niveau de vacance du parc privé, indicateur essentiel du fonctionnement du marché du logement.

La vacance reflète en effet le degré de mobilisation de l’offre : une vacance faible peut traduire un marché sous tension, tandis qu’une vacance élevée peut signaler un déséquilibre local ou une vacance structurelle.

Les variables principales mobilisées sont : - le nombre de logements vacants du parc privé ; - le nombre total de logements du parc privé ; - le nombre de logements vacants depuis plus de deux ans, indicateur de vacance structurelle.

Le taux de vacance est calculé comme le rapport entre logements vacants et parc total.

3. Revenu médian – INSEE Filosofi

La troisième source est issue du fichier Filosofi (Fichier Localisé Social et Fiscal) de l’INSEE, qui fournit des indicateurs de niveau de vie à l’échelle communale.

Le projet mobilise le revenu disponible médian par unité de consommation, utilisé comme proxy de la capacité financière des ménages. Cet indicateur permet d’interpréter le niveau des loyers au regard des conditions économiques locales et d’évaluer l’effort d’accès au logement.

2.1 Construction de la base analytique

Les trois sources sont harmonisées à l’aide du code commune INSEE, puis fusionnées afin d’obtenir une base communale unique. Les observations présentant des valeurs manquantes ou incohérentes sont exclues afin de garantir la qualité statistique de l’analyse.

La base finale contient, pour chaque commune : - le niveau de loyer au m² ; - le taux de vacance du parc privé ; - le revenu médian ; - ainsi que des indicateurs dérivés construits pour l’analyse, notamment le ratio loyer/revenu et un indice synthétique de tension locative.

Cette base constitue le socle analytique de l’ensemble du projet.

Après fusion, la base analytique finale comprend 3171 communes. Elle constitue le socle de l’analyse des tensions du marché locatif en combinant trois dimensions fondamentales :

  • Le niveau des loyers (pression sur les prix) ;

  • La vacance (disponibilité de l’offre) ;

  • Le revenu médian (capacité financière des ménages).

3 Statistiques descriptives

Table 3.1: Table 3.2: Résumé statistique des variables – marché locatif
Loyer (€/m²) Taux de vacance Taux de vacance longue Revenu médian (€)
Min. : 5.49 Min. :0.01862 Min. :0.005039 Min. :13530
1st Qu.: 9.02 1st Qu.:0.04784 1st Qu.:0.022216 1st Qu.:20860
Median :10.85 Median :0.06466 Median :0.034828 Median :22670
Mean :11.66 Mean :0.07437 Mean :0.042229 Mean :23504
3rd Qu.:13.16 3rd Qu.:0.09329 3rd Qu.:0.054416 3rd Qu.:25250
Max. :37.61 Max. :0.25741 Max. :0.182188 Max. :54120

L’échantillon final comprend 3171 communes disposant simultanément d’une information sur les loyers, la vacance du parc privé et le niveau de revenu des ménages.

Les statistiques descriptives mettent en évidence une forte hétérogénéité territoriale du marché locatif en France. Les niveaux de loyers varient sensiblement selon les communes, reflétant l’opposition entre zones détendues et marchés fortement tendus, notamment dans les territoires les plus attractifs.

4 Correlation des variables

Table 4.1: Table 4.2: Corrélations entre loyers, vacance et revenu
loyer_m2 taux_vacance taux_vacance_longue revenu_median
loyer_m2 1.000 -0.465 -0.478 0.657
taux_vacance -0.465 1.000 0.974 -0.482
taux_vacance_longue -0.478 0.974 1.000 -0.455
revenu_median 0.657 -0.482 -0.455 1.000

4.0.1 Analyse des corrélations

Les corrélations mettent en évidence une structure économique cohérente du marché locatif. Le niveau des loyers est positivement lié au revenu médian, indiquant que les territoires plus favorisés présentent en moyenne des loyers plus élevés. À l’inverse, les loyers sont négativement corrélés au taux de vacance, ce qui reflète qu’un marché tendu s’accompagne généralement d’une vacance plus faible.

La vacance totale et la vacance de longue durée présentent une corrélation très forte (0,97), traduisant une information largement redondante. Afin d’éviter toute multicolinéarité et de conserver un indicateur lisible, seule la vacance totale est retenue pour la suite de l’analyse, car elle reflète plus directement la tension immédiate du marché locatif.

4.0.2 Distribution graphique des variables clées

Relation entre loyers et revenu médian

Figure 4.1: Relation entre loyers et revenu médian

La relation entre revenu médian et niveau des loyers met en évidence une corrélation positive nette. Les communes disposant d’un niveau de revenu plus élevé présentent en moyenne des loyers plus importants, traduisant l’ajustement du marché locatif à la capacité financière locale des ménages.

La dispersion observée autour de la tendance moyenne reflète néanmoins l’existence de spécificités territoriales, indiquant que le niveau de revenu n’explique pas à lui seul les différences de loyers entre communes. D’autres facteurs, notamment l’offre de logements et la tension locale du marché, contribuent également à la formation des niveaux de loyers.

Relation entre loyers et taux de vacance

Figure 4.2: Relation entre loyers et taux de vacance

Le graphique met en évidence une relation négative entre le taux de vacance et le niveau des loyers. Les communes caractérisées par une vacance plus faible présentent en moyenne des loyers plus élevés, traduisant un marché locatif plus tendu.

À l’inverse, une vacance plus importante est associée à des loyers plus faibles, ce qui reflète des marchés plus détendus où l’offre de logements est relativement abondante par rapport à la demande. Cette relation confirme le rôle central de la disponibilité de l’offre dans la formation des tensions locales du marché locatif.

Distribution des loyers par région

Figure 4.3: Distribution des loyers par région

Le boxplot met en évidence une hétérogénéité régionale marquée du niveau des loyers. Certaines régions présentent une distribution plus élevée et une dispersion plus importante, traduisant des marchés locatifs plus tendus et potentiellement plus dynamiques. À l’inverse, d’autres régions affichent des loyers plus faibles et une variabilité réduite, caractéristiques de marchés plus détendus.

La présence de valeurs extrêmes dans certaines régions suggère également l’existence de communes très tendues, souvent situées dans des zones à forte attractivité économique ou démographique.

5 Construction de l’indice de tension locative

L’objectif de cette étape est de construire un indicateur synthétique permettant de mesurer, de comparer et de cartographier le niveau de tension du marché locatif à l’échelle communale. L’indice vise à résumer en une seule mesure la pression exercée sur le marché du logement.

Logique économique

Un marché locatif est considéré comme tendu lorsque :

À l’inverse, un marché est dit détendu lorsque les loyers sont modérés et que la vacance est plus élevée, indiquant une offre relativement abondante.

Ainsi, l’indice de tension locative mesure directement la pression du marché à partir de deux dimensions fondamentales :

Principe de construction

Les deux variables étant exprimées dans des unités différentes, elles sont préalablement normalisées afin d’être rendues comparables. L’indice combine ensuite :

La formulation générale de l’indice est la suivante :

\[ \text{Indice de tension locative}_i = f(\text{Loyer}_i,\,-\text{Vacance}_i) \] Formule opérationnelle

\[ ITL_i = \alpha \cdot \text{Loyer}_{i}^{norm} + \beta \cdot \left(1 - \text{Vacance}_{i}^{norm}\right) \] avec:

Mise à échelle \[ ITL_{i}^{(100)} = 100 \times ITL_i \]

5.1 Distribution de l’indice

Distribution de l'indice de tension locative

Figure 5.1: Distribution de l’indice de tension locative

La distribution de l’indice de tension locative montre que la majorité des communes se situent à des niveaux intermédiaires de tension, tandis que les situations extrêmes (marchés très tendus ou très détendus) sont plus rares. Cette forme est cohérente avec la construction de l’indice, qui agrège deux dimensions complémentaires (niveau des loyers et rareté de l’offre via la vacance). L’indice permet ainsi de situer chaque commune sur un continuum de tension, avant de construire une typologie plus lisible en classes.

5.2 Typologie : détendu / intermédiaire / tendu

Répartition des communes selon la typologie du marché locatif

Figure 5.2: Répartition des communes selon la typologie du marché locatif

La répartition des communes selon l’indice de tension locative met en évidence une structure relativement équilibrée du marché. Sur les 3171 communes étudiées, 1678 sont classées en marché détendu contre 1493 en marché tendu.

6 Carte ITL moyen par region

Indice moyen de tension locative par région

Figure 6.1: Indice moyen de tension locative par région

La combinaison de l’indice (loyers élevés et vacance faible) et de la typologie (tendu/détendu) permet de distinguer clairement des profils territoriaux. Les régions avec un ITL moyen élevé concentrent davantage de communes classées « tendues », ce qui traduit une pression locative plus forte et une disponibilité plus limitée de l’offre. À l’inverse, les régions à ITL moyen plus faible correspondent à des marchés plus équilibrés, où la vacance joue davantage un rôle d’amortisseur. Cette lecture synthétique facilite l’identification des zones où les tensions locatives sont les plus susceptibles de poser des enjeux d’accès au logement.

7 Classement des départements selon l’indice moyen de tension locative

Table 7.1: Table 7.2: Classement des départements selon l’indice moyen de tension locative
Rang Département Nb communes ITL moyen % communes tendues
1 75 20 80.17 100.0
2 92 34 71.30 100.0
3 94 40 64.87 100.0
4 06 30 62.07 93.3
5 78 78 61.77 96.2
6 95 47 61.17 97.9
7 74 71 60.10 94.4
8 93 27 60.02 100.0
9 91 69 59.74 97.1
10 77 69 56.39 78.3
11 13 79 54.43 81.0
12 44 47 54.43 87.2
13 69 98 54.39 82.7
14 35 54 53.12 75.9
15 83 60 52.44 61.7
16 85 14 52.12 71.4
17 974 11 51.66 72.7
18 67 91 51.52 63.7
19 33 57 51.49 75.4
20 01 60 51.17 50.0

8 Modélisation économetrique

8.1 Modèle 1: ITL expliqué par revenu et vacance

Afin d’approfondir l’analyse économique de la tension locative, une modélisation simple est mise en œuvre. L’objectif n’est pas de prédire l’indice, mais de vérifier empiriquement la cohérence économique des relations observées entre la tension du marché, le niveau de revenu et la disponibilité de l’offre locative.

\[ ITL_i = \alpha + \beta_1 \,\text{Revenu}_{i} + \beta_2 \,\text{Vacance}_{i} + \varepsilon_i \]

Modélisation simple de l’indice de tension locative
Dependent variable:
ITL (0-100)
Revenu médian (€) 0.001***
(0.00002)
Taux de vacance -241.764***
(2.504)
Constant 46.726***
(0.623)
Observations 3,171
R2 0.854
Adjusted R2 0.854
Residual Std. Error 4.492 (df = 3168)
F Statistic 9,301.706*** (df = 2; 3168)
Note: p<0.1; p<0.05; p<0.01

Le coefficient associé au revenu médian est positif et statistiquement significatif. Cela indique que, toutes choses égales par ailleurs, les communes où le niveau de vie est plus élevé présentent un niveau de tension locative plus important. Ce résultat reflète un mécanisme classique du marché du logement : une capacité financière plus élevée soutient la demande et exerce une pression à la hausse sur les loyers.

À l’inverse, le coefficient du taux de vacance est fortement négatif et significatif. Une augmentation de la vacance est associée à une diminution marquée de la tension locative, traduisant le rôle central de la disponibilité de l’offre dans l’équilibre du marché. Une vacance faible correspond à une rareté de l’offre et donc à un marché plus tendu.

9 Application intéractive (Shiny)

L’application Shiny prolonge l’analyse en proposant un outil interactif d’exploration territoriale des tensions locatives. L’objectif est de passer d’un diagnostic statistique à une lecture opérationnelle, en permettant à l’utilisateur de naviguer entre différents niveaux géographiques (région, département, commune) et de visualiser instantanément les liens entre tension, vacance et revenu.

L’application est structurée en trois onglets :

L’application interactive (carte + sélection d’indicateurs) est disponible ici :

https://alphonsekolie.shinyapps.io/TTL-dashboard-v2/

La cartographie régionale et le classement départemental permettent d’identifier rapidement les zones les plus exposées, tandis que l’exploration communale rend l’analyse actionnable à un niveau fin.

10 Limites

Plusieurs limites doivent être soulignées.

Premièrement, les loyers issus de la Carte des loyers correspondent à des loyers d’annonce (charges comprises, non meublé) et non aux loyers effectivement signés ; ils restent néanmoins un proxy utile de la pression de marché.

Deuxièmement, la base LOVAC présente une rupture de série récente liée à l’évolution du dispositif de collecte (GMBI), et les données sont soumises au secret statistique (seuil de secrétisation), ce qui peut réduire la couverture dans certains territoires.

Troisièmement, l’indice ITL est un indicateur synthétique volontairement simple : il est interprétable économiquement, mais ne capture pas toutes les dimensions du marché (mobilité résidentielle, parc social, construction neuve, attractivité, contraintes d’urbanisme, etc.).

Enfin, l’analyse est conduite sur les communes communes aux trois sources, ce qui peut induire une légère sélection de l’échantillon.

11 Perspectives

Le projet peut être prolongé de plusieurs manières :

12 Reproductibilité

Le projet a été conçu pour être reproductible : les trois bases sont importées, nettoyées et fusionnées de manière systématique, et l’ensemble des visualisations ainsi que l’indice ITL sont générés automatiquement à partir des données.

Les principaux choix méthodologiques (seuils de qualité statistique sur la carte des loyers, traitement des valeurs manquantes LOVAC, normalisation et formule de l’indice) sont documentés afin de garantir la transparence et la réutilisabilité du travail.

13 Conclusion

Ce projet propose une lecture claire, territorialisée et économiquement interprétable des tensions du marché locatif à partir de trois sources publiques complémentaires.
L’indice ITL fournit une synthèse opérationnelle de la pression locative, tandis que la cartographie, le classement départemental et l’application Shiny facilitent l’exploration des résultats et leur appropriation.