Le logement constitue un enjeu économique et social majeur, au cœur des dynamiques territoriales et des conditions de vie des ménages. Dans ce contexte, l’identification des zones de tension du marché locatif où l’accès au logement devient difficile au regard des loyers, de l’offre disponible et du niveau de revenu représente un élément essentiel pour comprendre le fonctionnement des marchés locaux du logement.
Ce projet propose une analyse data-driven et reproductible des tensions du marché locatif en France à l’échelle communale, à partir de trois sources publiques complémentaires :
L’objectif est de transformer ces informations en indicateurs lisibles et comparables, afin de mettre en évidence les contrastes territoriaux et de proposer une lecture synthétique des situations locales du marché locatif.
La Problématique de notre étude est: Comment mesurer et cartographier les tensions du marché locatif à partir d’indicateurs simples, reproductibles et interprétables économiquement ?
Le projet poursuit les objectifs suivants :
L’analyse repose sur la construction d’une base de données communale issue de la fusion de trois sources publiques complémentaires, chacune apportant une dimension spécifique du marché locatif : niveau des loyers, disponibilité de l’offre et capacité financière des ménages.
1. Carte des loyers – DHUP
La première source mobilisée est la Carte des loyers, diffusée par la Direction de l’Habitat, de l’Urbanisme et des Paysages (DHUP). Cette base fournit des estimations du loyer d’annonce au mètre carré pour les logements locatifs privés.
L’étude retient les loyers des appartements de trois pièces, considérés comme représentatifs du marché locatif courant et permettant une comparaison homogène entre territoires. Ces loyers sont issus d’un modèle statistique reposant sur les observations disponibles et doivent être interprétés comme des ordres de grandeur du niveau local des loyers.
Les principales variables utilisées sont : - le code commune INSEE, utilisé pour la fusion des bases ; - le loyer d’annonce médian au m², indicateur central du niveau de tension locative ; - le nombre d’observations locales, permettant de filtrer les estimations les moins robustes.
2. Base LOVAC – Logements vacants
La deuxième source est la base LOVAC (Logements Vacants), produite à partir des données fiscales et administratives. Elle permet d’évaluer le niveau de vacance du parc privé, indicateur essentiel du fonctionnement du marché du logement.
La vacance reflète en effet le degré de mobilisation de l’offre : une vacance faible peut traduire un marché sous tension, tandis qu’une vacance élevée peut signaler un déséquilibre local ou une vacance structurelle.
Les variables principales mobilisées sont : - le nombre de logements vacants du parc privé ; - le nombre total de logements du parc privé ; - le nombre de logements vacants depuis plus de deux ans, indicateur de vacance structurelle.
Le taux de vacance est calculé comme le rapport entre logements vacants et parc total.
3. Revenu médian – INSEE Filosofi
La troisième source est issue du fichier Filosofi (Fichier Localisé Social et Fiscal) de l’INSEE, qui fournit des indicateurs de niveau de vie à l’échelle communale.
Le projet mobilise le revenu disponible médian par unité de consommation, utilisé comme proxy de la capacité financière des ménages. Cet indicateur permet d’interpréter le niveau des loyers au regard des conditions économiques locales et d’évaluer l’effort d’accès au logement.
Les trois sources sont harmonisées à l’aide du code commune INSEE, puis fusionnées afin d’obtenir une base communale unique. Les observations présentant des valeurs manquantes ou incohérentes sont exclues afin de garantir la qualité statistique de l’analyse.
La base finale contient, pour chaque commune : - le niveau de loyer au m² ; - le taux de vacance du parc privé ; - le revenu médian ; - ainsi que des indicateurs dérivés construits pour l’analyse, notamment le ratio loyer/revenu et un indice synthétique de tension locative.
Cette base constitue le socle analytique de l’ensemble du projet.
Après fusion, la base analytique finale comprend 3171 communes. Elle constitue le socle de l’analyse des tensions du marché locatif en combinant trois dimensions fondamentales :
Le niveau des loyers (pression sur les prix) ;
La vacance (disponibilité de l’offre) ;
Le revenu médian (capacité financière des ménages).
| Loyer (€/m²) | Taux de vacance | Taux de vacance longue | Revenu médian (€) | |
|---|---|---|---|---|
| Min. : 5.49 | Min. :0.01862 | Min. :0.005039 | Min. :13530 | |
| 1st Qu.: 9.02 | 1st Qu.:0.04784 | 1st Qu.:0.022216 | 1st Qu.:20860 | |
| Median :10.85 | Median :0.06466 | Median :0.034828 | Median :22670 | |
| Mean :11.66 | Mean :0.07437 | Mean :0.042229 | Mean :23504 | |
| 3rd Qu.:13.16 | 3rd Qu.:0.09329 | 3rd Qu.:0.054416 | 3rd Qu.:25250 | |
| Max. :37.61 | Max. :0.25741 | Max. :0.182188 | Max. :54120 |
L’échantillon final comprend 3171 communes disposant simultanément d’une information sur les loyers, la vacance du parc privé et le niveau de revenu des ménages.
Les statistiques descriptives mettent en évidence une forte hétérogénéité territoriale du marché locatif en France. Les niveaux de loyers varient sensiblement selon les communes, reflétant l’opposition entre zones détendues et marchés fortement tendus, notamment dans les territoires les plus attractifs.
| loyer_m2 | taux_vacance | taux_vacance_longue | revenu_median | |
|---|---|---|---|---|
| loyer_m2 | 1.000 | -0.465 | -0.478 | 0.657 |
| taux_vacance | -0.465 | 1.000 | 0.974 | -0.482 |
| taux_vacance_longue | -0.478 | 0.974 | 1.000 | -0.455 |
| revenu_median | 0.657 | -0.482 | -0.455 | 1.000 |
Les corrélations mettent en évidence une structure économique cohérente du marché locatif. Le niveau des loyers est positivement lié au revenu médian, indiquant que les territoires plus favorisés présentent en moyenne des loyers plus élevés. À l’inverse, les loyers sont négativement corrélés au taux de vacance, ce qui reflète qu’un marché tendu s’accompagne généralement d’une vacance plus faible.
La vacance totale et la vacance de longue durée présentent une corrélation très forte (0,97), traduisant une information largement redondante. Afin d’éviter toute multicolinéarité et de conserver un indicateur lisible, seule la vacance totale est retenue pour la suite de l’analyse, car elle reflète plus directement la tension immédiate du marché locatif.
Figure 4.1: Relation entre loyers et revenu médian
La relation entre revenu médian et niveau des loyers met en évidence une corrélation positive nette. Les communes disposant d’un niveau de revenu plus élevé présentent en moyenne des loyers plus importants, traduisant l’ajustement du marché locatif à la capacité financière locale des ménages.
La dispersion observée autour de la tendance moyenne reflète néanmoins l’existence de spécificités territoriales, indiquant que le niveau de revenu n’explique pas à lui seul les différences de loyers entre communes. D’autres facteurs, notamment l’offre de logements et la tension locale du marché, contribuent également à la formation des niveaux de loyers.
Figure 4.2: Relation entre loyers et taux de vacance
Le graphique met en évidence une relation négative entre le taux de vacance et le niveau des loyers. Les communes caractérisées par une vacance plus faible présentent en moyenne des loyers plus élevés, traduisant un marché locatif plus tendu.
À l’inverse, une vacance plus importante est associée à des loyers plus faibles, ce qui reflète des marchés plus détendus où l’offre de logements est relativement abondante par rapport à la demande. Cette relation confirme le rôle central de la disponibilité de l’offre dans la formation des tensions locales du marché locatif.
Figure 4.3: Distribution des loyers par région
Le boxplot met en évidence une hétérogénéité régionale marquée du niveau des loyers. Certaines régions présentent une distribution plus élevée et une dispersion plus importante, traduisant des marchés locatifs plus tendus et potentiellement plus dynamiques. À l’inverse, d’autres régions affichent des loyers plus faibles et une variabilité réduite, caractéristiques de marchés plus détendus.
La présence de valeurs extrêmes dans certaines régions suggère également l’existence de communes très tendues, souvent situées dans des zones à forte attractivité économique ou démographique.
L’objectif de cette étape est de construire un indicateur synthétique permettant de mesurer, de comparer et de cartographier le niveau de tension du marché locatif à l’échelle communale. L’indice vise à résumer en une seule mesure la pression exercée sur le marché du logement.
Logique économique
Un marché locatif est considéré comme tendu lorsque :
Les loyers sont élevés, traduisant une forte pression sur les prix ;
La vacance est faible, reflétant une rareté de l’offre locative disponible.
À l’inverse, un marché est dit détendu lorsque les loyers sont modérés et que la vacance est plus élevée, indiquant une offre relativement abondante.
Ainsi, l’indice de tension locative mesure directement la pression du marché à partir de deux dimensions fondamentales :
Le niveau des loyers, indicateur de pression sur les prix ;
Le taux de vacance, indicateur de disponibilité de l’offre.
Principe de construction
Les deux variables étant exprimées dans des unités différentes, elles sont préalablement normalisées afin d’être rendues comparables. L’indice combine ensuite :
Positivement le niveau des loyers ;
Négativement le taux de vacance, car une vacance plus élevée correspond à une tension plus faible.
La formulation générale de l’indice est la suivante :
\[ \text{Indice de tension locative}_i = f(\text{Loyer}_i,\,-\text{Vacance}_i) \] Formule opérationnelle
\[ ITL_i = \alpha \cdot \text{Loyer}_{i}^{norm} + \beta \cdot \left(1 - \text{Vacance}_{i}^{norm}\right) \] avec:
Mise à échelle \[ ITL_{i}^{(100)} = 100 \times ITL_i \]
Figure 5.1: Distribution de l’indice de tension locative
La distribution de l’indice de tension locative montre que la majorité des communes se situent à des niveaux intermédiaires de tension, tandis que les situations extrêmes (marchés très tendus ou très détendus) sont plus rares. Cette forme est cohérente avec la construction de l’indice, qui agrège deux dimensions complémentaires (niveau des loyers et rareté de l’offre via la vacance). L’indice permet ainsi de situer chaque commune sur un continuum de tension, avant de construire une typologie plus lisible en classes.
Figure 5.2: Répartition des communes selon la typologie du marché locatif
La répartition des communes selon l’indice de tension locative met en évidence une structure relativement équilibrée du marché. Sur les 3171 communes étudiées, 1678 sont classées en marché détendu contre 1493 en marché tendu.
Figure 6.1: Indice moyen de tension locative par région
La combinaison de l’indice (loyers élevés et vacance faible) et de la typologie (tendu/détendu) permet de distinguer clairement des profils territoriaux. Les régions avec un ITL moyen élevé concentrent davantage de communes classées « tendues », ce qui traduit une pression locative plus forte et une disponibilité plus limitée de l’offre. À l’inverse, les régions à ITL moyen plus faible correspondent à des marchés plus équilibrés, où la vacance joue davantage un rôle d’amortisseur. Cette lecture synthétique facilite l’identification des zones où les tensions locatives sont les plus susceptibles de poser des enjeux d’accès au logement.
| Rang | Département | Nb communes | ITL moyen | % communes tendues |
|---|---|---|---|---|
| 1 | 75 | 20 | 80.17 | 100.0 |
| 2 | 92 | 34 | 71.30 | 100.0 |
| 3 | 94 | 40 | 64.87 | 100.0 |
| 4 | 06 | 30 | 62.07 | 93.3 |
| 5 | 78 | 78 | 61.77 | 96.2 |
| 6 | 95 | 47 | 61.17 | 97.9 |
| 7 | 74 | 71 | 60.10 | 94.4 |
| 8 | 93 | 27 | 60.02 | 100.0 |
| 9 | 91 | 69 | 59.74 | 97.1 |
| 10 | 77 | 69 | 56.39 | 78.3 |
| 11 | 13 | 79 | 54.43 | 81.0 |
| 12 | 44 | 47 | 54.43 | 87.2 |
| 13 | 69 | 98 | 54.39 | 82.7 |
| 14 | 35 | 54 | 53.12 | 75.9 |
| 15 | 83 | 60 | 52.44 | 61.7 |
| 16 | 85 | 14 | 52.12 | 71.4 |
| 17 | 974 | 11 | 51.66 | 72.7 |
| 18 | 67 | 91 | 51.52 | 63.7 |
| 19 | 33 | 57 | 51.49 | 75.4 |
| 20 | 01 | 60 | 51.17 | 50.0 |
Afin d’approfondir l’analyse économique de la tension locative, une modélisation simple est mise en œuvre. L’objectif n’est pas de prédire l’indice, mais de vérifier empiriquement la cohérence économique des relations observées entre la tension du marché, le niveau de revenu et la disponibilité de l’offre locative.
\[ ITL_i = \alpha + \beta_1 \,\text{Revenu}_{i} + \beta_2 \,\text{Vacance}_{i} + \varepsilon_i \]
| Dependent variable: | |
| ITL (0-100) | |
| Revenu médian (€) | 0.001*** |
| (0.00002) | |
| Taux de vacance | -241.764*** |
| (2.504) | |
| Constant | 46.726*** |
| (0.623) | |
| Observations | 3,171 |
| R2 | 0.854 |
| Adjusted R2 | 0.854 |
| Residual Std. Error | 4.492 (df = 3168) |
| F Statistic | 9,301.706*** (df = 2; 3168) |
| Note: | p<0.1; p<0.05; p<0.01 |
Le coefficient associé au revenu médian est positif et statistiquement significatif. Cela indique que, toutes choses égales par ailleurs, les communes où le niveau de vie est plus élevé présentent un niveau de tension locative plus important. Ce résultat reflète un mécanisme classique du marché du logement : une capacité financière plus élevée soutient la demande et exerce une pression à la hausse sur les loyers.
À l’inverse, le coefficient du taux de vacance est fortement négatif et significatif. Une augmentation de la vacance est associée à une diminution marquée de la tension locative, traduisant le rôle central de la disponibilité de l’offre dans l’équilibre du marché. Une vacance faible correspond à une rareté de l’offre et donc à un marché plus tendu.
L’application Shiny prolonge l’analyse en proposant un outil interactif d’exploration territoriale des tensions locatives. L’objectif est de passer d’un diagnostic statistique à une lecture opérationnelle, en permettant à l’utilisateur de naviguer entre différents niveaux géographiques (région, département, commune) et de visualiser instantanément les liens entre tension, vacance et revenu.
L’application est structurée en trois onglets :
Carte régionale : visualisation de l’indice moyen de tension locative par région, avec un indicateur complémentaire sur la part de communes classées « tendues ».
Tableau département : tableau interactif permettant de classer et comparer les départements selon l’ITL moyen, la part de communes tendues et le nombre de communes observées.
Exploreur commune : filtres région/département pour identifier les communes les plus tendues localement et analyser dynamiquement les relations entre indice, revenu et vacance.
L’application interactive (carte + sélection d’indicateurs) est disponible ici :
https://alphonsekolie.shinyapps.io/TTL-dashboard-v2/
La cartographie régionale et le classement départemental permettent d’identifier rapidement les zones les plus exposées, tandis que l’exploration communale rend l’analyse actionnable à un niveau fin.
Plusieurs limites doivent être soulignées.
Premièrement, les loyers issus de la Carte des loyers correspondent à des loyers d’annonce (charges comprises, non meublé) et non aux loyers effectivement signés ; ils restent néanmoins un proxy utile de la pression de marché.
Deuxièmement, la base LOVAC présente une rupture de série récente liée à l’évolution du dispositif de collecte (GMBI), et les données sont soumises au secret statistique (seuil de secrétisation), ce qui peut réduire la couverture dans certains territoires.
Troisièmement, l’indice ITL est un indicateur synthétique volontairement simple : il est interprétable économiquement, mais ne capture pas toutes les dimensions du marché (mobilité résidentielle, parc social, construction neuve, attractivité, contraintes d’urbanisme, etc.).
Enfin, l’analyse est conduite sur les communes communes aux trois sources, ce qui peut induire une légère sélection de l’échantillon.
Le projet peut être prolongé de plusieurs manières :
Le projet a été conçu pour être reproductible : les trois bases sont importées, nettoyées et fusionnées de manière systématique, et l’ensemble des visualisations ainsi que l’indice ITL sont générés automatiquement à partir des données.
Les principaux choix méthodologiques (seuils de qualité statistique sur la carte des loyers, traitement des valeurs manquantes LOVAC, normalisation et formule de l’indice) sont documentés afin de garantir la transparence et la réutilisabilité du travail.
Ce projet propose une lecture claire, territorialisée et économiquement interprétable des tensions du marché locatif à partir de trois sources publiques complémentaires.
L’indice ITL fournit une synthèse opérationnelle de la pression locative, tandis que la cartographie, le classement départemental et l’application Shiny facilitent l’exploration des résultats et leur appropriation.