Introduction
En France, la lutte contre la pauvreté est désormais un élément majeur des politiques sociales. Sous les effets du chômage, des changements familiaux et des migrations qui bouleversent les structures et les revenus des ménages, la pauvreté, oubliée durant les Trente Glorieuses, est redevenue une question centrale. La pauvreté a baissé dans les années 1970 et au début des années 1980, notamment du fait de l’amélioration de la situation des personnes âgées.
Le milieu des années 1990 et surtout le début des années 2000 a marqué un tournant, la pauvreté progresse sous l’effet de plusieurs facteurs, l’évolution repose en partie sur des phénomènes démographiques, la hausse du nombre de familles monoparentales aux faibles revenus, le facteur migratoire (moins que dans les années 1970, époque où le solde migratoire était beaucoup plus fort) et le chômage. Le taux de pauvreté a progressé de 12,7 % à 14,6 % de 2004 à 2019 (même taux que 1979). Il est donc nécessaire de mener une étude statistique afin de trouver des réponses ou solutions pour diminuer le taux de pauvreté en France qui par conséquent évolue d’année en année.Choix des données
Pour mener une étude statistique, il faut des données, j’ai donc du chercher des données pertinentes et en lien avec mon sujet avec une source fiable, je me suis donc redirigé vers l’INSEE qui est l’institut national de la statistique et des études économiques est chargé de la production, de l’analyse et de la publication des statistiques officielles en France. J’ai par la suite trouvé un jeu de données datant de 2016 avec les parts des revenues et le taux de pauvretés des ménages en France ce qui est parfaitement en lien avec mon sujet, il m’a fallu aussi trouver une table d’appartenance pour relier les codgeo.
Importation des données
Afin d’étudier mes données, j’ai dû les importer sur une base de données (phppgadmin) grâce a R studio et tout un processus pour de ne pas se tromper dans l’importation. Cela nous servira à pouvoir faire des commandes sql et éviter toute erreur entre les données. La totalité du code ainsi que le schéma relationnel qui a servi à l’importation des données sont disponibles en annexe.
Problématique
Il m’a donc fallut choisir une problématique pertinente et possible a traiter en lien avec mon sujet et mes données. J’ai vu que mes données comporté beaucoup de variables qui pouvaient affecter la pauvreté, je me suis donc mit au défi d’expliqué la pauvreté en France métropolitaine avec mes différentes variables (parts sur le revenus et taux de pauvreté).
Quels sont les facteurs qui ont un impact sur la pauvreté en France métropolitaine ?
Sélection d’une population
Dans un premier temps, il est nécessaire de comprendre ses données après plusieurs analyses, j’ai cherché un moyen de les grouper afin que cela soit plus pertinent,j’ai donc décidé de mener mon étude sur les départements et régions de France métropolitaine.
Analyses
Pour mener mon étude, j’ai décidé d’effectuer mon analyse en plusieurs parties avec chaque facteur qui pourrait expliquer la pauvreté en France.
Population
Grâce à une commande sql j’ai pu récupérer directement toutes mes données par département avec leurs régions ce qui nous permettra d’être plus éfficace et de mieux comprendre nos données.
SELECT DISTINCT r."codegeo" AS codereg, r."libgeo" AS nomreg, d."codegeo" AS codedep, d."libgeo" AS nomdep, d."nbmenfisc16", d."nbpersmenfisc16", d."med16", d."pimp16", d."tp6016", d."tp60age116", d."tp60age216", d."tp60age316", d."tp60age416", d."tp60age516", d."tp60age616", d."tp60tol116", d."tp60tol216", d."pact16", d."ptsa16", d."pcho16", d."pben16", d."ppen16", d."ppat16", d."ppsoc16", d."ppfam16", d."ppmini16", d."pplogt16", d."pimpot16", d."d116", d."d916", d."rd16"
FROM dep AS d, reg AS r, codegeo AS c
WHERE d."codegeo" = c."dep" AND c."reg" = r."codegeo"
;
depreg <- read_csv("depreg.csv")
depreg = depreg[depreg$nomreg!="La Réunion",]
depreg = depreg[depreg$nomreg!="Martinique",]
g=barplot(table(depreg$nomreg),horiz=T,col="orange",main = "Nombre de département par régions", col.main = "white",border=NA,axisnames =F, names.arg = table(depreg$nomreg), ylab="Régions", xlab="Nombre départements", xlim=c(0,13))
text(0,g,names(table(depreg$nomreg)),xpd=NA,pos=4,col="black",cex=0.8)
Nombre de département par régions
Ce graphique, représentant le nombre de départements par régions, nous apprend que les régions Auverge-Rhône-Alpes, Occitanie et Nouvelle-Aquitaine ont un effectif de départements supérieurs, on peut alors émettre comme hypothèses que ces régions ont des échantillons de meilleures qualités, car plus variés et que ces régions sont plus vastes donc peuplés.
Une hypothèse parait logique plus il y a de population plus le niveau de vie est mieux et son taux de pauvreté bas.
On se pose alors la question si le nombre de ménages fiscaux (foyers) a un lien avec la médiane du niveau de vie et le taux de pauvreté.library('classInt')
library('plotrix')
v= depreg$tp6016
v = ( v - min(v) ) / ( max(v) - min(v) )
valeur_min = 0
valeur_max = 10
v = valeur_min + (valeur_max - valeur_min) * v
w=rainbow(14, start = .9, end = .8)
leg =findColours(classIntervals(var = depreg$tp6016, n = 5, style="quantile"),
smoothColors("cyan",5,"purple"),
under="- de", over="+ de", between="-", cutlabels=F)
plot((depreg$nbmenfisc16/100),depreg$med16, pch=24, col.main = "white", xlab="Nombre de ménages fiscaux (x100)",ylab="Médiane du niveau de vie",main="Le nombre de ménage fiscaux en fonction de la mediane du niveau vie selon le taux de pauvreté", cex=v,col=w[unclass(depreg$tp6016)])
legend("bottomright",fill=attr(leg, "palette"),cex=0.75,
legend=names(attr(leg,"table")),
title = "Taux pauvreté en %")
Le nombre de ménage fiscaux en fonction de la mediane du niveau vie selon le taux de pauvreté
Sur ce graphique, on remarque deux points fondamentaux, les départements ayant un nombre de ménage fiscaux élevés ont tendance à avoir une médiane du niveau de vie plus élevé, les départements avec un nombre de ménages fiscaux bas ont tendance à avoir un taux de pauvreté élevé. On peut alors émettre comme hypothèse que le nombre de ménages fiscaux a un impact sur la pauvreté en France.
Âge
w=c("darkred","orange")
g=barplot(rbind(tapply(depreg$tp6016,depreg$nomreg,mean),tapply(depreg$tp60age116,depreg$nomreg,mean)),beside=T,horiz=T,col=w,main="Taux de pauvreté total et des - de 30 ans en France par régions",col.main="black", axisnames =F, border = NA,ylab="Régions",xlab="Taux de pauvreté en %")
text(0,g[2,],names(table(depreg$nomreg)),pos=4,cex=.7,xpd=NA,col="black")
legend("bottomright",c("% Taux de pauvreté des - de 30 ans ","% Taux de pauvreté total"),pch=15,
text.col=w,col=w, cex=0.5)
Sur ce graphique en barres montrant le taux de pauvreté des -30 ans comparés au taux total par régions, on remarque que les - de 30 ans sont toujours moins pauvres cela peut être expliqué par plusieurs choses, si les personnes vivent encore chez leurs parents donc moins de charges a payer, les aides de la France crous apl, enfants etc … On peut aussi voir que le Pays de la Loire est la région avec le taux de pauvreté le plus bas et les Hauts-de-France avec le plus élevé. Mais les personnes âgées ont plus d’expérience donc plus de revenus, on peut alors émettre comme hypothèse que les jeunes sont moins pauvres que les personnes plus âgées.
Chômage
library(ggplot2)
theme_set(theme_bw())
gg <- ggplot(depreg, aes(x=tp6016, y=pcho16)) +
geom_point(aes(col=nomreg, size=nbmenfisc16)) +
geom_smooth(method="loess", se=F) +
xlim(c(0, 30)) +
ylim(c(0, 5)) +
labs(y="Part indemnités de chômage (%)",
x="Taux pauvreté total (%)",
title="Taux pauvreté par rapport aux part d'indemnités de chômage et de la population par départements")
gg
Grâce à ce graphique, nous pouvons observer le lien entre la part du revenus indemnités chômage, le taux de pauvreté et le nombre de ménages fiscaux, j’ai effectués une courbe représentant la corrélation entre la part du chômage et le taux de pauvreté, on remarque que celle-ci est croissante, on peut donc admettre un lien entre ces deux facteurs, nous remarquons aussi que la population n’explique pas forcément la part du chômage. Il est donc nécessaire que la France mette en place des moyens afin que les habitants puissent trouver du travail surtout en Hauts-de-France.
Inégalités
Il m’a fallu récupérer les données nécessaires à l’étude des inégalités par régions grâce a cette commande sql.
SELECT DISTINCT r."codegeo" AS codereg, r."libgeo" AS nomreg, r."rd16"
FROM reg AS r
WHERE NOT r."libgeo"='La Réunion' AND NOT r."libgeo"='Martinique'
;
library(ggplot2)
theme_set(theme_bw())
regrd$rd16 = round(regrd$rd16,2)
ggplot(regrd, aes(x=`nomreg`, y=rd16, label=rd16)) +
geom_point(stat='identity', fill="black", size=6) +
geom_segment(aes(y = 2,
x = `nomreg`,
yend = rd16,
xend = `nomreg`),
color = "black") +
geom_text(color="white", size=2) +
labs(title="Rapport 1er décile 9 ème décile de vie par régions") +
ylim(2, 5) +
coord_flip()
ggplot
Ce graphique représente le rapport entre le 1er décile de vie et le 9ème décile de vie plus le rapport est élevés plus il y a d’inégalités entre les pauvres et les riches. On remarque que la Bretagne et le Pays de la Loire ont les rapports les plus faibles (2,86 et 2,81) donc moins d’inégalités, le Pays de la Loire étant la régions avec le taux de pauvretés le plus bas il est possible que le taux de pauvretés a un impact sur les inégalités cependant les Hauts-de-France ayant le taux de pauvreté le plus élevé n’a pas le plus gros rapport c’est l’Île-de-France avec 4,45 cela peut s’expliquer par le fait que la capital Paris s’y trouve, beaucoup de riches entreprises et entrepreneurs y sont installés ainsi que de nombreuses banlieue avec un taux de pauvretés très élevés cela peut expliquer la forte inégalité en Île-de-France.
Parts des revenus
J’ai sélectionné les parts des pensions / retraites, prestations sociales et autres afin des les étudier.
SELECT DISTINCT r."codegeo" AS codereg, r."libgeo" AS nomreg, r."ppen16" AS pensionretraite, r."ppat16" AS autre, r."ppsoc16" AS sociaux
FROM reg AS r
WHERE NOT r."libgeo"='La Réunion' AND NOT r."libgeo"='Martinique'
;
colo=c("darkred","orange","red")
rbind(regact$activite,regact$pensionretraite,regact$autre,regact$sociaux,regact$impot)
graph=barplot(rbind(regact$pensionretraite,regact$autre,regact$sociaux),beside=T,horiz=T,col=colo,main="Taux des parts selon leurs domaines par régions",col.main="black", axisnames =F, border =F ,ylab="Régions",xlab="Taux en %", xlim =c(0,50) )
text(0,graph[2,],regact$nomreg,pos=4,cex=.7,xpd=NA,col="black")
legend("topright",c("Part pensions et retraites","Part patrimoines et autres","Part prestation sociales"),pch=15,col=colo, cex=0.5)
Pour ce graphique, j’ai décidé de découper mon analyse en trois parties pour facilité la compréhension.
Part pensions et retraites: -L’île de France possède le moins de part pensions et retraites (22%) on peut alors émettre l’hypothèse que les personnes âgés préfèrent s’éloigner de la capital et s’installer dans des endroits plus de calme.
Part patrimoines et autres: -On remarque que certaines régions on un taux plus élevé comme le Grand Est (12%), l’île de France (11%) cela peut être expliqué par le fait que beaucoup d’entreprise sont installé donc beaucoup d’actionnaire et de retour sur investissement, et aussi par le prix du logement.
Part prestations sociales: -La région la plus pauvre Hauts-De-France a la part de prestations sociales la plus élevés (8%) ce qui montre que certains ménages ne peuvent pas vivre sans les aides.
J’ai ensuite pris les parts d’activités et d’impôts grâce à cette commande.SELECT DISTINCT r."libgeo" AS nomreg, r."tp6016" AS pauvrete, r."pact16" AS activite, r."pimpot16" AS impot, (r."pact16" + r."pimpot16") AS "activite-impot"
FROM reg AS r
WHERE NOT r."libgeo"='La Réunion' AND NOT r."libgeo"='Martinique'
;
attach(regkabble)
library(knitr)
library(kableExtra)
library(tidyverse)
regkabble |>
select(nomreg:`activite-impot`) |>
kable(booktabs = T) %>%
kable_styling() %>%
column_spec(2, color = spec_color(regkabble$pauvrete)) %>%
column_spec(3, color = spec_color(regkabble$activite)) %>%
column_spec(5, color = spec_color(regkabble$activite-impot)) %>%
row_spec(2, bold = T, background = "lightgray")
Taux de pauvreté, de revenus d’activités et d’impôts par régions
Sur ce tableau, on peut apercevoir le taux de pauvreté, le part des revenus d’activités, la part d’impôts et le résultat des revenus d’activités moins la part des impôts. On remarque que l’île de France a le taux de part des revenus d’activités la plus élevé 85,4% ce qui peut être expliqué par le nombre d’entreprises installé là-bas, on remarque aussi que le rapport activités impôts est le plus élevé pour l’Île-de-France 63,2% pourtant son taux de pauvreté n’est pas le plus bas. Il est aussi intéressant de comparer les Hauts-de-France avec le Pays de la Loire qui ont des part presque équivalente alors que leurs taux de pauvretés sont totalement opposés (18,3% contre 11%), on peut alors supposer que le taux de pauvreté n’a pas un lien avec la part des revenus d’activités et la part des impôts.
Type d’occupation logement
Afin d’utiliser toutes mes données, j’ai voulu étudier le taux de pauvretés des locataires et des propriétaires d’un logement en France, j’ai donc récupéré les données avec cette commande.
SELECT DISTINCT r."libgeo" AS nomreg, r."tp60tol116" AS proprietaires, r."tp60tol216" AS locataire
FROM reg AS r
WHERE NOT r."libgeo"='La Réunion' AND NOT r."libgeo"='Martinique'
;
library(ggpubr, lib.loc = "/usr/local/lib/R/site-library")
lp <- ggplot(reglogem, aes(nomreg, proprietaires)) + geom_bar(stat="identity", width = 0.5, fill="tomato2") +
labs(title="Taux de pauvretés propriétaires d'un logement par régions") +
theme(axis.text.x = element_text(angle=20, vjust=0.6)) + geom_hline(yintercept=mean(reglogem$proprietaires))
dp <- ggplot(reglogem, aes(nomreg, locataire)) + geom_bar(stat="identity", width = 0.5, fill="orange") +
labs(title="Taux de pauvretés locataires d'un logement par régions") +
theme(axis.text.x = element_text(angle=20, vjust=0.6)) +
geom_hline(yintercept=mean(reglogem$locataire))
ggarrange(lp,dp)
Ces deux graphiques, côte à côte, représentent le taux de pauvreté, locataires et propriétaires par régions, on remarque une grosse différence surtout au niveau de l’échelle pour les propriétaires le taux de pauvretés maximum est de 11% détenue par la Corse avec un taux en moyenne de 7% ce qui peut être expliqué par le fait d’investir dans un patrimoine immobilier ou le prix faible du m² tandis que pour les locataires, le taux de pauvretés le plus élevé est de 34,5% part les Hauts-de-France avec une moyenne de 27,8% ce qui est énorme comparé aux propriétaires, cela semble tout de même logique.
Localisation
Mon but étant d’analyser la répartition de la pauvreté en France, j’ai récupéré mes données par régions et par départements.
SELECT DISTINCT r."codegeo" AS codereg, r."libgeo" AS nomreg, r."tp6016"
FROM reg AS r
;
SELECT DISTINCT d."codegeo" AS codedep, d."libgeo" AS nomdep, d."tp6016"
FROM dep AS d
;
library(raster)
library(sf)
library('classInt')
library('plotrix')
FranceFormes <- getData(name="GADM", country="FRA", level=1)
regcarte <- read_csv("regcarte.csv")
regcarte=merge(x = FranceFormes,y = regcarte,by.x="NAME_1",by.y="nomreg", all.x=FALSE)
FranceFormes$NAME_1
col = findColours(
classIntervals(var = regcarte$tp6016, n =13 , style="quantile"),
smoothColors("orange",13,"darkred"))
leg =findColours(classIntervals(var = regcarte$tp6016, n = 5, style="quantile"),
smoothColors("orange",5,"darkred"),
under="- de", over="+ de", between="-", cutlabels=F)
par(mar=c(0,0,0,0))
plot(regcarte, main="Intensité du taux de pauvreté en France par régions")
plot(regcarte,col=col, border="white",lwd=.7, add=TRUE)
legend("bottomleft",fill=attr(leg, "palette"),cex=0.75,
legend=names(attr(leg,"table")),
title = "Taux de pauvreté en %")
Intensité du taux de pauvreté en France par régions
Sur cette cartographie, on va pouvoir étudier les facteurs géographiques qui affectent le taux de pauvreté en France, on remarque plusieurs choses d’une part, les Hauts-de-France étant l’une des régions avec un taux très élevé se situe au nord des côtes de la France proche de la manche et du royaume unis donc une forte migration surtout depuis le Brexit, on remarque aussi que le sud (Occitanie, Provence-Alpes-Côte d’Azur) est fortement touché par la pauvreté surtout au bord des côtes là ou aussi la migration est forte, la Corse elle est aussi très touchés cela s’explique surtout par la crise économique en 1990 l’économie se remet donc en place petit à petit. On peut aussi apercevoir que l’Auvergne-Rhône-Alpes est situé à côté de la Suisse ce qui peut explique leur taux de pauvreté bas.
library(raster)
library(sf)
library('classInt')
library('plotrix')
FranceFormes <- getData(name="GADM", country="FRA", level=2)
depcarte <- read_csv("depcarte.csv")
depcarte=merge(x = FranceFormes,y = depcarte,by.x="NAME_2",by.y="nomdep", all.x=FALSE)
col = findColours(
classIntervals(var = depcarte$tp6016, n =13 , style="quantile"),
smoothColors("orange",13,"darkred"))
leg =findColours(classIntervals(var = depcarte$tp6016, n = 5, style="quantile"),
smoothColors("orange",3,"darkred"),
under="- de", over="+ de", between="-", cutlabels=F)
par(mar=c(0,0,0,0))
plot(depcarte, main="Intensité du taux de pauvreté en France par départements")
plot(depcarte,col=col, border="white",lwd=.7, add=TRUE)
legend("bottomleft",fill=attr(leg, "palette"),cex=0.75,
legend=names(attr(leg,"table")),
title = "Taux de pauvreté en %")
Intensité du taux de pauvreté en France par départements
Il est nécessaire de refaire une cartographie, mais cette fois si par départements afin de voir plus en détails la répartition de la pauvreté en France, on remarque à nouveaux que les départements du nord et du sud sont touchés par la pauvreté, mais aussi le centre de la France ce que nous voyons pas forcément auparavant cela est peut-être dû a la diagonale du vide et le manque de développement.
Conclusion
Pour conclure grâce à cette étude statistique sur la pauvreté en France et plus particulièrement sur les facteurs ayant un impact sur la pauvreté en France, nous pouvons apporter plusieurs réponses et solutions possibles.
Nous avons vu que le chômage, les ménages fiscaux, la localisation, le statut d’occupation d’un logement et l’âge ont un impact plus ou moins fort sur le taux de pauvretés par divers moyens.
Pour baisser le taux de pauvreté en France, plusieurs solutions peuvent être appliquées comme une meilleure répartition des ménages fiscaux qui permettrait au chômage de baisser, la formation au monde professionnel pour les migrants afin qu’ils puissent trouver plus facilement du travail, venir en aide aux locataires les plus pauvres avec des aides financières et développé les endroits les plus démunis afin de réduire les inégalités.
Abstract
In France, the fight against poverty is now a major factor, in fact, poverty fell in the 1970s and early 1980s, mainly due to the improvement of the situation of the elderly. The mid-1990s and especially the early 2000s marked a turning point, with the poverty rate increasing from 12.7% to 14.6% from 2004 to 2019. Poverty is progressing under the influence of several factors so in this statistical study we will try to find answers and solutions to this problem.
Initially, I had to look for relevant data and in connection with my subject with a reliable source, so I redirected to the INSEE which is the national institute of statistics and economic studies is responsible for production, the analysis and publication of official statistics in France. I later found a data set from 2016 with income shares and the rate of household poverty in France which is perfectly related to my topic ‘income and poverty’. In order to study my data, I had to import them into a database here ‘phppgadmin’ to clean the data and be able to analyze them with the help of a computer process. I was then able to choose my problem ‘What are the factors that have an impact on poverty in metropolitan France?’.
To conduct my study, I decided to conduct my analysis in several parts with each factor available on my dataset that could explain poverty in France.
- Population
- Age
- Unemployment
- Inequalities
- Income shares
- Type of housing occupancy
- Localization
Thanks to several graphs and integration, I was able to conclude that unemployment, tax households, location, housing occupancy status and age have a more or less strong impact on the rate of poverty by various means.
Several solutions can be applied such as a better distribution of tax households, vocational training for migrants so that they can find work more easily, help the poorest tenants have and developed the poorest places in order to reduce inequalities.Annexes
Importation des données
Téléchargez tous les fichiers nécessaires au programme.IUT2202290
Schéma relationnel:
Création de la connexion a la base de données phppgadmin:
library(DBI)
connexion <- dbConnect(odbc::odbc(), .connection_string = "Driver={PostgreSQL Unicode};",timeout = 10)
Création des tables:
CREATE TABLE communes(
codegeo VARCHAR(6),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 INT,
tp6016 INT,
tp60age116 INT,
tp60age216 INT,
tp60age316 INT,
tp60age416 INT,
tp60age516 INT,
tp60age616 INT,
tp60tol116 INT,
tp60tol216 INT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE reg(
codegeo VARCHAR(3),
libgeo VARCHAR(50),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 FLOAT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE uu2010(
codegeo VARCHAR(5),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 FLOAT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE ze2010(
codegeo VARCHAR(4),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 FLOAT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE epci(
codegeo CHAR(9),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 FLOAT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE dep(
codegeo VARCHAR(3),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 FLOAT,
med16 FLOAT,
pimp16 FLOAT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE metro(
codegeo CHAR(1),
libgeo VARCHAR(255),
nbmenfisc16 INT,
nbpersmenfisc16 INT,
med16 FLOAT,
pimp16 INT,
tp6016 FLOAT,
tp60age116 FLOAT,
tp60age216 FLOAT,
tp60age316 FLOAT,
tp60age416 FLOAT,
tp60age516 FLOAT,
tp60age616 FLOAT,
tp60tol116 FLOAT,
tp60tol216 FLOAT,
pact16 FLOAT,
ptsa16 FLOAT,
pcho16 FLOAT,
pben16 FLOAT,
ppen16 FLOAT,
ppat16 FLOAT,
ppsoc16 FLOAT,
ppfam16 FLOAT,
ppmini16 FLOAT,
pplogt16 FLOAT,
pimpot16 FLOAT,
d116 FLOAT,
d916 FLOAT,
rd16 FLOAT
);
CREATE TABLE codegeo(
codegeo VARCHAR(5),
libgeo VARCHAR(255),
dep VARCHAR(3),
reg VARCHAR(3),
epci CHAR(9),
nature_epci CHAR(2),
arr VARCHAR(4),
cv VARCHAR(5),
ze2020 VARCHAR(4),
uu2020 VARCHAR(5),
tuu2017 VARCHAR(1),
tduu2017 CHAR(2),
aav2020 CHAR(3),
taav2017 CHAR(1),
tdaav2017 CHAR(2),
cateaav2020 CHAR(2),
bv2012 CHAR(5)
);
CREATE TABLE codegeoze(
ze2020 VARCHAR(4),
codegeo VARCHAR(5),
libgeo VARCHAR(255),
dep VARCHAR(3),
reg VARCHAR(3),
epci CHAR(9),
nature_epci CHAR(2),
arr VARCHAR(4),
cv VARCHAR(5),
uu2020 VARCHAR(5),
tuu2017 VARCHAR(1),
tduu2017 CHAR(2),
aav2020 CHAR(3),
taav2017 CHAR(1),
tdaav2017 CHAR(2),
cateaav2020 CHAR(2),
bv2012 CHAR(5)
);
CREATE TABLE codegeouu(
uu2020 VARCHAR(5),
codegeo VARCHAR(5),
libgeo VARCHAR(255),
dep VARCHAR(3),
reg VARCHAR(3),
epci CHAR(9),
nature_epci CHAR(2),
arr VARCHAR(4),
cv VARCHAR(5),
ze2020 VARCHAR(4),
tuu2017 VARCHAR(1),
tduu2017 CHAR(2),
aav2020 CHAR(3),
taav2017 CHAR(1),
tdaav2017 CHAR(2),
cateaav2020 CHAR(2),
bv2012 CHAR(5)
);
CREATE TABLE codegeoepci(
epci CHAR(9),
codegeo VARCHAR(5),
libgeo VARCHAR(255),
dep VARCHAR(3),
reg VARCHAR(3),
nature_epci CHAR(2),
arr VARCHAR(4),
cv VARCHAR(5),
ze2020 VARCHAR(4),
uu2020 VARCHAR(5),
tuu2017 VARCHAR(1),
tduu2017 CHAR(2),
aav2020 CHAR(3),
taav2017 CHAR(1),
tdaav2017 CHAR(2),
cateaav2020 CHAR(2),
bv2012 CHAR(5)
);
Créations des clés primaires et étrangères:
ALTER TABLE communes ADD CONSTRAINT table_app_1_pkey PRIMARY KEY (codegeo);
ALTER TABLE reg ADD CONSTRAINT table_app_2_pkey PRIMARY KEY (codegeo);
ALTER TABLE uu2010 ADD CONSTRAINT table_app_3_pkey PRIMARY KEY (codegeo);
ALTER TABLE ze2010 ADD CONSTRAINT table_app_4_pkey PRIMARY KEY (codegeo);
ALTER TABLE metro ADD CONSTRAINT table_app_5_pkey PRIMARY KEY (codegeo);
ALTER TABLE epci ADD CONSTRAINT table_app_6_pkey PRIMARY KEY (codegeo);
ALTER TABLE dep ADD CONSTRAINT table_app_7_pkey PRIMARY KEY (codegeo);
ALTER TABLE codegeo ADD CONSTRAINT table_app_8_pkey PRIMARY KEY (codegeo);
ALTER TABLE codegeouu ADD CONSTRAINT table_app_9_pkey PRIMARY KEY (codegeo);
ALTER TABLE codegeoze ADD CONSTRAINT table_app_10_pkey PRIMARY KEY (codegeo);
ALTER TABLE codegeo ADD CONSTRAINT fk_communes FOREIGN KEY (codegeo) REFERENCES communes (codegeo);
ALTER TABLE codegeo ADD CONSTRAINT fk_reg FOREIGN KEY (reg) REFERENCES reg (codegeo);
ALTER TABLE codegeo ADD CONSTRAINT fk_dep FOREIGN KEY (dep) REFERENCES dep (codegeo);
ALTER TABLE codegeoepci ADD CONSTRAINT fk_epci FOREIGN KEY (epci) REFERENCES epci (codegeo);
ALTER TABLE codegeoze ADD CONSTRAINT fk_ze FOREIGN KEY (ze2020) REFERENCES ze2010 (codegeo);
ALTER TABLE codegeouu ADD CONSTRAINT fk_uu FOREIGN KEY (uu2020) REFERENCES uu2010 (codegeo);
Adaptation des données: (mes données datant de 2016 et ma table codgeo datant de 2020, j’ai donc du effectué plusieurs merge)
CODEGEOze=merge(x=CODEGEO,y=ZE2010,by.x="ZE2020",by.y="CODGEO")
CODEGEOze= CODEGEOze[,1:17]
write.table(CODEGEOze,"CODEGEOze.csv",row.names=F,col.names=T,sep=";",quote=F)
CODEGEOuu=merge(x=CODEGEO,y=UU2010,by.x="UU2020",by.y="CODGEO")
CODEGEOuu= CODEGEOuu[,1:17]
write.table(CODEGEOuu,"CODEGEOuu.csv",row.names=F,col.names=T,sep=";",quote=F)
CODEGEOepci=merge(x=CODEGEO,y=EPCI,by.x="EPCI",by.y="CODGEO")
CODEGEOepci= CODEGEOepci[,1:17]
write.table(CODEGEOepci,"CODEGEOepci.csv",row.names=F,col.names=T,sep=";",quote=F)
CODEGEOfinal=merge(x=CODEGEO,y=COMMUNES,by.x="CODGEO",by.y="CODGEO")
CODEGEOfinal= CODEGEOfinal[,1:17]
write.table(CODEGEOfinal,"CODEGEOfinal.csv",row.names=F,col.names=T,sep=";",quote=F)
Importations des données sur phppgadmin:
\copy communes FROM 'COMMUNES.csv' CSV DELIMITER ',' HEADER;
\copy reg FROM 'REG.csv' CSV DELIMITER ';' HEADER;
\copy dep FROM 'DEP.csv' CSV DELIMITER ';' HEADER;
\copy uu2010 FROM 'UU2010.csv' CSV DELIMITER ';' HEADER;
\copy ze2010 FROM 'ZE2010.csv' CSV DELIMITER ';' HEADER;
\copy metro FROM 'METRO.csv' CSV DELIMITER ';' HEADER;
\copy epci FROM 'EPCI.csv' CSV DELIMITER ';' HEADER;
\copy codegeo FROM 'CODEGEOfinal.csv' CSV DELIMITER ';' HEADER;
\copy codegeoepci FROM 'CODEGEOepci.csv' CSV DELIMITER ';' HEADER;
\copy codegeoze FROM 'CODEGEOze.csv' CSV DELIMITER ';' HEADER;
\copy codegeouu FROM 'CODEGEOuu.csv' CSV DELIMITER ';' HEADER;
Données graphiques
Téléchargez tous les fichiers nécessaires au fonctionnements des graphiques (export sql).
Sources
Liste des sources:
https://www.nouvelle-aquitaine.fr/le-territoire/la-plus-grande-region-de-france