Ce notebook à vocation éducative présente une visualisation des données libres “Imprimeurs, libraires et lithographes en France au 19e siècle”. Créé par Paul Amat, http://amat-design.com
Nom : Imprimeurs, libraires et lithographes en France au 19e siècle
Producteur : Ministère de la Culture https://www.data.gouv.fr/fr/datasets/imprimeurs-libraires-et-lithographes-en-france-au-19e-siecle/
Mise à jour : 25 mai 2022
Licence : Licence Ouverte / Open Licence version 2.0 https://www.etalab.gouv.fr/licence-ouverte-open-licence/
L’usage de ces données ne revêt ni caractère officiel à la réutilisation de l’information, ni quelconque reconnaissance ou caution par le producteur.
lib <- read.csv("/cloud/project/imprimeurs-libraires-et-lithographes-en-france-au-19e-siecle.csv", sep=";")
lib <- lib[, c("sexe", "brevet", "departement_an", "cote")]
for (i in 1:length(lib)) {
lib[[i]] <- factor(lib[[i]])
}
summary(lib)
## sexe brevet
## femme : 3261 libraire :11060
## homme :14664 lithographe : 2314
## non précisé: 44 imprimeur : 1364
## imprimeur|libraire : 1033
## imprimeur|lithographe : 481
## imprimeur|lithographe|libraire: 388
## (Other) : 1329
## departement_an cote
## Seine : 5096 Pas de dossier parmi les brevetés parisiens: 267
## Nord : 543 F/18/1968 : 72
## Rhône : 528 F/18/2067 : 72
## Gironde : 400 F/18/2046 : 71
## Seine-et-Oise : 376 F/18/2047 : 70
## Bouches-du-Rhône: 343 F/18/1962 : 69
## (Other) :10683 (Other) :17348
t <- which(lib$sexe == "non précisé" | lib$cote == "Pas de dossier parmi les brevetés parisiens" | lib$cote == "Pas de dosssier parmi les brevetés parisiens")
lib <- lib[-t,]
summary(lib)
## sexe brevet
## femme : 3229 libraire :10819
## homme :14428 lithographe : 2302
## non précisé: 0 imprimeur : 1330
## imprimeur|libraire : 1030
## imprimeur|lithographe : 478
## imprimeur|lithographe|libraire: 388
## (Other) : 1310
## departement_an cote
## Seine : 4825 F/18/1968: 72
## Nord : 543 F/18/2067: 72
## Rhône : 524 F/18/2046: 71
## Gironde : 398 F/18/2047: 70
## Seine-et-Oise : 376 F/18/1962: 69
## Bouches-du-Rhône: 343 F/18/1951: 68
## (Other) :10648 (Other) :17235
Traitement des départements doublons
for (i in 1:length(lib$departement_an)) {
if (lib$departement_an[i] == "Moselle et Meurthe-et-Moselle (départements d'Alsace-Moselle)" | lib$departement_an[i] == "Meurthe et Meurthe-et-Moselle") {
lib$departement_an[i] <- "Meurthe-et-Moselle"
}
}
Transformation des données en “tibble”, séparation des champs à entrées multiples
me <- c()
de <- c()
se <- c()
lib$departement_an <- as.character(lib$departement_an)
lib$sexe <- as.character(lib$sexe)
t <- c("libraire", "imprimeur", "lithographe", "typographe", "taille-doucier", "cabinet", "photographe")
for (i in 1:length(lib$brevet)) {
for (j in 1:length(t)) {
if (grepl(t[j], lib$brevet[i])) {
me <- c(me, t[j])
de <- c(de, lib$departement_an[i])
se <- c(se, lib$sexe[i])
}
}
}
d <- data.frame(me, de, se)
colnames(d) <- c("Metier", "Departement", "Sexe")
for (i in 1:length(d$Metier)) {
if (d$Metier[i] == "cabinet") {
d$Metier[i] <- "Cabinet lecture"
}
}
if (!require(stringr)) install.packages("stringr")
## Loading required package: stringr
library(stringr)
for (i in 1:length(d$Metier)) {
d$Metier[i] <- str_to_sentence(d$Metier[i])
}
for (i in 1:length(d$Sexe)) {
d$Sexe[i] <- str_to_sentence(d$Sexe[i])
}
if (!require(ggplot2)) install.packages("ggplot2")
## Loading required package: ggplot2
library(ggplot2)
t <- 2
ggplot(d, aes(Metier, Departement, col = Sexe)) +
geom_count() +
scale_x_discrete(position="top") +
scale_y_discrete() +
labs(title = "Répartition des métiers du livre au 19e siècle \npar départements et sexe", subtitle = paste("Source : Open data, Ministère de la Culture, maj 25 mai 2022 \nN = ", nrow(lib), sep = ""), caption = "Créé par Paul Amat, amat-design.com") +
theme(axis.text.x = element_text(angle = 15, hjust = 0))