Introduction

Ce notebook à vocation éducative présente une visualisation des données libres “Imprimeurs, libraires et lithographes en France au 19e siècle”. Créé par Paul Amat, http://amat-design.com

Open data

Nom : Imprimeurs, libraires et lithographes en France au 19e siècle

Producteur : Ministère de la Culture https://www.data.gouv.fr/fr/datasets/imprimeurs-libraires-et-lithographes-en-france-au-19e-siecle/

Mise à jour : 25 mai 2022

Licence : Licence Ouverte / Open Licence version 2.0 https://www.etalab.gouv.fr/licence-ouverte-open-licence/

L’usage de ces données ne revêt ni caractère officiel à la réutilisation de l’information, ni quelconque reconnaissance ou caution par le producteur.

Import

lib <- read.csv("/cloud/project/imprimeurs-libraires-et-lithographes-en-france-au-19e-siecle.csv", sep=";")
lib <- lib[, c("sexe", "brevet", "departement_an", "cote")]
for (i in 1:length(lib)) {
  lib[[i]] <- factor(lib[[i]])
}

summary(lib)
##           sexe                                  brevet     
##  femme      : 3261   libraire                      :11060  
##  homme      :14664   lithographe                   : 2314  
##  non précisé:   44   imprimeur                     : 1364  
##                      imprimeur|libraire            : 1033  
##                      imprimeur|lithographe         :  481  
##                      imprimeur|lithographe|libraire:  388  
##                      (Other)                       : 1329  
##           departement_an                                           cote      
##  Seine           : 5096   Pas de dossier parmi les brevetés parisiens:  267  
##  Nord            :  543   F/18/1968                                  :   72  
##  Rhône           :  528   F/18/2067                                  :   72  
##  Gironde         :  400   F/18/2046                                  :   71  
##  Seine-et-Oise   :  376   F/18/2047                                  :   70  
##  Bouches-du-Rhône:  343   F/18/1962                                  :   69  
##  (Other)         :10683   (Other)                                    :17348

Transformation

t <- which(lib$sexe == "non précisé" | lib$cote == "Pas de dossier parmi les brevetés parisiens" | lib$cote == "Pas de dosssier parmi les brevetés parisiens")

lib <- lib[-t,]

summary(lib)
##           sexe                                  brevet     
##  femme      : 3229   libraire                      :10819  
##  homme      :14428   lithographe                   : 2302  
##  non précisé:    0   imprimeur                     : 1330  
##                      imprimeur|libraire            : 1030  
##                      imprimeur|lithographe         :  478  
##                      imprimeur|lithographe|libraire:  388  
##                      (Other)                       : 1310  
##           departement_an         cote      
##  Seine           : 4825   F/18/1968:   72  
##  Nord            :  543   F/18/2067:   72  
##  Rhône           :  524   F/18/2046:   71  
##  Gironde         :  398   F/18/2047:   70  
##  Seine-et-Oise   :  376   F/18/1962:   69  
##  Bouches-du-Rhône:  343   F/18/1951:   68  
##  (Other)         :10648   (Other)  :17235

Traitement des départements doublons

for (i in 1:length(lib$departement_an)) {
  if (lib$departement_an[i] == "Moselle et Meurthe-et-Moselle (départements d'Alsace-Moselle)" | lib$departement_an[i] == "Meurthe et Meurthe-et-Moselle") {
    lib$departement_an[i] <- "Meurthe-et-Moselle"
  }
}

Transformation des données en “tibble”, séparation des champs à entrées multiples

me <- c()
de <- c()
se <- c()

lib$departement_an <- as.character(lib$departement_an)
lib$sexe <- as.character(lib$sexe)

t <- c("libraire", "imprimeur", "lithographe", "typographe", "taille-doucier", "cabinet", "photographe")

for (i in 1:length(lib$brevet)) {
  for (j in 1:length(t)) {
    if (grepl(t[j], lib$brevet[i])) {
      me <- c(me, t[j])
      de <- c(de, lib$departement_an[i])
      se <- c(se, lib$sexe[i])
    }
  }
}

d <- data.frame(me, de, se)
colnames(d) <- c("Metier", "Departement", "Sexe")
for (i in 1:length(d$Metier)) {
  if (d$Metier[i] == "cabinet") {
    d$Metier[i] <- "Cabinet lecture"
  }
}
if (!require(stringr)) install.packages("stringr")
## Loading required package: stringr
library(stringr)

for (i in 1:length(d$Metier)) {
  d$Metier[i] <- str_to_sentence(d$Metier[i])
}

for (i in 1:length(d$Sexe)) {
  d$Sexe[i] <- str_to_sentence(d$Sexe[i])
}

Visualisation

if (!require(ggplot2)) install.packages("ggplot2")
## Loading required package: ggplot2
library(ggplot2)
t <- 2

ggplot(d, aes(Metier, Departement, col = Sexe)) +
  geom_count() +
  scale_x_discrete(position="top") +
  scale_y_discrete() +
  labs(title = "Répartition des métiers du livre au 19e siècle \npar départements et sexe", subtitle = paste("Source : Open data, Ministère de la Culture, maj 25 mai 2022 \nN = ", nrow(lib), sep = ""), caption = "Créé par Paul Amat, amat-design.com") +
  theme(axis.text.x = element_text(angle = 15, hjust = 0))