En este documento analizaremos la información disponible del Censo de Revillagigedo publicado por elINEGI y que fue consultado en su sitio de internet. A partir de esta información se contrasta la información documental que se encuentra en el Archivo General de la Nacion (AGN) y alguna otras fuentes como lo son:
Lo primero que vamos a realizar es cargar los archivos y la paquetería disponinle:
library(readxl) require(tidyverse)
setwd("/Users/dante/MEGA/Tesis/Historia/R") ddpcr::quiet(AGN <- read_excel("Data/Raw/AGN_localidades.xlsx",sheet = "Detalle")) INEGI <- read_excel("Data/Raw/Base_integrada.xlsx")
Actualmente la información que se encuentra en el AGN en el fondo Novo Hispano (Padrones) esta integrada por el siguiente número de volúmenes:
Vol_AGN<- AGN%>%select(Volumen)%>%unique() AGN%>%select(Volumen)%>%unique()
## # A tibble: 113 x 1 ## Volumen ## <dbl> ## 1 1 ## 2 2 ## 3 3 ## 4 4 ## 5 5 ## 6 6 ## 7 7 ## 8 8 ## 9 9 ## 10 10 ## # … with 103 more rows
En contraste el número de volumenes referidos por parte del INEGI (y con el que se cuenta registro de la intendencia) es:
Vol_INEGI<-INEGI %>% select(VOLUMEN,Intendecia)%>% unique()%>% separate(VOLUMEN, c("A1", "A2"), sep = "-")
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 48 rows [1, ## 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 21, 22, ...].
Vol_INEGI[is.na(Vol_INEGI)] <- 0 Vol_INEGI$A1<-as.numeric(Vol_INEGI$A1)
## Warning: NAs introduced by coercion
Vol_INEGI$A2<-as.numeric(Vol_INEGI$A2) Vol_INEGI<-Vol_INEGI[-c(51), ] Vol_INEGI
## # A tibble: 50 x 3 ## A1 A2 Intendecia ## <dbl> <dbl> <chr> ## 1 35 0 Durango ## 2 14 0 Guadalajara ## 3 11 0 Guadalajara ## 4 23 0 Guanajuato ## 5 125 0 Guanajuato ## 6 24 0 Guanajuato ## 7 32 33 Guanajuato ## 8 37 0 Guanajuato ## 9 41 0 Guanajuato ## 10 42 0 Guanajuato ## # … with 40 more rows
Vol_INEGI %>% group_by(Intendecia) %>% summarise(n = n())%>%mutate(prop=n/sum(n))
## # A tibble: 9 x 3 ## Intendecia n prop ## <chr> <int> <dbl> ## 1 Durango 1 0.02 ## 2 Guadalajara 2 0.04 ## 3 Guanajuato 9 0.18 ## 4 Mexico 17 0.34 ## 5 Oaxaca 3 0.06 ## 6 Puebla 10 0.2 ## 7 Valladolid 3 0.06 ## 8 Veracruz 4 0.08 ## 9 Zacatecas 1 0.02
Lo primero que nosotros buscamos conocer es ¿en cuántas intendencias se cuenta información a detalle en el AGN?. Para saber esto necesitamos información que nos ayude a "ubicar" en dónde se encuentran las localidades. Una primera solución es contrastar esta información con los registros del Censo realizado por el INEGI. De esta manera, lo que buscamos conocer es, de acuerdo a esta fuente, la relación de volúmenes e intendencias (el masaje de los datos podria ser un poco más fino pero de momento llegamos a nuestro resultado esperado). El último paso consiste en apilar los registros para poder presentarlos de una forma más decente para nuestro amable lector. Posteriormente integramos los dos df utilizando como "llave" el número de volumen:
Vol_INEGI<-reshape(data=Vol_INEGI, idvar="Intendencia", varying = c("A1","A2"), v.name=c("value"), times=c("A1","A2"), new.row.names = 1:1000, direction="long")
## Warning: Setting row names on a tibble is deprecated. ## Warning: Setting row names on a tibble is deprecated.
Vol_INEGI<-Vol_INEGI[, -c(2,4)] Vol_INEGI <- na.omit(Vol_INEGI) Vol_AGN <- na.omit(Vol_AGN) Vol_INEGI<-Vol_INEGI[!(Vol_INEGI$value==0),] # Integración de nuestros df Integracion<-Vol_AGN%>%left_join(Vol_INEGI, by = c("Volumen" = "value")) Integracion
## # A tibble: 126 x 2 ## Volumen Intendecia ## <dbl> <chr> ## 1 1 Mexico ## 2 2 Mexico ## 3 2 Puebla ## 4 3 Mexico ## 5 3 Puebla ## 6 4 Mexico ## 7 5 Mexico ## 8 5 Zacatecas ## 9 6 Mexico ## 10 7 Mexico ## # … with 116 more rows
Ahora si, el primer dato que queremos conocer del df es conocer en ¿cuántos volumenes del AGN sabemos a qué intendencia corresponden?... veamos la respuesta:
Integracion%>% group_by(Intendecia) %>% summarise(n = n())%>%mutate(prop=n/sum(n))
## # A tibble: 10 x 3 ## Intendecia n prop ## <chr> <int> <dbl> ## 1 <NA> 78 0.619 ## 2 Durango 1 0.00794 ## 3 Guadalajara 2 0.0159 ## 4 Guanajuato 8 0.0635 ## 5 Mexico 18 0.143 ## 6 Oaxaca 1 0.00794 ## 7 Puebla 10 0.0794 ## 8 Valladolid 3 0.0238 ## 9 Veracruz 4 0.0317 ## 10 Zacatecas 1 0.00794
La distribución del número de volumenes por intendencia de acuerdo al INEGI, tenemos un total de:
Vol_INEGI %>% group_by(Intendecia) %>% summarise(n = n())%>%mutate(prop=n/sum(n))
## # A tibble: 9 x 3 ## Intendecia n prop ## <chr> <int> <dbl> ## 1 Durango 1 0.0196 ## 2 Guadalajara 2 0.0392 ## 3 Guanajuato 10 0.196 ## 4 Mexico 18 0.353 ## 5 Oaxaca 2 0.0392 ## 6 Puebla 10 0.196 ## 7 Valladolid 3 0.0588 ## 8 Veracruz 4 0.0784 ## 9 Zacatecas 1 0.0196
Un punto importante a destacar de lo anterior es que estamos hablando solamente de volumenes, no del numero de localidades. Del archivo del Censo generado por el INEGI, podemos identificar cuántas localidades se cuentan capturadas. Cada renglón cuenta como una localidad única que tiene datos a nivel de castas.
LOC_INEGI<-INEGI%>%select(`Ciudad/ Localidad`)%>%unique() INEGI%>%select(`Ciudad/ Localidad`)%>%unique()
## # A tibble: 119 x 1 ## `Ciudad/ Localidad` ## <chr> ## 1 San Juan Del Rio ## 2 Aguacatlan ## 3 Colima ## 4 Acambaro ## 5 Celaya ## 6 Dolores ## 7 Guanajuato ## 8 Irapuato ## 9 Penjamo ## 10 Silao ## # … with 109 more rows
Analicemos cuántos registros del AGN serían candidatos para la integración a nuestro análisis:
Año<-AGN%>%select(Fecha, Volumen)%>%unique()%>%na.omit()%>%filter(Fecha>1790 & Fecha<1810) Año<-Año%>%select(Volumen)%>%unique() Año
## # A tibble: 57 x 1 ## Volumen ## <dbl> ## 1 1 ## 2 4 ## 3 5 ## 4 6 ## 5 7 ## 6 10 ## 7 11 ## 8 12 ## 9 13 ## 10 14 ## # … with 47 more rows
Como podemos ver son 57 volumenes, por lo que podemos empezar una revisión por aquellos que adicionalmente se encuentran en la base del INEGI:
Vol_INEGI<-Vol_INEGI%>% select(value)%>% unique() Vol_INEGI$control<-1 Año%>% left_join(Vol_INEGI, by = c("Volumen" = "value"))%>% na.omit()%>% select(Volumen)%>% print(n=30)
## # A tibble: 27 x 1 ## Volumen ## <dbl> ## 1 1 ## 2 4 ## 3 5 ## 4 6 ## 5 7 ## 6 11 ## 7 12 ## 8 13 ## 9 14 ## 10 18 ## 11 19 ## 12 20 ## 13 21 ## 14 23 ## 15 24 ## 16 25 ## 17 27 ## 18 29 ## 19 32 ## 20 33 ## 21 34 ## 22 37 ## 23 38 ## 24 39 ## 25 40 ## 26 41 ## 27 42
Finalmente es importante recordar dos aspectos: 1) el número de volumen puede que este incorrecto en la base del INEGI y 2) actualmente no se ha concluido el ejericio de integración de archivos del documento de PDF.