Hecho con gusto por Carla Carolina Pérez Hernández (UAEH)

DENSIDAD DEL RELACIONAMIENTO: CASO HIPOTÉTICO

Objetivo: Estimar la densidad del relacionamiento (rd)

La densidad varia entre 0 y 1, los valores más grandes indican que la región ha avanzado a una VCR en muchos bienes proximos al bien i y tiene mayor probabilidad de exportarlo en el futuro mayor densidad, mayor cercanía. Menor densidad, mayor lejanía.

En este laboratorio vamos a:

  1. Cargar una matriz hipotética de datos

  2. Estimar la VCR de la matriz hipotética

  3. Calcular las co-ocurrencias y el relacionamiento (espacio-producto)

  4. Estimar la densidad del relacionamiento (rd). Buscamos saber si las industrias que estan relacionadas estan presentes en las regiones o no. Nivel de cercanía

  5. Predecir la entrada de una nueva industria. Econometría usar count(densidad del relacionamiento) como regresora (predictora) de la entrada de una nueva industria.

Densidad del relacionamiento (rd) #

——————————-LABORATORIO 12——————————-

——————–Alumna: Ana Grisel Sanjuan Merida———————–

La densidad del relacionamiento (saber si existe una conexión entre dos productos, qué tan conectado están). Mide la distancia en términos de cercanía. Mayor densidad evidencía mayor cercanía. Menor densidad evidencía mayor lejanía.

Cómo se mide la densidad del relacionamiento (rd)? Paquete: Balland, P.A. (2017) Economic Geography in R: Introduction to the EconGeo Package, Papers in Evolutionary Economic Geography, 17 (09): 1-75. Para instalar: https://www.paballand.com/install-r

Abrir la librería de EconGeo

library(EconGeo)
## 
## Please cite EconGeo in publications as:
##  Balland, P.A. (2017) Economic Geography in R: Introduction to the EconGeo Package, Papers in Evolutionary Economic Geography, 17 (09): 1-75

Preguntaremos a EconGeo, qué es la Ventaja Comparativa Revelada RCA. Es para saber qué tan especializado está una región en la producción de determinado bien/producto. Es una medida de especialización.

?RCA
## starting httpd help server ... done

Se visualiza la descripción en el cuadrante inferior derecho (Help).

Usar la documentación para generar “mat” y crear una matriz con RCA. Copiar los datos de las utilidades a la consola ##generate. ## generate a region - industry matrix

set.seed(31)
mat <- matrix(sample(0:100,20,replace=T), ncol = 4)
rownames(mat) <- c ("R1", "R2", "R3", "R4", "R5")
colnames(mat) <- c ("I1", "I2", "I3", "I4")

Para visualizar la matriz:

mat
##    I1 I2 I3 I4
## R1 44 63  8 83
## R2 48 42 10  1
## R3 74 54 96 16
## R4 39 26 28 13
## R5 89 61 45 76

Para visualizar la dimensión de la matriz generada:

dim(mat)
## [1] 5 4

En los rengloes están las regiones (5) y en las columnas las industrias (4)

Escribe mat en la consola, son número de empleados. Ahora, convertimos la matriz en binaria.

mat = RCA(mat, binary = T)

Para visualizar matriz binaria generada

mat
##    I1 I2 I3 I4
## R1  0  1  0  1
## R2  1  1  0  0
## R3  0  0  1  0
## R4  1  0  1  0
## R5  1  0  0  1

Los 1 indican la RCA. Ve la nueva matriz binaria de RCA. Es la matriz de VCR. Correr el RCA de la matriz original (rca básicamente es un indicador de especialización,produce mas de lo esperado basado en el tamaño de la región y de la industria).

Calcular la matriz de co-ocurrencia de la mat transpuesta

c = co.occurrence(t(mat))

Para visualizar la matriz de co-ocurrencias generada

c
##    I1 I2 I3 I4
## I1  0  1  1  1
## I2  1  0  0  1
## I3  1  0  0  0
## I4  1  1  0  0

Calcular el relacionamiento con base en las co-ocurrencias

r=relatedness(c)

Para visualizar

r
##           I1        I2       I3        I4
## I1 0.0000000 0.9090909 1.944444 0.9090909
## I2 0.9090909 0.0000000 0.000000 1.5000000
## I3 1.9444444 0.0000000 0.000000 0.0000000
## I4 0.9090909 1.5000000 0.000000 0.0000000

Aplicación de regla binaria

r[r<1]=0
r[r>1]=1

Es la matriz del espacio-producto. Para visualizar:

r
##    I1 I2 I3 I4
## I1  0  0  1  0
## I2  0  0  0  1
## I3  1  0  0  0
## I4  0  1  0  0

Densidad del relacionamiento. Es la métrica de distancia en términos de cercanía.

Asegurate que hayas computado la matriz binaria de RCA antes de computar el Relacionamiento-densidad. Se usa la matriz de VCR (mat) Y el espacio producto (r).

Matriz de VCR

mat
##    I1 I2 I3 I4
## R1  0  1  0  1
## R2  1  1  0  0
## R3  0  0  1  0
## R4  1  0  1  0
## R5  1  0  0  1

Matriz del espacio-producto

r
##    I1 I2 I3 I4
## I1  0  0  1  0
## I2  0  0  0  1
## I3  1  0  0  0
## I4  0  1  0  0

Las dos matrices serán el INPUT para generar la matriz de relacionamiento.

rd=relatedness.density(mat,r)

Para visualizar

rd
##     I1  I2  I3  I4
## R1   0 100   0 100
## R2   0   0 100 100
## R3 100   0   0   0
## R4 100   0 100   0
## R5   0 100 100   0

Rango 0-100. La industria 1 (I1) esta relacionada con la industria 2 y 3 (I2, I3) (I1)R = 2 (I2;I3). Y la región 1 (R1) ya tiene la industria 2 (I2), pero no tiene la industria 3 (I3). HAY 2 INDUSTRIAS RELACIONADAS CON LA INDUSTRIA 1, POR ESO 2, PERO LA REGIÓN 1 SÓLO TIENE 1 DE ESAS INDUSTRIAS RELACIONADAS, ENTONCES 1/2=0.5

Para visualizar los datos en forma de lista

rd=get.list(rd)
## 
## Attaching package: 'reshape'
## The following object is masked from 'package:Matrix':
## 
##     expand

Para visualizar

rd
##    Region Industry Count
## 1      R1       I1     0
## 2      R2       I1     0
## 3      R3       I1   100
## 4      R4       I1   100
## 5      R5       I1     0
## 6      R1       I2   100
## 7      R2       I2     0
## 8      R3       I2     0
## 9      R4       I2     0
## 10     R5       I2   100
## 11     R1       I3     0
## 12     R2       I3   100
## 13     R3       I3     0
## 14     R4       I3   100
## 15     R5       I3   100
## 16     R1       I4   100
## 17     R2       I4   100
## 18     R3       I4     0
## 19     R4       I4     0
## 20     R5       I4     0

Count se refiere a la variable densidad del relacionamiento. Es útil para correr ecuaciones de regresión para econometría.

Predecir entrada

En Complejidad Económica se tiene la hipótesis que la densidad del relacionamieto es una varibla explicativa para la entrada hacia una industria o no.

?entry.list 

Matriz de la industria región en un momento T

Mira la sección de ejemplos. Copia-pega los datos a la consola matrices en 2 momentos en el tiempo.Generate a first region - industry matrix in which cells represent the presence/absence of a RCA (period 1).

set.seed(31)
mat1 <- matrix(sample(0:1,20,replace=T), ncol = 4)
rownames(mat1) <- c ("R1", "R2", "R3", "R4", "R5")
colnames(mat1) <- c ("I1", "I2", "I3", "I4")

Para visualizar la matriz 1. Matriz binaria de RCA en el momento T.

mat1
##    I1 I2 I3 I4
## R1  0  1  0  1
## R2  0  0  0  1
## R3  0  0  0  1
## R4  1  0  0  1
## R5  1  1  1  0

Nuevamente copiamos el comando de los ejemplos en el cuadrante inferior derecho (help) ## generate a second region - industry matrix in which cells represent the presence/absence ## of a RCA (period 2)

mat2 <- mat1
mat2[3,1] <- 1

Para visualizar la matriz 2

mat2
##    I1 I2 I3 I4
## R1  0  1  0  1
## R2  0  0  0  1
## R3  1  0  0  1
## R4  1  0  0  1
## R5  1  1  1  0

Ver que las posibilidades de entrada es cuando tienes un 0 de VCR

Cuando tienes 1 puedes: permanecer o salir, pero no entrar. NA, no puede entrar (porque ya tiebe una RCA). 1 tiene potencial de entrada y entró, 0 puede tener potencial de entrada, pero no ha entrado.

d=entry.list(mat1, mat2)

Para visualizar d

d
##    region industry entry period
## 1      R1       I1     0      2
## 2      R2       I1     0      2
## 3      R3       I1     1      2
## 4      R4       I1    NA      2
## 5      R5       I1    NA      2
## 6      R1       I2    NA      2
## 7      R2       I2     0      2
## 8      R3       I2     0      2
## 9      R4       I2     0      2
## 10     R5       I2    NA      2
## 11     R1       I3     0      2
## 12     R2       I3     0      2
## 13     R3       I3     0      2
## 14     R4       I3     0      2
## 15     R5       I3    NA      2
## 16     R1       I4    NA      2
## 17     R2       I4    NA      2
## 18     R3       I4    NA      2
## 19     R4       I4    NA      2
## 20     R5       I4     0      2

Ahora se observa una nueva variable: entry (entrada). Esta variable la identifica con el juego de la matriz con la matriz T más uno.

Combinación de bases

Para ver la densidad del relacionamiento y la tabla recien elaborada, se hará un match entre las bases y los elementos región e industria.

colnames (d) = c("Region", "Industry", "Entry", "Period")
d = merge(d, rd, by = c("Region", "Industry"))

Para visualizar objeto d

d
##    Region Industry Entry Period Count
## 1      R1       I1     0      2     0
## 2      R1       I2    NA      2   100
## 3      R1       I3     0      2     0
## 4      R1       I4    NA      2   100
## 5      R2       I1     0      2     0
## 6      R2       I2     0      2     0
## 7      R2       I3     0      2   100
## 8      R2       I4    NA      2   100
## 9      R3       I1     1      2   100
## 10     R3       I2     0      2     0
## 11     R3       I3     0      2     0
## 12     R3       I4    NA      2     0
## 13     R4       I1    NA      2   100
## 14     R4       I2     0      2     0
## 15     R4       I3     0      2   100
## 16     R4       I4    NA      2     0
## 17     R5       I1    NA      2     0
## 18     R5       I2    NA      2   100
## 19     R5       I3    NA      2   100
## 20     R5       I4     0      2     0

La variable del relacionamiento trata de explicar por qué las industrias entran o no entran a una determinada región. Abre d para identificar que se busca explicar que tanto la “densidad del relacionamiento” (x) impacta la entrada (y). Abre rd que es la “densidad del relacionamiento” como regresora (variable explicativa-x-) de la “entrada” (variable explicada-y-)

Econometría

Ecuación de regresión, modelo lineal lm. La variable dependiente es la entrada ENTRY. La variable independiente es el relacionamiento COUNT. Entonces decimos que la entrada va a depender de la densidad del relacionamiento.

summary(lm(d$Entry ~ d$Count))
## 
## Call:
## lm(formula = d$Entry ~ d$Count)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.3333  0.0000  0.0000  0.0000  0.6667 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.347e-17  9.623e-02   0.000    1.000
## d$Count      3.333e-03  1.843e-03   1.809    0.104
## 
## Residual standard error: 0.2722 on 9 degrees of freedom
##   (9 observations deleted due to missingness)
## Multiple R-squared:  0.2667, Adjusted R-squared:  0.1852 
## F-statistic: 3.273 on 1 and 9 DF,  p-value: 0.1039

lm(dependiente~independiente1+independiente2, data=datos) qué tanto la “densidad del relacionamiento” impacta la entrada.

Exportar resultados para cytoscape o gephi

library(igraph)
## 
## Attaching package: 'igraph'
## The following object is masked from 'package:EconGeo':
## 
##     diversity
## The following objects are masked from 'package:stats':
## 
##     decompose, spectrum
## The following object is masked from 'package:base':
## 
##     union

Guardar archivo csv

write.csv(d, file = "densidadRelacionamiento.csv")