El grado de un nodo en una red tanto dirigida como no dirigida se puede calcular fácilmente a partir de la matriz de adyacencia \(\mathbf{Y}=[y_{i,j}]\). El out-degree \(d_i^{\text{out}}\) y el in-degree \(d_i^{\text{in}}\) del nodo \(i\) se pueden calcular respectivamente como: \[ d_i^{\text{out}} = \sum_{j:j\neq i} y_{i,j} \qquad\text{y}\qquad d_i^{\text{in}} = \sum_{j:j\neq i} y_{j,i} \] Muestre que este cálculo funciona tanto para relaciones dirigidas como no dirigidas. Específicamente, muestre que si la red es no dirigida entonces \(d_i^{\text{out}} = d_i^{\text{in}}\).
Tanto para redes dirigidas como no dirigidas, se define la media global de las interacciones como \[ \bar{y}=\frac{1}{n(n-1)}\sum_{i,j:i\neq j} y_{i,j} \] donde \(\mathbf{Y}=[y_{i,j}]\) es la matriz de adyacencia de la red correspondiente. Tal estadístico corresponde a una descripción muy rudimentaria acerca de la plausibilidad de observar una relación entre dos nodos cualesquiera, dado que no tiene en cuenta la heterogeneidad nodal (algunos nodos son más propensos a enviar/recibir más relaciones).
comtrade.RData (este archivo contiene una arreglo de cuatro dimensiones denominado comtrade), asociado con el crecimiento anual del comercio (diferencia en dólares en escala logarítmica respecto al año 2000). Este conjunto de datos involucra 30 países, 10 años desde 1996 hasta 2005, y 6 clases de productos diferentes, como se muestra a continuación:load("C:/Users/Juan Camilo/Dropbox/UN/networks_2021_2/comtrade.RData")
dimnames(comtrade)[c(1,3,4)]
## [[1]]
## [1] "Australia" "Austria" "Brazil"
## [4] "Canada" "China" "China, Hong Kong SAR"
## [7] "Czech Rep." "Denmark" "Finland"
## [10] "France" "Germany" "Greece"
## [13] "Indonesia" "Ireland" "Italy"
## [16] "Japan" "Malaysia" "Mexico"
## [19] "Netherlands" "New Zealand" "Norway"
## [22] "Rep. of Korea" "Singapore" "Spain"
## [25] "Sweden" "Switzerland" "Thailand"
## [28] "Turkey" "United Kingdom" "USA"
##
## [[2]]
## [1] "Chemicals"
## [2] "Crude materials, inedible, except fuels"
## [3] "Food and live animals"
## [4] "Machinery and transport equipment"
## [5] "Manufact goods classified chiefly by material"
## [6] "Miscellaneous manufactured articles"
##
## [[3]]
## [1] "1996" "1997" "1998" "1999" "2000" "2001" "2002" "2003" "2004" "2005"
Y dada por:Y <- apply(X = comtrade[,,c(5,6),], MARGIN = c(1,2), FUN = mean)
dim(Y)
## [1] 30 30
round(Y[1:5,1:5], 2)
## Australia Austria Brazil Canada China
## Australia NA 0.10 0.08 0.03 0.08
## Austria 0.08 NA 0.06 0.06 0.09
## Brazil -0.06 0.03 NA 0.07 0.14
## Canada 0.00 0.05 -0.03 NA 0.10
## China 0.13 0.12 0.14 0.16 NA
(Respuesta: 0.03778362).
Calcule la media de todas las observaciones de cada fila de Y, es decir, calcule la media fila \(\bar{y}_{i\bullet}=\frac{1}{n-1}\sum_{j:j\neq i} y_{i,j}\) para cada país. Realice una histograma de los promedios fila \(\bar{y}_{i\bullet}\). Los promedios fila caracterizan diferentes niveles de actividad de los nodos en términos de la sociabilidad. ¿Cómo se pueden interpretar los promedios fila \(\bar{y}_{i\bullet}\)?
Calcule la media de todas las observaciones de cada columna de Y, es decir, calcule la media columna \(\bar{y}_{\bullet j}=\frac{1}{n-1}\sum_{i:i\neq j} y_{i,j}\) para cada país. Realice una histograma de los promedios columna \(\bar{y}_{\bullet j}\). Los promedios columna caracterizan diferentes niveles de actividad de los nodos en términos de la popularidad. ¿Cómo se pueden interpretar los promedio columna \(\bar{y}_{\bullet j}\)?
Calcule tanto la media de los promedios fila \(\bar{y}_{i\bullet}\) como la media de los promedios columna \(\bar{y}_{\bullet j}\). (Respuesta: 0.03778362 y 0.03778362).
Calcule tanto la DE de los promedios fila \(\bar{y}_{i\bullet}\) como la DE de los promedios columna \(\bar{y}_{\bullet j}\). ¿Qué se puede concluir acerca de la heterogeneidad local en este caso? (Respuesta: 0.03019967 y 0.04101555).
Calcule el coeficiente de correlación entre los promedios fila \(\bar{y}_{i\bullet}\) y los promedios columna \(\bar{y}_{\bullet j}\). Realice un dispersograma de los promedios columna \(\bar{y}_{\bullet j}\) (eje \(y\)) frente a los promedios fila \(\bar{y}_{i\bullet}\) (eje \(x\)), junto con la recta \(y=x\) como punto de referencia. ¿Qué se puede concluir? (Respuesta: 0.7002526).
conflict.RData recopilado por Mike Ward y Xun Cao del departamento de Ciencias Políticas de la Universidad de Washington, asociado con datos de conflictos entre países en los años 90. El archivo conflict.RData contiene una lista con tres arreglos, X, Y, y D. X tiene tres campos: population (población en millones), gdp (PIB en millones de dolares) polity (puntuación política, un índice de democracia). Y hace referencia a una matriz \(\mathbf{Y}=[y_{i,j}]\) en la que \(y_{i,j}\) representa el número de conflictos iniciados por el país \(i\) hacia el país \(j\). Finalmente, Des un arreglo de tres dimensiones dimensiones cuya tercera dimensión contiene indices entre cada par de países asociados con: comercio (dimensión 1), importaciones (dimensión 2), organizaciones intergubernamentales (dimensión 3), y distancia geográfica (dimensión 4).