1. El grado de un nodo en una red tanto dirigida como no dirigida se puede calcular fácilmente a partir de la matriz de adyacencia \(\mathbf{Y}=[y_{i,j}]\). El out-degree \(d_i^{\text{out}}\) y el in-degree \(d_i^{\text{in}}\) del nodo \(i\) se pueden calcular respectivamente como: \[ d_i^{\text{out}} = \sum_{j:j\neq i} y_{i,j} \qquad\text{y}\qquad d_i^{\text{in}} = \sum_{j:j\neq i} y_{j,i} \] Muestre que este cálculo funciona tanto para relaciones dirigidas como no dirigidas. Específicamente, muestre que si la red es no dirigida entonces \(d_i^{\text{out}} = d_i^{\text{in}}\).

  2. Tanto para redes dirigidas como no dirigidas, se define la media global de las interacciones como \[ \bar{y}=\frac{1}{n(n-1)}\sum_{i,j:i\neq j} y_{i,j} \] donde \(\mathbf{Y}=[y_{i,j}]\) es la matriz de adyacencia de la red correspondiente. Tal estadístico corresponde a una descripción muy rudimentaria acerca de la plausibilidad de observar una relación entre dos nodos cualesquiera, dado que no tiene en cuenta la heterogeneidad nodal (algunos nodos son más propensos a enviar/recibir más relaciones).

  1. Muestre que para relaciones no dirigidas la media global \(\bar{y}\) es igual a la media tanto de la parte triangular superior de \(\mathbf{Y}\) como de la parte triangular inferior de \(\mathbf{Y}\).
  2. Muestre que tanto para relaciones dirigidas como no dirigidas la media global corresponde a la densidad de la red.
  3. Muestre que tanto para relaciones direigidas como no dirigidas se tiene que \((n-1)\bar{y} = \bar{d}^{\text{out}}=\bar{d}^{\text{in}}\). Es decir, el grado promedio tanto de entrada como de salida son iguales y a su vez equivalentes la densidad.
  1. Considere el conjunto de datos dado en comtrade.RData (este archivo contiene una arreglo de cuatro dimensiones denominado comtrade), asociado con el crecimiento anual del comercio (diferencia en dólares en escala logarítmica respecto al año 2000). Este conjunto de datos involucra 30 países, 10 años desde 1996 hasta 2005, y 6 clases de productos diferentes, como se muestra a continuación:
load("C:/Users/Juan Camilo/Dropbox/UN/networks_2021_2/comtrade.RData")
dimnames(comtrade)[c(1,3,4)]
## [[1]]
##  [1] "Australia"            "Austria"              "Brazil"              
##  [4] "Canada"               "China"                "China, Hong Kong SAR"
##  [7] "Czech Rep."           "Denmark"              "Finland"             
## [10] "France"               "Germany"              "Greece"              
## [13] "Indonesia"            "Ireland"              "Italy"               
## [16] "Japan"                "Malaysia"             "Mexico"              
## [19] "Netherlands"          "New Zealand"          "Norway"              
## [22] "Rep. of Korea"        "Singapore"            "Spain"               
## [25] "Sweden"               "Switzerland"          "Thailand"            
## [28] "Turkey"               "United Kingdom"       "USA"                 
## 
## [[2]]
## [1] "Chemicals"                                    
## [2] "Crude materials, inedible, except fuels"      
## [3] "Food and live animals"                        
## [4] "Machinery and transport equipment"            
## [5] "Manufact goods classified chiefly by material"
## [6] "Miscellaneous manufactured articles"          
## 
## [[3]]
##  [1] "1996" "1997" "1998" "1999" "2000" "2001" "2002" "2003" "2004" "2005"
  1. Calcule el aumento medio global \(\bar{y}\) a lo largo de los 10 años en bienes manufacturados. Para ello considere la matriz de adyacencia Y dada por:
Y <- apply(X = comtrade[,,c(5,6),], MARGIN = c(1,2), FUN = mean)
dim(Y)
## [1] 30 30
round(Y[1:5,1:5], 2)
##           Australia Austria Brazil Canada China
## Australia        NA    0.10   0.08   0.03  0.08
## Austria        0.08      NA   0.06   0.06  0.09
## Brazil        -0.06    0.03     NA   0.07  0.14
## Canada         0.00    0.05  -0.03     NA  0.10
## China          0.13    0.12   0.14   0.16    NA

(Respuesta: 0.03778362).

  1. Calcule la media de todas las observaciones de cada fila de Y, es decir, calcule la media fila \(\bar{y}_{i\bullet}=\frac{1}{n-1}\sum_{j:j\neq i} y_{i,j}\) para cada país. Realice una histograma de los promedios fila \(\bar{y}_{i\bullet}\). Los promedios fila caracterizan diferentes niveles de actividad de los nodos en términos de la sociabilidad. ¿Cómo se pueden interpretar los promedios fila \(\bar{y}_{i\bullet}\)?

  2. Calcule la media de todas las observaciones de cada columna de Y, es decir, calcule la media columna \(\bar{y}_{\bullet j}=\frac{1}{n-1}\sum_{i:i\neq j} y_{i,j}\) para cada país. Realice una histograma de los promedios columna \(\bar{y}_{\bullet j}\). Los promedios columna caracterizan diferentes niveles de actividad de los nodos en términos de la popularidad. ¿Cómo se pueden interpretar los promedio columna \(\bar{y}_{\bullet j}\)?

  3. Calcule tanto la media de los promedios fila \(\bar{y}_{i\bullet}\) como la media de los promedios columna \(\bar{y}_{\bullet j}\). (Respuesta: 0.03778362 y 0.03778362).

  4. Calcule tanto la DE de los promedios fila \(\bar{y}_{i\bullet}\) como la DE de los promedios columna \(\bar{y}_{\bullet j}\). ¿Qué se puede concluir acerca de la heterogeneidad local en este caso? (Respuesta: 0.03019967 y 0.04101555).

  5. Calcule el coeficiente de correlación entre los promedios fila \(\bar{y}_{i\bullet}\) y los promedios columna \(\bar{y}_{\bullet j}\). Realice un dispersograma de los promedios columna \(\bar{y}_{\bullet j}\) (eje \(y\)) frente a los promedios fila \(\bar{y}_{i\bullet}\) (eje \(x\)), junto con la recta \(y=x\) como punto de referencia. ¿Qué se puede concluir? (Respuesta: 0.7002526).

  1. Considere el conjunto de datos dado en conflict.RData recopilado por Mike Ward y Xun Cao del departamento de Ciencias Políticas de la Universidad de Washington, asociado con datos de conflictos entre países en los años 90. El archivo conflict.RData contiene una lista con tres arreglos, X, Y, y D. X tiene tres campos: population (población en millones), gdp (PIB en millones de dolares) polity (puntuación política, un índice de democracia). Y hace referencia a una matriz \(\mathbf{Y}=[y_{i,j}]\) en la que \(y_{i,j}\) representa el número de conflictos iniciados por el país \(i\) hacia el país \(j\). Finalmente, Des un arreglo de tres dimensiones dimensiones cuya tercera dimensión contiene indices entre cada par de países asociados con: comercio (dimensión 1), importaciones (dimensión 2), organizaciones intergubernamentales (dimensión 3), y distancia geográfica (dimensión 4).
  1. Hacer una visualización decorada de la red de conflictos teniendo en cuenta diferentes diseños.
  2. Calcule e interprete la media global. (Respuesta: 0.018. La plausibilidad de que cualquier par de países estuvieran en conflicto en algún momento es de aproximadamente 1%.)
  3. Obtenga y grafique la distribución del out-degree y del in-degree. Calcule e interprete la media y la desviación estándar de esta distribución. (Respuesta: 1.561538 y 3.589398; 1.561538 y 1.984451. Los países son más heterogéneos en términos de iniciar un conflicto que de ser el objetivo del mismo.)
  4. Calcule el coeficiente de correlación entre los valores del out-degree y el in-degree. Realice un dispersograma de los grados de entrada (eje \(y\)) frente a los grados de salida (eje \(x\)), junto con la recta \(y=x\) como punto de referencia. ¿Qué se puede concluir? (Respuesta: 0.6040145. Los países que iniciaron más conflictos tienden a ser el objetivo de más conflictos).
  5. Identifique los países mas activos. (Respuesta: USA, IRQ, JOR, TUR HAI son los países más activos. )