El grado de un nodo en una red tanto dirigida como no dirigida se puede calcular fácilmente a partir de la matriz de adyacencia \(\mathbf{Y}=[y_{i,j}]\). El out-degree \(d_i^{\text{out}}\) y el in-degree \(d_i^{\text{in}}\) del nodo \(i\) se pueden calcular respectivamente como: \[ d_i^{\text{out}} = \sum_{j:j\neq i} y_{i,j} \qquad\text{y}\qquad d_i^{\text{in}} = \sum_{j:j\neq i} y_{j,i} \] Muestre que si la red es no dirigida entonces \(d_i^{\text{out}} = d_i^{\text{in}}\).
Tanto para redes dirigidas como no dirigidas, se define la media global de las interacciones como \[ \bar{y}=\frac{1}{n(n-1)}\sum_{i,j:i\neq j} y_{i,j} \] donde \(\mathbf{Y}=[y_{i,j}]\) es la matriz de adyacencia de la red correspondiente. Tal estadístico corresponde a una descripción muy rudimentaria acerca de la plausibilidad de observar una relación entre dos nodos cualesquiera, dado que no tiene en cuenta la heterogeneidad nodal (algunos nodos son más propensos a enviar/recibir más relaciones).
1. Muestre que para relaciones no dirigidas la media global \(\bar{y}\) es igual a la media tanto de la parte triangular superior de \(\mathbf{Y}\) como de la parte triangular inferior de \(\mathbf{Y}\).
2. Muestre que tanto para relaciones dirigidas como no dirigidas la media global corresponde a la densidad de la red.
3. Muestre que tanto para relaciones dirigidas como no dirigidas se tiene que \((n-1)\bar{y} = \bar{d}^{\text{out}}=\bar{d}^{\text{in}}\). Es decir, el grado promedio tanto de entrada como de salida son iguales y a su vez equivalentes la densidad.
Considere un grafo estrella de orden \(n\) y un grafo círculo de orden \(n\). A continuación se representan ambos grafos para \(n=9\). Estos grafos tienen aproximadamente la misma densidad, pero su estructura es muy diferente.
1. Muestre que para el grafo círculo de orden \(n\) el grado promedio es \(\bar{d} = 2\).
2. Muestre que para el grafo estrella de orden \(n\) el grado promedio es \(\bar{d} = 2\frac{n-1}{n} \rightarrow 2\) cuando \(n\rightarrow\infty\).

¿Cuáles de las siguientes secuencias son caminatas en el grafo que se presenta a continuación? ¿Cuáles senderos? ¿Cuáles circuitos? ¿Cuáles ciclos?
1. \(2 - 1 - 6 - 3 - 4\).
2. \(2 - 1 - 6 - 3 - 4 - 1 - 5\).
3. \(2 - 1 - 2 - 5 - 1 - 4\).

Considere el conjunto de datos dado en comtrade.RData (este archivo contiene una arreglo de tres dimensiones denominado comtrade), asociado con el crecimiento anual del comercio (diferencia en dólares en escala logarítmica respecto al año 2000). Este conjunto de datos involucra 30 países, 10 años desde 1996 hasta 2005, y 6 clases de productos diferentes, como se muestra a continuación:

load("comtrade.RData")
dimnames(comtrade)[c(1,3,4)]

## [[1]]
##  [1] "Australia"            "Austria"              "Brazil"              
##  [4] "Canada"               "China"                "China, Hong Kong SAR"
##  [7] "Czech Rep."           "Denmark"              "Finland"             
## [10] "France"               "Germany"              "Greece"              
## [13] "Indonesia"            "Ireland"              "Italy"               
## [16] "Japan"                "Malaysia"             "Mexico"              
## [19] "Netherlands"          "New Zealand"          "Norway"              
## [22] "Rep. of Korea"        "Singapore"            "Spain"               
## [25] "Sweden"               "Switzerland"          "Thailand"            
## [28] "Turkey"               "United Kingdom"       "USA"                 
## 
## [[2]]
## [1] "Chemicals"                                    
## [2] "Crude materials, inedible, except fuels"      
## [3] "Food and live animals"                        
## [4] "Machinery and transport equipment"            
## [5] "Manufact goods classified chiefly by material"
## [6] "Miscellaneous manufactured articles"          
## 
## [[3]]
##  [1] "1996" "1997" "1998" "1999" "2000" "2001" "2002" "2003" "2004" "2005"

Calcule el aumento medio global \(\bar{y}\) a lo largo de los 10 años en bienes manufacturados. Para ello considere la matriz de adyacencia Y dada por:

Y <- apply(X = comtrade[,,c(5,6),], MARGIN = c(1,2), FUN = mean)

Calcule la media de todas las observaciones de cada fila de Y, es decir, calcule la media fila \(\bar{y}_{i\bullet}=\frac{1}{n-1}\sum_{j:j\neq i} y_{i,j}\) para cada país. Realice una histograma de los promedios fila \(\bar{y}_{i\bullet}\). Los promedios fila caracterizan diferentes niveles de actividad de los nodos en términos de la sociabilidad. ¿Cómo se pueden interpretar los promedios fila \(\bar{y}_{i\bullet}\)?
Calcule la media de todas las observaciones de cada columna de Y, es decir, calcule la media columna \(\bar{y}_{\bullet j}=\frac{1}{n-1}\sum_{i:i\neq j} y_{i,j}\) para cada país. Realice una histograma de los promedios columna \(\bar{y}_{\bullet j}\). Los promedios columna caracterizan diferentes niveles de actividad de los nodos en términos de la popularidad. ¿Cómo se pueden interpretar los promedio columna \(\bar{y}_{\bullet j}\)?
Calcule tanto la media de los promedios fila \(\bar{y}_{i\bullet}\) como la media de los promedios columna \(\bar{y}_{\bullet j}\).¿Qué se puede concluir acerca de la tendencia local en este caso?
Calcule tanto la DE de los promedios fila \(\bar{y}_{i\bullet}\) como la DE de los promedios columna \(\bar{y}_{\bullet j}\). ¿Qué se puede concluir acerca de la heterogeneidad local en este caso?
Calcule el coeficiente de correlación entre los promedios fila \(\bar{y}_{i\bullet}\) y los promedios columna \(\bar{y}_{\bullet j}\). Realice un dispersograma de los promedios columna \(\bar{y}_{\bullet j}\) (eje \(y\)) frente a los promedios fila \(\bar{y}_{i\bullet}\) (eje \(x\)), junto con la recta \(y=x\) como punto de referencia. ¿Qué se puede concluir?

Considere el conjunto de datos dado en conflict.RData recopilado por Mike Ward y Xun Cao del departamento de Ciencias Políticas de la Universidad de Washington, asociado con datos de conflictos entre países en los años 90. El archivo conflict.RData contiene una lista con tres arreglos, X, Y, y D. X tiene tres campos: population (población en millones), gdp (PIB en millones de dolares) polity (puntuación política, un índice de democracia). Y hace referencia a una matriz \(\mathbf{Y}=[y_{i,j}]\) en la que \(y_{i,j}\) representa el número de conflictos iniciados por el país \(i\) hacia el país \(j\). Finalmente, Des un arreglo de tres dimensiones dimensiones cuya tercera dimensión contiene indices entre cada par de países asociados con: comercio (dimensión 1), importaciones (dimensión 2), organizaciones intergubernamentales (dimensión 3), y distancia geográfica (dimensión 4).
1. Hacer una visualización decorada de la red de conflictos teniendo en cuenta diferentes diseños.
2. Calcule e interprete la media global.
3. Obtenga y grafique la distribución del out-degree y del in-degree. Calcule e interprete la media y la desviación estándar de esta distribución.
4. Calcule el coeficiente de correlación entre los valores del out-degree y el in-degree. Realice un dispersograma de los grados de entrada (eje \(y\)) frente a los grados de salida (eje \(x\)), junto con la recta \(y=x\) como punto de referencia. ¿Qué se puede concluir?
5. Identifique los países mas activos.
Para todos los vértices de los cuatro grafos que se presentan a continuación, calcular el grado y las medidas de centralidad. Para cada grafo completar e interpretar la siguiente tabla. Interpretar los resultados.

Medida	Grado	Cercanía	Intermediación	Propia
Media
DE

Considere los datos relacionales acerca de los conflictos internacionales del archivo conflict.RData despúes de simetrizarla débilmente y remover los nodos aislados:
1. Hacer una visualización decorada de la red.
2. Caracterizar local y estructuralmente la red, en términos de la distancia, la centralidad, la cohesión, la conectivaidad, y el agrupamento. Utilizar todas las métricas disponbles.
3. Interpretar los resultados.
Sintetizar y replicar los Capítulos 6, 8, y 9 de Luke, D. A. (2015).

Referencias

Luke, D. A. (2015). A user’s guide to network analysis in R. New York: Springer. https://link.springer.com/book/10.1007/978-3-319-23883-8

Taller 2

Juan Sosa PhD

Webpage https://sites.google.com/view/juansosa/

YouTube https://www.youtube.com/c/JuanSosa1702

GitHub https://github.com/jstats1702

Rpubs https://rpubs.com/jstats1702

Referencias