1. Percepción de estructuras sociales

El trabajo de David Krackhardt en la década de 1980 fue pionero en la identificación de individuos con habilidades para percibir la estructura social en la que están inmersos. Para ello, recopiló datos relacionales sobre la estructura social cognitiva (Cognitive Social Structure, CSS, por sus siglas en inglés) de 21 miembros del personal administrativo de una empresa de fabricación de maquinaria de alta tecnología, Silicon Systems. El objetivo era evaluar los efectos de un programa reciente de intervención administrativa. Una de las relaciones estudiadas fue la amistad, donde cada persona no solo reportó sus relaciones de amistad, sino también las relaciones percibidas entre todos los demás empleados. Esto permitió construir una matriz de adyacencia de tamaño \(21 \times 21\) que reflejaba las percepciones de cada individuo dentro del grupo. Este enfoque ha sido utilizado con éxito en estudios posteriores mediante modelos triádicos (e.g., Sosa y Rodríguez 2021).

Para replicar los hallazgos de Krackhardt, así como de otros autores que han estudiado las estructuras sociales cognitivas (CSSs), considere el conjunto de datos CSS2022.txt. Este archivo contiene las percepciones de amistad de los estudiantes de un curso ofrecido por el Departamento de Estadística de la Universidad Nacional de Colombia durante el segundo semestre de 2022.

El archivo incluye una CSS completa de dimensión 15, conformada por quince matrices de adyacencia de tamaño \(15 \times 15\). Cada matriz \(\mathbf{A}^{(j)}\) representa la percepción del estudiante \(j\) sobre las relaciones de amistad en el sistema social del curso, con \(j=1, \ldots, 15\). Además, el archivo covs.txt proporciona información adicional sobre cada estudiante: sexo (0 = Mujer, 1 = Hombre), edad (edad en años cumplidos) y texttt{programa (0 = Pregrado, 1 = Posgrado).

La red de consenso de una CSS se define como la red cuya matriz de adyacencia, denotada por \(\mathbf{A} = [a_{i,j}]\), se construye aplicando la siguiente regla:
\[ a_{i,j} = \begin{cases} 1, & \text{si } \frac{1}{I} \sum_{k=1}^I a_{i,j,k} > 0.25, \\ 0, & \text{en otro caso}, \end{cases} \] donde \(I\) es el número total de actores en el sistema, y \(a_{i,j,k}\) es la percepción del actor \(k\) sobre la relación entre los actores \(i\) y \(j\).

Este enfoque permite sintetizar las percepciones individuales en una única red que refleja el consenso del sistema social en cuestión.

  1. Realice visualizaciones no decoradas en un diseño circular para representar todas las percepciones individuales y la red de consenso. Compare las diferencias entre las percepciones individuales y entre estas y la red de consenso, identificando posibles discrepancias o patrones consistentes. Use tantas tablas y gráficos como sean necesarios para apoyar el análisis. Interprete los resultados obtenidos, evaluando la coherencia entre las percepciones y la capacidad del consenso para capturar el panorama general del sistema social, limitando el análisis a un máximo de 1000 palabras.

  2. Realice un análisis descriptivo detallado de la red de consenso, destacando sus propiedades estructurales y métricas clave como densidad, transitividad, distribución de grados, entre otras. Utilice tablas y gráficos según sea necesario para presentar la información de manera clara y organizada. Interprete los resultados obtenidos, destacando los patrones relevantes y su implicación en el contexto del estudio, limitando el análisis a un máximo de 1000 palabras.

  3. Calcule el grado normalizado para cada actor en todas las percepciones individuales y en la red de consenso. Construya diagramas de caja para cada actor, mostrando la distribución de su grado a través de las percepciones y el consenso. Distinga el grado basado en la percepción propia de cada actor con un triángulo rojo (\(\triangle\)) y el grado basado en la red de consenso con una cruz azul (\(\times\)). Incluya todos los diagramas de caja en un único gráfico. Un ejemplo de este tipo de gráfico puede encontrarse en este enlace, página 9. Analice si los actores tienen una percepción adecuada de su rol dentro del sistema social y limite la interpretación de los resultados a un máximo de 1000 palabras.

  4. Ajuste un modelo de grafos aleatorio exponencial a la red de consenso, utilizando como términos en el predictor lineal el número de aristas y las covariables con efectos homofílicos. Realice una interpretación detallada de los resultados obtenidos, identificando el impacto de las covariables en la estructura de la red y discutiendo la adecuación del modelo en este contexto. Limite la interpretación a un máximo de 1000 palabras.

  5. Considere los siguientes modelos para ajustarlos a la red de consenso:

    1. \(\textsf{M}_1\): Modelo de grafos aleatorios.
    2. \(\textsf{M}_2\): Modelo de grafos aleatorios generalizado.
    3. \(\textsf{M}_3\): Modelo de grafos aleatorio exponencial con número de aristas y triángulos.
    4. \(\textsf{M}_4\): Modelo de bloques estocásticos.
    5. \(\textsf{M}_5\): Modelo latente de distancia clásico con dos dimensiones latentes.

Ajuste cada uno de estos modelos y utilice tablas y visualizaciones según sea necesario para mostrar los resultados. Interprete detalladamente los hallazgos de cada modelo, sin límite de palabras para esta sección, destacando las fortalezas y limitaciones de cada enfoque.

  1. Evalúe la bondad de ajuste de los modelos ajustados en el numeral anterior utilizando como estadísticos de prueba la densidad, la transitividad, la asortatividad y la distancia geodésica promedio. Presente los resultados en tablas y gráficos, interpretando detalladamente los hallazgos, identificando qué modelos capturan mejor las propiedades observadas en la red de consenso y limitando el análisis a un máximo de 1000 palabras.

  2. Compruebe la capacidad predictiva de los modelos ajustados en el numeral anterior mediante validación cruzada con cinco (5 folds). Evalúe el rendimiento predictivo de cada modelo, utilizando tablas y gráficos para resumir los resultados. Interprete los hallazgos, destacando cuál modelo proporciona las mejores predicciones y por qué, limitando la interpretación a un máximo de 1000 palabras.

  1. Exposición

Cada estudiante deberá sintetizar y reproducir el capítulo asignado con el propósito de realizar una exposición de 2 horas de duración. La exposición debe destacar e ilustrar las partes más relevantes del capítulo asignado.

Además, se debe elaborar un documento en RMarkdown o Quarto que incluya tanto la teoría como la reproducción de los ejemplos presentados en el capítulo. Este documento deberá estar bien estructurado y diseñado para complementar la exposición oral.

Capítulos y asignaciones

Criterios de evaluación

La evaluación considerará los siguientes aspectos:

  1. Presentación oral: Claridad, organización y dominio del contenido.
  2. Material de exposición: Calidad, pertinencia y diseño de los recursos utilizados en la presentación.
  3. Respuesta a preguntas: Capacidad de responder a preguntas de manera clara y fundamentada.
  4. Asistencia: Participación activa y asistencia a las exposiciones de otros estudiantes.

Se espera un enfoque profesional en la exposición, así como en la elaboración del documento complementario, con énfasis en la precisión teórica y la claridad en la presentación de los resultados.

Referencias

Kolaczyk, E. D., & Csárdi, G. (2020). Statistical analysis of network data with R (Vol. 65). New York: Springer.

Luke, D. A. (2015). A user’s guide to network analysis in R (Vol. 72, No. 10.1007, pp. 978-3). Cham: Springer.

Sosa, J., & Rodríguez, A. (2021). A latent space model for cognitive social structures data. Social Networks, 65, 85-97.