Proyecto AGRUPA

Una base de datos para estudiar estereotipos en pintura

Corpus pictórico del Museo del Prado enriquecido con metadatos curatoriales, etiquetas iconográficas, descripciones generadas por modelos, SADCAT y representaciones visuales.

Bloque 1

Definir el corpus de análisis

La decisión metodológica clave es trabajar únicamente con tipo_objeto = “Pintura”, porque es el universo visual realmente comparable para el proyecto.

Universo de análisis

El corpus operativo se reduce a 6.723 pinturas; esta decisión evita mezclar objetos visualmente no comparables.

Arquitectura de capas

AGRUPA funciona como una infraestructura relacional: una pintura conecta metadatos, texto, SADCAT, iconografía, figuras y embeddings.

Cobertura de capas: conteos

La cobertura absoluta muestra que las capas críticas están disponibles para buena parte del corpus pictórico.

Disponibilidad por siglo

La cobertura por siglo es bastante homogénea en las capas principales, con excepciones localizadas en registros sin siglo codificado.

Bloque 2

Composición del corpus pictórico

Antes de interpretar modelos o estereotipos, necesitamos saber qué tipo de colección estamos analizando.

Distribución por siglo

El corpus está dominado por pintura de los siglos XVII y XIX, algo que conviene controlar en análisis temporales.

Religión y fauna

Religiosas vs seculares.

Presencia de fauna.

La mayoría de pinturas son seculares y no contienen fauna explícita; los análisis de animales deben leerse como submuestras específicas.

Bloque 3

Iconografía: de etiquetas a estructura semántica

Las etiquetas permiten pasar de un archivo de obras a un corpus navegable por contenido representado.

Densidad de etiquetas

La mayoría de pinturas tienen pocas etiquetas, lo que facilita la navegación pero también limita algunas combinaciones iconográficas.

Etiquetas más frecuentes

La taxonomía está dominada por personas, santos y fauna, tres ejes muy relevantes para análisis psicológicos.

Coocurrencia iconográfica

Las coocurrencias son en general bajas; algunas asociaciones fuertes reflejan combinaciones iconográficas esperables.

Bloque 4

Descripciones: museo, LLaVA y Qwen

Las fuentes textuales no son equivalentes: cada una produce una unidad de análisis y una distribución lingüística diferente.

Longitud textual: museo y LLaVA

Descripción del museo.

Descripción LLaVA.

El museo presenta una cola larga; LLaVA genera textos más regulares, probablemente por el formato del modelo.

Longitud textual: Qwen y comparación

Caption global Qwen.

Comparación entre fuentes.

Qwen muestra una distribución más heterogénea, compatible con diferentes niveles de detalle descriptivo.

Figuras detectadas por Qwen

Desde caption global.

El bloque con cinco o más figuras justifica analizar tanto la obra completa como la figura individual.

Bloque 5

Acuerdo.

Diferencias.

En calidez, LLaVA no replica linealmente al museo: hay una nube amplia y diferencias relevantes.

Acuerdo Museo–LLaVA: competencia

Acuerdo.

Diferencias.

La competencia también muestra diferencias centradas cerca de cero, pero con dispersión suficiente para no tratarlas como equivalentes.

Acuerdo LLaVA–Qwen figuras: calidez

Acuerdo.

Diferencias.

La relación entre LLaVA y Qwen figuras es más visible que con el museo, aunque todavía parcial.

Acuerdo LLaVA–Qwen figuras: competencia

Acuerdo.

Diferencias.

La convergencia es más clara en competencia, pero sigue lejos de una equivalencia perfecta.

Bloque 6

Resultados psicológicos descriptivos

Una vez fijada la fuente, podemos explorar patrones por religión, fauna, siglo, género y complejidad figurativa.

Calidez por religión y fauna

Calidez por religión.

Calidez por fauna.

Las obras religiosas muestran mayor calidez; la fauna produce diferencias más pequeñas.

Competencia por religión y fauna

Competencia por religión.

Competencia por fauna.

La competencia se mantiene alta y relativamente estable, lo que refuerza la idea de efecto techo.

Evolución por siglo

La competencia se mantiene alta a través de los siglos, mientras que la calidez cae con fuerza en los periodos más recientes.

Figuras: género y contexto

Género detectado.

Contexto.

Qwen detecta muchas más figuras masculinas que femeninas, y el contexto está suficientemente distribuido para analizar interacciones.

Figuras: género × contexto

La matriz confirma que el análisis por figura permite cruzar género detectado y contexto religioso/secular.

Figuras: calidez por género y contexto

Por género.

Por contexto.

Las figuras femeninas aparecen descritas con mayor calidez media; el contexto religioso también eleva la calidez.

Figuras: competencia por género y contexto

Por género.

Por contexto.

Las figuras masculinas tienden a recibir mayor competencia, aunque las diferencias no son enormes.

Interacción género × religión: calidez

El contexto religioso incrementa la calidez en todos los géneros detectados.

Interacción género × religión: competencia

La competencia no sigue un patrón paralelo: las figuras masculinas pierden algo de competencia en contexto religioso.

Complejidad figurativa: museo

Calidez.

Competencia.

El número de figuras se relaciona con los scores de forma no lineal; no parece un predictor simple.

Complejidad figurativa: LLaVA

Calidez.

Competencia.

La complejidad visual parece una variable candidata, pero su relación con SADCAT depende de la fuente textual.

Grupos sociales y animales en SCM

Los grupos sociales y animales quedan en la zona positiva del SCM LLaVA, con diferencias pequeñas pero interpretables.

Cierre

Qué aporta AGRUPA

La base permite pasar de un catálogo de imágenes a un sistema de hipótesis sobre representación visual, lenguaje y estereotipos.

Preguntas abiertas

SCM y métodos

¿La divergencia entre Museo, LLaVA y Qwen refleja diferencias reales de unidad de análisis?

¿El efecto techo en competencia limita la detección de patrones psicológicos?

Figuras, género y contexto

¿Las diferencias de género se mantienen al controlar siglo, autor y temática?

¿La religión modifica el perfil evaluativo o cambia el tipo de figuras representadas?

Animales y rol narrativo

¿La fauna importa por especie, por función narrativa o por el contexto humano que la acompaña?

¿Los animales aparecen como agentes, símbolos, posesiones o amenazas?

Señal visual

¿Los embeddings capturan estructura psicológica o principalmente estilo, época y composición?

¿Qué aporta la imagen que no esté ya presente en las descripciones?

AGRUPA conecta representación visual, lenguaje descriptivo y dimensiones psicológicas; no pretende cerrar esas preguntas con una única métrica.