AGRUPA
Base de datos pictórica para el análisis de estereotipos en arte
2026-06-05
Proyecto AGRUPA
Una base de datos para estudiar estereotipos en pintura
Corpus pictórico del Museo del Prado enriquecido con metadatos curatoriales, etiquetas iconográficas, descripciones generadas por modelos, SADCAT y representaciones visuales.
Bloque 1
Definir el corpus de análisis
La decisión metodológica clave es trabajar únicamente con tipo_objeto = “Pintura”, porque es el universo visual realmente comparable para el proyecto.
Universo de análisis
El corpus operativo se reduce a 6.723 pinturas; esta decisión evita mezclar objetos visualmente no comparables.
Arquitectura de capas
AGRUPA funciona como una infraestructura relacional: una pintura conecta metadatos, texto, SADCAT, iconografía, figuras y embeddings.
Cobertura de capas: conteos
La cobertura absoluta muestra que las capas críticas están disponibles para buena parte del corpus pictórico.
Disponibilidad por siglo
La cobertura por siglo es bastante homogénea en las capas principales, con excepciones localizadas en registros sin siglo codificado.
Bloque 2
Composición del corpus pictórico
Antes de interpretar modelos o estereotipos, necesitamos saber qué tipo de colección estamos analizando.
Distribución por siglo
El corpus está dominado por pintura de los siglos XVII y XIX, algo que conviene controlar en análisis temporales.
Religión y fauna
La mayoría de pinturas son seculares y no contienen fauna explícita; los análisis de animales deben leerse como submuestras específicas.
Bloque 3
Iconografía: de etiquetas a estructura semántica
Las etiquetas permiten pasar de un archivo de obras a un corpus navegable por contenido representado.
Densidad de etiquetas
La mayoría de pinturas tienen pocas etiquetas, lo que facilita la navegación pero también limita algunas combinaciones iconográficas.
Etiquetas más frecuentes
La taxonomía está dominada por personas, santos y fauna, tres ejes muy relevantes para análisis psicológicos.
Coocurrencia iconográfica
Las coocurrencias son en general bajas; algunas asociaciones fuertes reflejan combinaciones iconográficas esperables.
Bloque 4
Descripciones: museo, LLaVA y Qwen
Las fuentes textuales no son equivalentes: cada una produce una unidad de análisis y una distribución lingüística diferente.
Longitud textual: museo y LLaVA
El museo presenta una cola larga; LLaVA genera textos más regulares, probablemente por el formato del modelo.
Longitud textual: Qwen y comparación
Comparación entre fuentes.
Qwen muestra una distribución más heterogénea, compatible con diferentes niveles de detalle descriptivo.
Figuras detectadas por Qwen
El bloque con cinco o más figuras justifica analizar tanto la obra completa como la figura individual.
Bloque 5
SADCAT y dimensiones SCM
El núcleo psicológico de la BBDD está en la operacionalización lingüística de calidez y competencia.
Museo: distribuciones SADCAT
Las descripciones del museo muestran un efecto techo marcado, especialmente en competencia.
Museo: espacio SCM
El espacio SCM del museo concentra muchas pinturas en zonas positivas, lo que reduce la variabilidad disponible para modelado.
LLaVa: distribuciones SADCAT
LLaVA muestra una distribución normal para cordialidad, pero sigue teniendo un efecto techo en competencia.
LLaVA: espacio SCM
LLaVA mantiene la concentración positiva, pero su patrón no replica exactamente al museo.
Qwen figuras: distribuciones SADCAT
Qwen por figuras muestra el mejor resultado en cuanto a la distrubición de ambas dimensiones.
Qwen figuras: espacio SCM
Qwen por figura conserva algo más de dispersión, coherente con un cambio de unidad de análisis.
Ortogonalidad SCM
Correlación calidez–competencia.
Calidez y competencia son casi ortogonales en museo y LLaVA, pero menos en Qwen figuras.
Convergencia global entre métodos
La convergencia global es débil: las fuentes deben tratarse como operacionalizaciones distintas.
Convergencia por dimensión
LLaVA y Qwen comparten más señal en competencia que en calidez, pero no son equivalentes.
Acuerdo Museo–LLaVA: calidez
En calidez, LLaVA no replica linealmente al museo: hay una nube amplia y diferencias relevantes.
Acuerdo Museo–LLaVA: competencia
La competencia también muestra diferencias centradas cerca de cero, pero con dispersión suficiente para no tratarlas como equivalentes.
Acuerdo LLaVA–Qwen figuras: calidez
La relación entre LLaVA y Qwen figuras es más visible que con el museo, aunque todavía parcial.
Acuerdo LLaVA–Qwen figuras: competencia
La convergencia es más clara en competencia, pero sigue lejos de una equivalencia perfecta.
Bloque 6
Resultados psicológicos descriptivos
Una vez fijada la fuente, podemos explorar patrones por religión, fauna, siglo, género y complejidad figurativa.
Calidez por religión y fauna
Las obras religiosas muestran mayor calidez; la fauna produce diferencias más pequeñas.
Competencia por religión y fauna
Competencia por religión.
La competencia se mantiene alta y relativamente estable, lo que refuerza la idea de efecto techo.
Evolución por siglo
La competencia se mantiene alta a través de los siglos, mientras que la calidez cae con fuerza en los periodos más recientes.
Figuras: género y contexto
Qwen detecta muchas más figuras masculinas que femeninas, y el contexto está suficientemente distribuido para analizar interacciones.
Figuras: género × contexto
La matriz confirma que el análisis por figura permite cruzar género detectado y contexto religioso/secular.
Figuras: calidez por género y contexto
Las figuras femeninas aparecen descritas con mayor calidez media; el contexto religioso también eleva la calidez.
Figuras: competencia por género y contexto
Las figuras masculinas tienden a recibir mayor competencia, aunque las diferencias no son enormes.
Interacción género × religión: calidez
El contexto religioso incrementa la calidez en todos los géneros detectados.
Interacción género × religión: competencia
La competencia no sigue un patrón paralelo: las figuras masculinas pierden algo de competencia en contexto religioso.
Complejidad figurativa: museo
El número de figuras se relaciona con los scores de forma no lineal; no parece un predictor simple.
Complejidad figurativa: LLaVA
La complejidad visual parece una variable candidata, pero su relación con SADCAT depende de la fuente textual.
Grupos sociales y animales en SCM
Los grupos sociales y animales quedan en la zona positiva del SCM LLaVA, con diferencias pequeñas pero interpretables.
Cierre
Qué aporta AGRUPA
La base permite pasar de un catálogo de imágenes a un sistema de hipótesis sobre representación visual, lenguaje y estereotipos.
Preguntas abiertas
SCM y métodos
¿La divergencia entre Museo, LLaVA y Qwen refleja diferencias reales de unidad de análisis?
¿El efecto techo en competencia limita la detección de patrones psicológicos?
Animales y rol narrativo
¿La fauna importa por especie, por función narrativa o por el contexto humano que la acompaña?
¿Los animales aparecen como agentes, símbolos, posesiones o amenazas?
Señal visual
¿Los embeddings capturan estructura psicológica o principalmente estilo, época y composición?
¿Qué aporta la imagen que no esté ya presente en las descripciones?
AGRUPA conecta representación visual, lenguaje descriptivo y dimensiones psicológicas; no pretende cerrar esas preguntas con una única métrica.