Introducción

Esta publicación presenta un análisis exploratorio sobre la relación entre la incorporación de elementos innovadores en la programación de eventos y el nivel de demanda de conciertos organizados por la Fundación Juan March. A partir de datos reales sobre solicitudes de asistencia, se examina si recursos como concepto, movimiento escénico,iluminación,estrategias narrativas,enfoque interdisciplinar,apoyo audiovisual,escenografía y vestuario,revalorización femenina, estructura y control de las expectativas inciden en el interés del público. El trabajo forma parte de una colaboración en el marco de las prácticas externas del Máster de Ciencia de Datos Aplicada a las Ciencias Sociales y aplica herramientas de análisis de datos en R para visibilizar patrones de participación en función del diseño artístico de las propuestas. En síntesis, una ejercitación que permite aplicar técnicas y recomendaciones de clases.

Carga y preparación de los datos

Se carga el dataset conciertos_innovación en formato csv para trabajarlo

Visualización inicial de los datos

conciertos %>%
  head(10) %>%
  kbl(caption = "Primeras filas del conjunto de datos") %>%
  kable_styling(full_width = FALSE)
Primeras filas del conjunto de datos
id Acto Acto Concepto Iluminación Movimiento escénico Estrategias narrativas Enfoque interdisciplinar Apoyo audiovisual Control de las expectativas Escenografía y vestuario Estructura Revalorización femenina Solicitadas VIP Taquilla (una hora antes) Taquilla (último minuto) Fecha
NA Álfheiður Erla Guðmundsdóttir y Kunal Lahiry 0 1 1 0 1 1 0 0 1 0 659 14 63 0 02/06/25 12:00
NA Álfheiður Erla Guðmundsdóttir y Kunal Lahiry 0 1 1 0 1 1 0 0 1 0 955 9 86 14 01/06/25 12:00
  Álfheiður Erla Guðmundsdóttir y Kunal Lahiry 0 0 1 0 1 0 0 0 0 0 659 14 82 13 2/6/2025 12:00
  Álfheiður Erla Guðmundsdóttir y Kunal Lahiry 0 0 1 0 1 0 0 0 0 0 955 9 74 20 1/6/2025 12:00
  Escuchar el color (III): La abstracción del color 0 1 0 0 1 1 0 0 0 0 839 47 82 13 21/5/2025 18:30
  Escuchar el color (II): Entre tinieblas 0 1 1 0 0 1 0 0 0 0 954 42 74 20 14/5/2025 18:30
  Escuchar el color (I): Tonalidades de la emoción 0 1 0 1 0 1 0 0 0 0 1551 43 87 15 7/5/2025 18:30
105796 Cantos y cuentos de Latinoamérica (III): Cantos a la mujer 0 0 0 1 1 0 0 0 0 0 1203 15 72 23 5/4/2025 12:00
105795 Cantos y cuentos de Latinoamérica (II): Cantos a la tierra 0 0 0 1 1 0 0 0 0 0 1196 16 69 13 29/3/2025 12:00
105794 Cantos y cuentos de Latinoamérica (I): Cantos a la vida y la … 0 0 0 1 1 0 0 0 0 0 1751 32 78 20 22/3/2025 12:00

Análisis de datos faltantes

# Ver resumen de valores faltantes
miss_var_summary(conciertos)
variable n_miss pct_miss
id Acto 3 4.05
Acto 1 1.35
Fecha 1 1.35
Concepto 0 0
Iluminación 0 0
Movimiento escénico 0 0
Estrategias narrativas 0 0
Enfoque interdisciplinar 0 0
Apoyo audiovisual 0 0
Control de las expectativas 0 0
Escenografía y vestuario 0 0
Estructura 0 0
Revalorización femenina 0 0
Solicitadas 0 0
VIP 0 0
Taquilla (una hora antes) 0 0
Taquilla (último minuto) 0 0
vis_miss(conciertos) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(title = "Visualización de valores faltantes")

La visualización confirma que el conjunto de datos presenta una muy baja proporción de valores faltantes (0.4%). Las únicas variables afectadas son id Acto, Acto y Fecha, mientras que las variables fundamentales para el análisis de demanda e innovación están completas. Por lo tanto, no se consideró necesaria una imputación ni una depuración adicional. Por ejemplo, en clases trabajamos con mecanismos MCAR, MAR y NMAR y técnicas como imputación por media (con mice) o análisis por eliminación. En este caso, la escasa cantidad de NA y su localización en variables no relevantes para este análisis hacen innecesaria su aplicación.

Análisis: en busca de asociaciones

Aunque el conjunto de datos no presenta una cantidad significativa de valores faltantes, podemos explorar una estrategia adicional para estudiar la relación entre las innovaciones y la demanda. Para ello, construir una tabla de contingencia que cruce la presencia o ausencia de cada innovación con si un concierto tuvo una alta demanda.

Asociación entre cada innovación y su demanda

A continuación, se analiza a cada innovación individual sociada con un mayor nivel de demanda.

# Variables de innovación
innovaciones <- c("Movimiento escénico", "Iluminación", "Estrategias narrativas",
                  "Enfoque interdisciplinar", "Apoyo audiovisual",
                  "Control de las expectativas", "Escenografía y vestuario",
                  "Estructura", "Revalorización femenina", "Concepto")

# Crear variable binaria de demanda
conciertos <- conciertos %>%
  mutate(demanda = ifelse(Solicitadas + VIP + `Taquilla (una hora antes)` + `Taquilla (último minuto)` > 50, "Sí", "No"))

# Crear tabla de resumen de proporciones
resumen_demanda <- tibble(
  Innovación = innovaciones,
  Proporción = sapply(innovaciones, function(var) {
    mean(conciertos[conciertos$demanda == "Sí", var] > 0)
  })
)

# Mostrar tabla
kable(resumen_demanda, caption = "Proporción de conciertos con cada innovación, entre los de alta demanda") %>%
  kable_styling(full_width = FALSE)
Proporción de conciertos con cada innovación, entre los de alta demanda
Innovación Proporción
Movimiento escénico 0.1756757
Iluminación 0.4459459
Estrategias narrativas 0.5270270
Enfoque interdisciplinar 0.6891892
Apoyo audiovisual 0.3918919
Control de las expectativas 0.1621622
Escenografía y vestuario 0.0810811
Estructura 0.0675676
Revalorización femenina 0.0945946
Concepto 0.1351351

¿Qué proporción de conciertos con demanda incorporan cada innovación?

# Crear gráfico de barras con la proporción de conciertos con cada innovación entre los de alta demanda
ggplot(resumen_demanda, aes(x = reorder(Innovación, Proporción), y = Proporción)) +
  geom_col(fill = "#4682B4") +
  coord_flip() +
  labs(title = "Proporción de conciertos con cada innovación y demanda",
       x = "Innovación",
       y = "Proporción") +
  theme_minimal()

El gráfico muestra la proporción de conciertos con demanda (más de 50 asistentes) que incorporaron cada tipo de innovación. Se observa que las innovaciones con mayor presencia entre los conciertos más demandados son el enfoque interdisciplinar (69%), las estrategias narrativas (53%) y la iluminación (45%). En cambio, recursos como la escenografía y vestuario (8%), la estructura (7%) y la revalorización femenina (9%) aparecen con baja frecuencia en eventos de alta demanda. Esto nos puede estar diciendo que no todas las innovaciones se asocian del mismo modo con el interés del público y que algunas podrían tener un mayor impacto potencial en la convocatoria, por ejemplo, o al menos en el marco de esta programación.

Distribución de la demanda total en función de cada innovación (boxplot comparativo)

# Variable demanda total
conciertos <- conciertos %>%
  mutate(demanda_total = Solicitadas + VIP + `Taquilla (una hora antes)` + `Taquilla (último minuto)`)

# Ajustar para luego graficar
conciertos_long <- conciertos %>%
  pivot_longer(cols = c("Movimiento escénico", "Iluminación", "Estrategias narrativas",
                        "Enfoque interdisciplinar", "Apoyo audiovisual",
                        "Control de las expectativas", "Escenografía y vestuario",
                        "Estructura", "Revalorización femenina", "Concepto"),
               names_to = "Innovación", values_to = "Presente") %>%
  mutate(Presente = ifelse(Presente > 0, "Sí", "No"))

¿Cuál fue la distribución de la demanda total según la presencia de cada innovación?

# boxplot para ver las innovaciones
ggplot(conciertos_long, aes(x = reorder(Innovación, demanda_total, median), y = demanda_total, fill = Presente)) +
  geom_boxplot() +
  coord_flip() +
  labs(
    title = "Demanda total según presencia de cada innovación",
    x = "Innovación",
    y = "Demanda total",
    fill = "¿Presente?"
  ) +
  theme_minimal()

El gráfico de boxplot nos permite observar cómo se distribuye la demanda total según la presencia o ausencia de cada innovación. En general, las diferencias no parecen muy marcadas, aunque algunas innovaciones como la revalorización femenina y el enfoque interdisciplinar muestran una leve tendencia a concentrar mayores niveles de demanda. Sin embargo, estas diferencias son descriptivas y no implican que la innovación sea la causa de la mayor convocatoria. Esto sirve para reforzar la idea de que no todas las innovaciones se comportan igual frente al interés del público, ya que algunas podrían estar asociadas a perfiles de eventos con más asistencia o dependen de la programación.

Comentarios finales

A lo largo del análisis, se exploró la relación entre distintas innovaciones incorporadas en los conciertos y el nivel de demanda alcanzado en la Fundación Juan March. Para ello, se realizaron gráficos que permitieron visualizar mejor las indagaciones. En primer lugar, el gráfico de barras generado mostró qué innovaciones estuvieron más presentes entre los conciertos más demandados, destacándose el enfoque interdisciplinar, las estrategias narrativas y la iluminación. Sin embargo, el análisis complementario mediante boxplots permitió matizar esa lectura: se observó que ciertas innovaciones poco frecuentes, como la revalorización femenina o la escenografía y vestuario, cuando estuvieron presentes, se asociaron con niveles elevados de demanda. Esto sugiere que, si bien no fueron las más utilizadas, podrían tener un impacto positivo en la convocatoria y constituir un recurso valioso para futuras programaciones.

Finalmente, los resultados indican que no todas las innovaciones se asocian del mismo modo con la demanda y que una mirada exploratoria sobre su efecto puede ayudar a identificar estrategias con potencial aún no plenamente aprovechado.