Este documento es la versión en español (y resumida) de un proyecto de análisis de datos con el lenguaje de programación R. El original en inglés está disponible en este hipervínculo; que a su vez se extiende en detalle sobre el código y otras herramientas empleadas. En esta versión se va a enfocar en los resultados del análisis.
Es importante destacar que el propósito de este informe no es tanto el análisis o los resultados en si, sino como práctica sobre las habilidades en el empleo de la herramienta informática, en base a cursos en linea que estuve tomando los últimos meses. Por ello, el interés sustantivo o teórico del proyecto es mínimo y el uso de conceptos es básico, liberal y en muchos casos discutible, siendo más decisiones de compromiso en base a los datos disponibles.
El proyecto consiste en analizar bases de datos de la IMDB (siglas en inglés para “base de datos de películas en Internet”), a las que se puede acceder desde este hipervínculo público; el foco está puesto en películas de origen argentino.
Como la IMDB carece de información para identificar el orígen de cada película, se toma la nacionalidad del director de la filmación como indicador de la nacionalidad. Esta es una de las “decisiones de compromiso” que se comentaron más arriba, porque no es exacto que toda película dirigida por alguien de nacionalidad argentina, sea, en efecto una película argentina. Por ejemplo, una producción nacional podría contar con un director extranjero, o viceversa; además, la industria del cine cuenta con producciones internacionales, en que productoras de distintos países se asocian para realizar una misma película.
A su vez, para identificar a los directores/as de origen argentino se accedió a información de distintas entradas de la Wikipedia sobre directores argentinos. Cabe aclarar que en la página vinculada se encuentra información sólo sobre directores masculinos, existiendo además otras páginas de categorías sobre directoras y de directores/as del siglo XXI. Por medio de un método denominado “rasgar la web”, se obtienen los nombres listados en dichas páginas y luego se las asocia con las bases de la IMDB.
Similarmente, se empleó este método para obtener información sobre los premios y nominaciones de cada película, como un indicador próximo a una medida del éxito. Esta información no está disponible en los archivos de datos descargados desde la IMDB, pero sí en las páginas de detalles de cada película, por lo que fue necesario “rasgar” cada una de estas e insertar el dato del número de premios y/o nominaciones obtenidas en las tablas. Por otro lado, es importante destacar que los números de premios y nominaciones no distinguen categoría, por lo que un premio de “mejor película”, suma tanto como uno para “mejor vestuario”.
Luego de un procesamiento y unión de las bases de datos, se procede a contestar algunas preguntas mediante información gráfica que se presenta a continuación. Dado el tiempo que me tomó llegar a este punto y que mi interés está en continuar aprendiendo otras tecnologías, concluyo hasta aquí, con la esperanza de continuar y expandir el informe en algún futuro.
Para contestar esta pregunta, sencillamente se suma la cantidad de premios y nominaciones entre los más de 500 nombres de directores y directoras de Argentina que componen la base y se los ordena en un gráfico de barras. Claramente, el más premiado fue Juan José Campanella.
Esta pregunta apunta más a conocer la tendencia de premios en Argentina y tratar de identificar en qué año se obtuvieron más premios. Para graficar esto, se cuentan la cantidad de premios obtenidos por películas argentinas año por año. Como el gráfico sería muy compacto para incluir más de un siglo de cine, se procede a agruparlos en lustros.
De acuerdo al gráfico, se observa que la obtención de premios fue casi nula hasta alrededor de la década de 1940 y que desde entonces hasta 1980 fue modesta en comparación con el gran crecimiento de premios hacia los albores del siglo XXI.
Observemos ahora en más detalle los segmentos 1940-1980 y 1980 al presente:
En el primer segmento, el mejor año fue 1959.
En el segmento 1980-2018, los mejores años fueron 2002 y en segundo lugar 2009.
Veamos ahora las películas más galardonadas en estos años:
## originalTitle releaseYear nominations awards
## 1 El secreto de sus ojos 2009 40 52
## 2 Historias minimas 2002 8 25
## 3 Tan de repente 2002 7 20
## 4 Gigante 2009 6 16
## 5 Valentin 2002 9 14
## 6 Lugares comunes 2002 13 13
## 7 El ultimo verano de la Boyita 2009 10 9
## 8 El bonaerense 2002 11 8
## 9 Caja negra 2002 6 8
## 10 El juego de la silla 2002 2 8
## 11 Salto a la gloria 1959 0 6
## 12 Kamchatka 2002 6 6
## 13 La caida 1959 1 5
## 14 Tres hombres del rio 1947 0 5
## 15 ¿Donde vas, Alfonso XII? 1959 0 4
Mirando los gráficos anteriores surge la siguiente pregunta, ¿son estos años “exitosos” y las tendencias observadas propias de la calidad particular del cine argentino, o, por el contrario, son sólo el reflejo de una mayor actividad de eventos y galardones de cine?
En el curso de la obtención de los datos sobre premios, no se distinguió si los mismos son premios internacionales o nacionales y regionales. Suponemos que una película muy exitosa obtendría muchos premios en distintos eventos internacionales y que además probablemente sea reconocida en su país de origen (exceptuando películas políticamente controversiales que inclinarían la balanza hacia dentro o hacia fuera).
Por ello, se comparará con la tendencia internacional. Para ello, de la misma base de la IMDB, se obtiene una muestra del 20% de películas para cada década, sin distinción alguna sobre nacionalidad. Esta muestra debería ser representativa del cine internacional, aunque es probable que los países con mayor producción cinematográfica estén sobre-representados.
Observamos en el gráfico que la tendencia es similar a la observada en el cine argentino: Desde mediados del siglo XX se incrementa poco a poco la actividad de galardones del cine, se acelera desde 1980 y para la primera década del siglo XXI hay una explosión de premios. Obsérvese la escala de premios: hasta 1980 nunca hubo más de mil premios por cada lustro de la muestra obtenida; pero hacia principios del siglo XXI llega a los 4000.
Ahora bien, ¿cómo comparamos una muestra a nivel mundial compuesta por más de 125 mil películas con los poco más de 6700 títulos del cine argentino? Intentamos hacer esta comparación con promedios entre los totales de premios para cada año.
Observando los promedios, notamos que se acentúa gráficamente la tendencia de mediados del siglo XX y se atenúa el período entre siglos, pero manteniendo los rasgos generales de la forma. Comparemos ahora los promedios del cine argentino:
La escala del gráfico se multiplica y el incremento de finales del siglo XX a nivel mundial resulta marginal al compararlo con el promedio de premios obtenidos por el cine argentino en el mismo período. De todas formas, antes de esa discrepancia, las tendencias a mitad del siglo se resultan bastante semejantes.
Estas observaciones parecen indicar que, o bien el cine argentino experimentó una especie de “edad de oro” en los años de cambio del siglo, o bien que lo que hubo fue una multiplicación de los galardones cinematográficos a nivel nacional o regional. En general, el cine argentino acompaña o refleja la tendencia internacional, pero acentúa la tendencia en dicho período.