Introducción

Durante las últimas dos décadas, las plataformas de streaming han transformado significativamente la industria del entretenimiento audiovisual. Entre ellas, Netflix se ha consolidado como una de las compañías más influyentes a nivel mundial, pasando de ser un servicio de alquiler de películas a convertirse en una plataforma global de distribución y producción de contenido digital.

El crecimiento acelerado de Netflix ha estado acompañado por una expansión constante de su catálogo, incorporando películas y series provenientes de diferentes países, géneros y públicos objetivo. Esta diversidad convierte su catálogo en una fuente de información valiosa para analizar tendencias de producción audiovisual, preferencias de mercado y estrategias de distribución de contenido.

La visualización de datos permite explorar grandes volúmenes de información de manera intuitiva, facilitando la identificación de patrones, tendencias y relaciones que podrían pasar desapercibidas mediante análisis tradicionales. En este contexto, el presente trabajo utiliza técnicas de análisis exploratorio y visualización de datos para examinar la composición y evolución del catálogo de Netflix disponible entre los años 2008 y 2021.

A partir de diferentes representaciones gráficas se estudiarán aspectos como la evolución temporal del catálogo, la distribución entre películas y series, los países con mayor participación, los géneros predominantes y las características del contenido ofrecido por la plataforma. El objetivo es comprender cómo ha evolucionado la estrategia de contenido de Netflix durante los últimos años y qué patrones pueden identificarse a partir de los datos disponibles.

Pregunta de investigación

¿Cómo ha evolucionado la estrategia de contenido de Netflix entre 2008 y 2021 en términos de crecimiento del catálogo, tipos de contenido, distribución geográfica y géneros predominantes?

Objetivo general

Analizar visualmente la evolución del catálogo de Netflix entre 2008 y 2021 mediante técnicas de visualización de datos que permitan identificar patrones temporales, geográficos y temáticos en la distribución del contenido disponible en la plataforma.

Descripción del conjunto de datos

Para el desarrollo de este proyecto se utilizó el conjunto de datos Netflix Movies and TV Shows, disponible en la plataforma Kaggle. Este conjunto recopila información sobre el contenido disponible en Netflix hasta el año 2021, incluyendo películas y series de televisión producidas en diferentes países y clasificadas según diversas características.

El conjunto de datos contiene 8.807 registros y 12 variables, donde cada observación corresponde a un título disponible dentro del catálogo de Netflix. Las variables incluidas permiten analizar aspectos relacionados con el tipo de contenido, año de lanzamiento, país de origen, clasificación por edades, duración, géneros y descripción del contenido.

Las variables disponibles son:

Durante el proceso de preparación de los datos se identificaron valores faltantes principalmente en las variables relacionadas con información de producción. En particular, la variable director presentó 2.634 registros faltantes, mientras que country y cast registraron 831 y 825 valores faltantes respectivamente. Las variables relacionadas con fechas y clasificación presentaron una proporción mínima de datos faltantes, por lo que no representan una limitación significativa para el análisis.

Adicionalmente, la variable date_added fue transformada a formato de fecha con el fin de extraer el año de incorporación del contenido a la plataforma. Esta transformación permitió estudiar la evolución temporal del catálogo de Netflix entre los años 2008 y 2021, período en el que se concentra la información disponible.

La riqueza y diversidad de variables presentes en este conjunto de datos permiten desarrollar diferentes tipos de visualizaciones para explorar patrones temporales, geográficos y temáticos, facilitando la comprensión de la estrategia de contenido implementada por Netflix durante los últimos años.

Estadísticas descriptivas

Antes de realizar el análisis visual detallado, es importante comprender las características generales del conjunto de datos. El catálogo analizado está compuesto por 8.807 títulos, distribuidos entre películas y series de televisión incorporadas a Netflix hasta el año 2021.

La información disponible cubre producciones provenientes de múltiples países y géneros, lo que permite explorar la diversidad y evolución del contenido ofrecido por la plataforma. Además, el conjunto de datos contiene información temporal relacionada con el año de lanzamiento de cada producción y la fecha en que fue incorporada al catálogo de Netflix, facilitando el análisis de tendencias a lo largo del tiempo.

Desde una perspectiva temporal, los contenidos fueron incorporados a la plataforma entre los años 2008 y 2021, observándose una concentración importante de registros durante los años más recientes. El año mediano de incorporación corresponde a 2019, lo que indica que aproximadamente la mitad del catálogo disponible fue agregado a la plataforma durante los últimos años del período analizado.

En cuanto a la calidad de los datos, la mayoría de las variables presentan una alta completitud. Sin embargo, algunas variables asociadas a la información de producción contienen registros faltantes. La variable director presenta la mayor cantidad de valores ausentes, seguida por las variables country y cast. A pesar de ello, la disponibilidad de información es suficiente para realizar análisis descriptivos y visuales robustos sobre la composición y evolución del catálogo.

A continuación, se presentan diferentes visualizaciones que permiten caracterizar el conjunto de datos desde distintas perspectivas. Inicialmente se analizará la distribución del contenido según su tipo (películas y series), seguida por la exploración de los países productores, géneros predominantes y evolución temporal del catálogo. Estas visualizaciones proporcionarán una visión general del ecosistema de contenido de Netflix y servirán como base para el análisis posterior.

Distribución del contenido según su tipo

Como primera aproximación al catálogo, se analiza la distribución del contenido según su tipo. Esto permite identificar si Netflix cuenta con una mayor proporción de películas o de series de televisión dentro del conjunto de datos estudiado.

El gráfico muestra que el catálogo analizado está compuesto principalmente por películas. En total, se identifican 6.131 películas, equivalentes al 69,6% del contenido disponible, mientras que las series de televisión representan 2.676 títulos, correspondientes al 30,4%.

Este resultado indica que, dentro del conjunto de datos estudiado, Netflix mantiene una mayor presencia de películas frente a series. Sin embargo, la proporción de series también es relevante, lo que evidencia que ambos formatos hacen parte importante de la estrategia de contenido de la plataforma.

Evolución temporal según tipo de contenido

Después de analizar el crecimiento general del catálogo, es importante observar si la incorporación de películas y series ha seguido el mismo comportamiento a lo largo del tiempo. Esta comparación permite identificar posibles cambios en la estrategia de contenido de Netflix según el tipo de formato ofrecido.

Se observa que las películas han representado históricamente la mayor proporción de contenido incorporado al catálogo de Netflix. Aunque tanto las películas como las series experimentaron un crecimiento acelerado a partir de 2016, la expansión fue significativamente más pronunciada para las películas.

El mayor volumen de incorporaciones se registró en 2019, año en el cual Netflix añadió aproximadamente 1.400 películas y 600 series. A partir de 2020 se observa una ligera reducción en ambos formatos, aunque las películas continúan representando cerca del doble de títulos incorporados en comparación con las series.

Estos resultados sugieren que, durante el período analizado, la estrategia de crecimiento de Netflix estuvo orientada principalmente a fortalecer su catálogo de películas sin dejar de incrementar progresivamente la oferta de series.

Evolución de los géneros en el tiempo

Para profundizar en la composición temática del catálogo, se analiza la presencia de los principales géneros a lo largo del tiempo. Esta visualización permite identificar qué categorías han tenido mayor participación en los años de expansión del catálogo y cómo ha cambiado la oferta temática de Netflix.

El gráfico muestra que la mayor incorporación de contenido se concentra entre 2017 y 2021. Los géneros más representativos durante este periodo son International Movies, Dramas y Comedies, evidenciando una fuerte orientación hacia contenido internacional y de entretenimiento general. También se observa un crecimiento importante de categorías asociadas a series y documentales.

Relación entre géneros y años de incorporación

Con el fin de complementar el análisis temporal de los géneros, se construye un gráfico de burbujas donde el tamaño y color de cada punto representan la cantidad de títulos incorporados en cada género durante un año específico. Esta visualización facilita la identificación de los géneros con mayor crecimiento y permite comparar su evolución a través del tiempo.

El gráfico evidencia una expansión significativa del catálogo entre 2017 y 2021. Los mayores volúmenes de contenido se concentran en géneros como International Movies, Dramas y Comedies, mientras que las categorías asociadas a series internacionales también muestran un crecimiento sostenido durante los últimos años analizados.

Respuesta a la pregunta de investigación

Los resultados muestran que la estrategia de contenido de Netflix experimentó una expansión significativa entre 2008 y 2021, especialmente a partir de 2016. El crecimiento del catálogo estuvo impulsado principalmente por la incorporación de películas, aunque las series también presentaron un aumento sostenido durante los años más recientes.

Desde el punto de vista geográfico, la producción se concentró principalmente en Estados Unidos, India y Reino Unido, evidenciando la importancia de estos mercados dentro de la plataforma. Asimismo, se observó una fuerte presencia de contenido internacional, lo que refleja una estrategia orientada a audiencias globales.

En cuanto a la composición temática, los géneros más frecuentes fueron International Movies, Dramas y Comedies, mientras que categorías asociadas a series internacionales y documentales ganaron relevancia con el tiempo. En conjunto, los resultados sugieren que Netflix evolucionó hacia un catálogo cada vez más amplio, diverso e internacionalizado.

Conclusiones·

El análisis del catálogo de Netflix permitió identificar patrones relevantes en la composición y evolución de la plataforma. En primer lugar, se observó que las películas representan la mayor proporción del contenido disponible, superando ampliamente a las series de televisión.

Desde una perspectiva geográfica, Estados Unidos concentra la mayor cantidad de títulos, seguido por países como India y Reino Unido, evidenciando el liderazgo de estas industrias audiovisuales dentro del catálogo.

El análisis temporal mostró una expansión acelerada entre 2017 y 2021, período en el que Netflix incrementó significativamente la incorporación de contenido a su plataforma.

Finalmente, los géneros más frecuentes corresponden a International Movies, Dramas y Comedies, reflejando una estrategia orientada a ofrecer contenido diverso para audiencias globales. En conjunto, los resultados evidencian el crecimiento internacional de Netflix y la consolidación de un catálogo amplio y diversificado.

Reflexión final

La visualización de datos permitió explorar de manera efectiva la estructura y evolución del catálogo de Netflix. Mediante el uso de gráficos de barras, series temporales, mapas y visualizaciones multivariadas, fue posible identificar tendencias y patrones que no son evidentes al observar los datos de forma tabular. Esto demuestra el valor de las técnicas de visualización para apoyar procesos de análisis y toma de decisiones basados en datos.