A evolução e globalização do catálogo da Netflix

Introdução

O boom dos Streamings

Nos últimos anos, as plataformas de streaming se consolidaram como um dos principais meios de acesso a filmes e séries em todo o mundo. Entre elas, a Netflix desempenha um papel central, tanto por sua ampla base de assinantes quanto por sua estratégia agressiva de produção e aquisição de conteúdo. Com um catálogo que se expande continuamente e que inclui produções de dezenas de países, a Netflix se tornou uma peça importante para compreender tendências culturais, econômicas e globais do entretenimento contemporâneo.

Por que estudar o catálogo da Netflix?

Diante desse cenário, investigar como o catálogo da Netflix se transformou ao longo do tempo não é apenas uma curiosidade, é uma forma de entender como a plataforma responde às demandas do mercado, como se posiciona estrategicamente em diferentes regiões e como contribui para a circulação de conteúdos globais. Essa análise interessa a pesquisadores, estudantes, profissionais criativos e até mesmo consumidores, pois revela mudanças nos tipos de produções oferecidas, no equilíbrio entre filmes e séries, e na ampliação da diversidade geográfica.

Sobre os dados e metodologias

Para realizar essa investigação, utilizo um conjunto de dados do Kaggle contendo informações detalhadas sobre títulos disponíveis na plataforma, incluindo:

  • Ano de lançamento
  • País(es) de produção
  • Tipo de obra (filme ou série)
  • Classificação indicativa
  • Data em que o título entrou no catálogo

A partir desses dados, aplico procedimentos de limpeza, padronização e organização, de modo a torná-los adequados para análise exploratória. Em seguida, realizo investigações que permitem observar padrões temporais e geográficos, com foco especial na evolução e globalização do catálogo.

Sobre a abordagem

A abordagem adotada combina análise descritiva, visualização de dados e interpretação narrativa, permitindo não apenas quantificar mudanças ao longo dos anos, mas também compreender o que essas mudanças significam. Dessa forma, a análise busca responder perguntas como: Como o catálogo cresceu ao longo do tempo? Em que momento séries se tornaram tão importantes quanto filmes? De que forma a Netflix expandiu seu alcance para além dos Estados Unidos?

Por fim, espera-se que os resultados auxiliem potenciais interessados a enxergar tendências estratégicas da Netflix, identificar padrões de produção global e compreender como a plataforma tem influenciado a circulação de conteúdos culturais no mundo contemporâneo.


Pacotes requeridos

Para garantir a excecução completa das análises e visualizações apresentadas neste relatório, é necessário carregar previamente os seguintes pacotes, responsáveis pela importação, organização, manipulação e plotagem dos dados:

library(readr)
library(DT)
library(dplyr)
library(lubridate)
library(tidyr)
library(ggplot2)
library(knitr)
# Criar dataframe com bibliotecas e descrições
tabela <- data.frame(
  Nome_do_Pacote = c(
    "library(readr)",
    "library(DT)",
    "library(dplyr)",
    "library(lubridate)",
    "library(tidyr)",
    "library(ggplot2)",
    "library(knitr)"
  ),
  Finalidade = c(
    "Importar dados delimitados (como CSV) de forma simples e rápida",
    "Criar tabelas interativas em HTML",
    "Manipular, transformar e filtrar dados",
    "Trabalhar com datas de maneira prática",
    "Organizar, separar, unir e reestruturar conjuntos de dados",
    "Criar gráficos personalizáveis",
    "Gerar relatórios dinâmicos (HTML, PDF, etc.)"
  )
)

kable(tabela, 
      align = c("l", "l"),
      col.names = c("Nome do pacote", "Finalidade"))
Nome do pacote Finalidade
library(readr) Importar dados delimitados (como CSV) de forma simples e rápida
library(DT) Criar tabelas interativas em HTML
library(dplyr) Manipular, transformar e filtrar dados
library(lubridate) Trabalhar com datas de maneira prática
library(tidyr) Organizar, separar, unir e reestruturar conjuntos de dados
library(ggplot2) Criar gráficos personalizáveis
library(knitr) Gerar relatórios dinâmicos (HTML, PDF, etc.)

Preparação dos dados

Carregamento dos dados

Como descrito na Introdução, o conjunto de dados utilizado neste trabalho é o “Netflix Movies and TV Shows”, disponibilizado no Kaggle e originalmente compilado a partir do mecanismo de busca Flixable, que registra títulos presentes no catálogo da Netflix.

Esse dataset reúne informações sobre filmes e séries adicionados na plataforma desde dezembro de 2007 até setembro de 2021, mas antes de iniciar a análise é necessário importar o arquivo CSV, compreender sua estrutura e identificar quais colunas são relevantes para responder às perguntas propostas pelo projeto.

raw_data <- read.csv("C:/Users/danta/OneDrive/Documentos/projeto/netflix_titles.csv.csv")

Visualização da tabela inicial

O dataset utilizado no projeto possui 12 colunas e 8.807 linhas. As colunas são nomeadas da seguinte forma: show_id, type, title, director, cast, country, date_added, release_year, rating, duration, listed_in e description. A seguir, temos uma tabela iterativa dos nossos dados iniciais que ainda precisam ser pré-processados.

datatable(raw_data, 
          rownames = FALSE,
          options = list(
            pageLength = 5, 
            autoWidth = TRUE,
            language = list(search = "Buscar:", lengthMenu = "Mostrar _MENU_ entradas")
          ))

Análise inicial

Levando em consideração o objetivo do projeto, nós podemos começar excluindo algumas colunas que não serão necessárias para a análise, ficando apenas com 7 variáveis:

  • type
  • title
  • country
  • date_added
  • release_year
  • rating
  • listed_in
data <- raw_data[, c(
  "type",
  "title",
  "country",
  "date_added",
  "release_year",
  "rating",
  "listed_in"
)]

Coluna date_added

A coluna date_added é responsável por registrar quando cada título foi incluído no catálogo da Netflix, porém seus valores estão armazenados no formato texto (chr), utilizando datas escritas em inglês, como “September 9, 2020”.

class(data$date_added)
## [1] "character"

Para que seja possível realizar análises temporais, é necessário converter essa coluna para o tipo data. Após essa conversão, extraímos o ano de cada registro e criamos uma nova variável chamada added_year, que servirá como base para explorar tendências temporais de expansão da Netflix, permitindo identificar períodos de maior inclusão de títulos e mudanças na composição do catálogo.

# Converter e extrair ano
data$date_added <- mdy(data$date_added)
data$added_year <- year(data$date_added)

Análise exploratória dos dados

Evolução Filmes/Séries x Ano

Até 2014, a Netflix adicionava poucos títulos ao catálogo. Esse crescimento tímido reflete o período em que a plataforma ainda não era global e possuía um acervo limitado, concentrado principalmente nos Estados Unidos.

A partir de 2016, ocorre uma expansão acelerada, com forte aumento na entrada de filmes e séries. Os filmes atingem seu pico em 2019, ultrapassando 1.400 adições, enquanto as séries crescem de forma constante no mesmo intervalo. Esse movimento acompanha a internacionalização da Netflix, o início dos conteúdos originais e novas parcerias com estúdios.

O ano de 2019 representa o pico das adições, mostrando um momento de fortalecimento do catálogo antes da chegada de concorrentes importantes no mercado de streaming.

Após 2020, há uma redução no ritmo, os filmes caem de maneira mais expressiva, e séries mostram uma queda mais moderada. Esse declínio pode estar relacionado ao impacto da pandemia e a uma estratégia mais seletiva da Netflix, já com o catálogo estabilizado.

No geral, essas tendências mostram como o crescimento rápido e a posterior desaceleração acompanham a trajetória de globalização e maturidade da plataforma.

# Agrupar por ano e tipo
type_year <- data %>%
  group_by(added_year, type) %>%
  summarise(n = n(), .groups = "drop") %>%
  pivot_wider(names_from = type, values_from = n, values_fill = 0)

# Plotar gráfico
ggplot(type_year, aes(x = added_year)) +
  geom_line(aes(y = Movie, color = "Filmes")) +
  geom_line(aes(y = `TV Show`, color = "Séries")) +
  labs(
    x = "Ano de adição",
    y = "Quantidade de títulos",
    title = "Filmes vs Séries adicionados à Netflix ao longo do tempo",
    color = ""
  ) +
  theme_minimal()


Conclusão