base de dados

library(readr)
TV_Shows_Netflix <- read_csv("Aula de Estatistica/Base_de_dados-master/TV Shows - Netflix.csv")
## Rows: 50 Columns: 5
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (2): Titles, Rating
## dbl (3): Year, IMDB_Rating, Netflix
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(TV_Shows_Netflix)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)
library(readr)
library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(corrplot)
## corrplot 0.92 loaded

1- Introdução

Mundialmente conhecida, a Netflix é uma plataforma de streaming, isto é, a forma de transmissão de dados pela internet sem a necessidade de baixar o conteúdo, ou seja, é a transmissão, em tempo real, de dados de áudio e vídeo de um servidor para um aparelho.
Com seu serviço personalizado, com conteúdo são diversos, transmitido para todos, diferentes linguagem e baixo valores acaba atraído os mais diversos público e se tornando uma corrente de peso para a os conteúdos tradicionais, ou seja, a televisão.
Além disso, por terem sido criados pensando na internet em todos os sentidos, a divulgação dos mesmos é rápida e abrangente e, consequentemente, sua disseminação também.

2- Objetivo

O objetivo desse estudo de pesquisa é avaliar se uma das plataformas mais conhecida na atualidade, isto é, a Netflix diminuiu sua procura por shows de televisão (filmes e series) para seu catalogo e caso isso não tenha acontecido, quais seus criterios de escolhas para completar seu catalogo.

3- Metodologia

Como forma de facilitar o entendimento da metodologia da pesquisa, será exposto visualmente, isto é, por meio de uma tabela, os dados da base carregada.

TV_Shows_Netflix$Netflix <-ifelse(TV_Shows_Netflix$Netflix==1,"Tem na Netflix","Não tem na Netlix")

library(kableExtra)
kable(TV_Shows_Netflix, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
Titles Year Rating IMDB_Rating Netflix
Breaking Bad 2008 18+ 9.5 Tem na Netflix
Game of Thrones 2011 18+ 9.3 Não tem na Netlix
Rick and Morty 2013 18+ 9.2 Não tem na Netlix
Dark 2017 16+ 8.8 Tem na Netflix
Stranger Things 2016 16+ 8.8 Tem na Netflix
Avatar: The Last Airbender 2005 7+ 9.2 Tem na Netflix
Sherlock 2010 16+ 9.1 Tem na Netflix
Chernobyl 2019 18+ 9.4 Não tem na Netlix
Friends 1994 16+ 8.9 Não tem na Netlix
The Office 2005 16+ 8.9 Tem na Netflix
Better Call Saul 2015 18+ 8.7 Tem na Netflix
The Wire 2002 18+ 9.3 Não tem na Netlix
Supernatural 2005 16+ 8.4 Não tem na Netlix
Fargo 2014 18+ 8.9 Não tem na Netlix
Black Mirror 2011 18+ 8.8 Tem na Netflix
Band of Brothers 2001 18+ 9.4 Não tem na Netlix
Attack on Titan 2013 16+ 8.8 Não tem na Netlix
House 2004 16+ 8.7 Não tem na Netlix
Money Heist 2017 18+ 8.4 Tem na Netflix
Peaky Blinders 2013 18+ 8.8 Tem na Netflix
Mr. Robot 2015 18+ 8.5 Não tem na Netlix
Vikings 2013 18+ 8.5 Não tem na Netlix
The Sopranos 1999 18+ 9.2 Não tem na Netlix
The Simpsons 1989 7+ 8.7 Não tem na Netlix
The Mandalorian 2019 7+ 8.7 Não tem na Netlix
Lost 2004 16+ 8.3 Não tem na Netlix
Westworld 2016 18+ 8.7 Não tem na Netlix
The Umbrella Academy 2019 16+ 8.0 Tem na Netflix
Narcos 2015 18+ 8.8 Tem na Netflix
True Detective 2014 18+ 9.0 Não tem na Netlix
Marvel’s Daredevil 2015 18+ 8.6 Tem na Netflix
Brooklyn Nine-Nine 2013 16+ 8.4 Não tem na Netlix
The Walking Dead 2010 18+ 8.2 Tem na Netflix
Parks and Recreation 2009 16+ 8.6 Não tem na Netlix
Mindhunter 2017 18+ 8.6 Tem na Netflix
South Park 1997 18+ 8.7 Não tem na Netlix
Suits 2011 16+ 8.5 Não tem na Netlix
Hannibal 2013 18+ 8.5 Tem na Netflix
Dexter 2006 18+ 8.6 Não tem na Netlix
Community 2009 7+ 8.5 Não tem na Netlix
Fringe 2008 16+ 8.4 Não tem na Netlix
Modern Family 2009 16+ 8.4 Não tem na Netlix
The Big Bang Theory 2007 16+ 8.1 Não tem na Netlix
Firefly 2002 16+ 9.0 Não tem na Netlix
Mad Men 2007 16+ 8.6 Não tem na Netlix
Fullmetal Alchemist: Brotherhood 2009 18+ 9.1 Não tem na Netlix
Ozark 2017 18+ 8.4 Tem na Netflix
The Witcher 2019 18+ 8.2 Tem na Netflix
Lucifer 2016 16+ 8.2 Tem na Netflix
It’s Always Sunny in Philadelphia 2005 18+ 8.8 Não tem na Netlix

Partindo do que foi exposto pela a tabela, a metodologia que será usada para facilitar o entendimento do objetivo que se tem a pesquesquisa são:
• Inspeção, como forma de avaliar e compreender as variáveis que serão utilizada;
• Tabela simples junto aos gráficos;
• gráficos do tipo Boxplot com as variável ano e IMDB;
• Matriz de correlação entre as variáveis ano e IMDB

4- Resultado e discursão

Inspeção

summary(TV_Shows_Netflix)
##     Titles               Year         Rating           IMDB_Rating   
##  Length:50          Min.   :1989   Length:50          Min.   :8.000  
##  Class :character   1st Qu.:2005   Class :character   1st Qu.:8.500  
##  Mode  :character   Median :2011   Mode  :character   Median :8.700  
##                     Mean   :2010                      Mean   :8.722  
##                     3rd Qu.:2015                      3rd Qu.:8.900  
##                     Max.   :2019                      Max.   :9.500  
##    Netflix         
##  Length:50         
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

Mediante a seguinte inspeção de base dados inicia-se o objetivo de ter um conhecimento sucinto e a identificação das variáveis que serão trabalhadas neste relatório. Bases de dados categóricas e qualitativas, onde estão sendo demonstrados os títulos dos filmes/ séries/ documentários etc da plataforma de streaming, os anos de lançamento desses shows, a avaliação dos shows dada pelos assinantes, os números de IMDb (Internet Movie Database e em Português: Base de Dados de Filmes na Internet), que é uma base de dados online de informação sobre cinema TV, e a informação referentes aos shows que fazem parte do catalogo da plataforma Netflix. Também pode-se observar nesta inspeção de base dados, que nas variáveis quantitativas: Anos de lançamento e números de IMDb, foram apresentados os dados do mínimo, 1º quartil, mediana, média, 3º quartil e máxima, relativos aos dados dessas variáveis.

Tabela

table(TV_Shows_Netflix$Netflix)
## 
## Não tem na Netlix    Tem na Netflix 
##                31                19

A seguinte tabela demostra que o quantidade de shows de televisão (series e filmes) que fazem parte da Netflix é menor dos que não fazem. Desso modo, 31 shows não fazem parte de seu catalogo e só 19 fazem, sendo assim, muito pouco que faz parte.

table(TV_Shows_Netflix$IMDB_Rating)
## 
##   8 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9   9 9.1 9.2 9.3 9.4 9.5 
##   1   1   3   1   6   5   5   6   7   3   2   2   3   2   2   1

Já nessa tabela podemos ver que a quantidadeque o IMDB dos shows se rependo e compreender que há uma distribuição. Porém se visualiza uma certa concentração em relação a quantidade que se repete entre o IMDB 8.7 e 8.8 e somente um IMDb de 9.5.

table(TV_Shows_Netflix$Rating)
## 
## 16+ 18+  7+ 
##  19  27   4

Na tabela pode se ver que a quantidade de shows que tem um induce de 18+ é o que tem mais, seguido por 16+ e logo atrás 7+.

Boxplot

boxplot(IMDB_Rating ~ Netflix, data=TV_Shows_Netflix, col=c("#faa005","#1bc704","yellow"), main="Boxplot 1 - Relação do IMDB com programa que tem ou não na Netflix")

A partir dos gráficos, observa-se que há presença de outliers nos shows que fazem parte do catalogo da Netflix, ou seja, tem filmes dessa variável que possuem taxa em relação aos números de avaliação sobre cinema/ TV muito superiores dos shows que não fazem do catalogo da Netflix. Os shows que pertecem à platraforma possui uma amplitude interquartil. Percebe-se ainda que, há shows que não fazem parte da plataforma que possuem altas taxas em relação aos números de avaliação sobre cinema/ TV, enquanto os filmes que fazem parte do catalogo é levemente inferior no quesito de avaliação em relação aos que não fazem parte do cartalogo, tendo em vista que existem filmes em que há menos de 8.0 de avaliação de IMDb (Base de Dados de Filmes na Internet).

boxplot(Year~ Netflix, data=TV_Shows_Netflix, col=c("red","yellow"), main="Boxplot 2 - Relação dos ano com programa que tem ou não na Netflix")

O segundo gráfico se análisa as variáveis Netflix com os show (filmes e series) que fazem parte ou não dela junto ao anos de lançamento. Observamos aqui a existencia de outliers nos shows que não fazem parte do catalogo da Netflix, pois há shows que foram lançados antes dos anos 90. Além do mais, os shows que pertecem à platraforma também possuem uma amplitude interquartil para essa variável. Os shows que pertencem ao catalogo da Netflix possuem maior concentração de lançamentos nos anos anos entre 2010 e 2015, enquanto há alguns filmes que não estão no catalogo lançados entre os anos 1990 e 2000. A partir do gráfico, pode se concluir que no catalogo da Netflix não há filmes que foram lançados entre os anos 1990 e 2000.

Matriz de correlação

selecao01<- c("Year","IMDB_Rating")
cor_TvNet <- cor(TV_Shows_Netflix[,selecao01])
cor_TvNet
##                   Year IMDB_Rating
## Year         1.0000000  -0.2537178
## IMDB_Rating -0.2537178   1.0000000
corrplot(cor_TvNet,method = "number")

Uma matriz de correlação analítica concede a observação gráfico e dos dados numéricos do coeficiente de correlação entre as variáveis quantitativas.
É possível observar nesta matriz de correlação que as variáveis IMDB e Anos analisadas neste relatório anteriormente, em razão dos números estarem em vermelho possuem um grau de correlação negativa, tendo em vista que não há a possibilidade de haver uma estimativa sobre os desempenhos desses paradigmas a partir do outro.

5 - Conclusão

Diante dos dados obtidos e analisados, pode se concluir que a Netflix é uma plataforma de streaming que vem diminuindo seus conteúdos de shows (filmes e series, entre outros) que são relacionados a TV. Porém deve se ressaltar que essa diminuição não é completamente.
Em vista disso, quando um conteúdo de televisão é selecionado para seu catalogo, seus números de shows geralmente são mais atualizados como visto nos dados apresentados e seus índices de IMDB relevantes, ou seja, com mais possibilidade de chama a atenção do público. Desse modo, seu público cresce e consequentemente seus assinantes.