base de dados
library(readr)
TV_Shows_Netflix <- read_csv("Aula de Estatistica/Base_de_dados-master/TV Shows - Netflix.csv")
## Rows: 50 Columns: 5
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (2): Titles, Rating
## dbl (3): Year, IMDB_Rating, Netflix
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(TV_Shows_Netflix)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readxl)
library(readr)
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
library(corrplot)
## corrplot 0.92 loaded
Mundialmente conhecida, a Netflix é uma plataforma de streaming, isto é, a forma de transmissão de dados pela internet sem a necessidade de baixar o conteúdo, ou seja, é a transmissão, em tempo real, de dados de áudio e vídeo de um servidor para um aparelho.
Com seu serviço personalizado, com conteúdo são diversos, transmitido para todos, diferentes linguagem e baixo valores acaba atraído os mais diversos público e se tornando uma corrente de peso para a os conteúdos tradicionais, ou seja, a televisão.
Além disso, por terem sido criados pensando na internet em todos os sentidos, a divulgação dos mesmos é rápida e abrangente e, consequentemente, sua disseminação também.
O objetivo desse estudo de pesquisa é avaliar se uma das plataformas mais conhecida na atualidade, isto é, a Netflix diminuiu sua procura por shows de televisão (filmes e series) para seu catalogo e caso isso não tenha acontecido, quais seus criterios de escolhas para completar seu catalogo.
Como forma de facilitar o entendimento da metodologia da pesquisa, será exposto visualmente, isto é, por meio de uma tabela, os dados da base carregada.
TV_Shows_Netflix$Netflix <-ifelse(TV_Shows_Netflix$Netflix==1,"Tem na Netflix","Não tem na Netlix")
library(kableExtra)
kable(TV_Shows_Netflix, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T) %>%
scroll_box(width = "900px", height = "600px")
| Titles | Year | Rating | IMDB_Rating | Netflix |
|---|---|---|---|---|
| Breaking Bad | 2008 | 18+ | 9.5 | Tem na Netflix |
| Game of Thrones | 2011 | 18+ | 9.3 | Não tem na Netlix |
| Rick and Morty | 2013 | 18+ | 9.2 | Não tem na Netlix |
| Dark | 2017 | 16+ | 8.8 | Tem na Netflix |
| Stranger Things | 2016 | 16+ | 8.8 | Tem na Netflix |
| Avatar: The Last Airbender | 2005 | 7+ | 9.2 | Tem na Netflix |
| Sherlock | 2010 | 16+ | 9.1 | Tem na Netflix |
| Chernobyl | 2019 | 18+ | 9.4 | Não tem na Netlix |
| Friends | 1994 | 16+ | 8.9 | Não tem na Netlix |
| The Office | 2005 | 16+ | 8.9 | Tem na Netflix |
| Better Call Saul | 2015 | 18+ | 8.7 | Tem na Netflix |
| The Wire | 2002 | 18+ | 9.3 | Não tem na Netlix |
| Supernatural | 2005 | 16+ | 8.4 | Não tem na Netlix |
| Fargo | 2014 | 18+ | 8.9 | Não tem na Netlix |
| Black Mirror | 2011 | 18+ | 8.8 | Tem na Netflix |
| Band of Brothers | 2001 | 18+ | 9.4 | Não tem na Netlix |
| Attack on Titan | 2013 | 16+ | 8.8 | Não tem na Netlix |
| House | 2004 | 16+ | 8.7 | Não tem na Netlix |
| Money Heist | 2017 | 18+ | 8.4 | Tem na Netflix |
| Peaky Blinders | 2013 | 18+ | 8.8 | Tem na Netflix |
| Mr. Robot | 2015 | 18+ | 8.5 | Não tem na Netlix |
| Vikings | 2013 | 18+ | 8.5 | Não tem na Netlix |
| The Sopranos | 1999 | 18+ | 9.2 | Não tem na Netlix |
| The Simpsons | 1989 | 7+ | 8.7 | Não tem na Netlix |
| The Mandalorian | 2019 | 7+ | 8.7 | Não tem na Netlix |
| Lost | 2004 | 16+ | 8.3 | Não tem na Netlix |
| Westworld | 2016 | 18+ | 8.7 | Não tem na Netlix |
| The Umbrella Academy | 2019 | 16+ | 8.0 | Tem na Netflix |
| Narcos | 2015 | 18+ | 8.8 | Tem na Netflix |
| True Detective | 2014 | 18+ | 9.0 | Não tem na Netlix |
| Marvel’s Daredevil | 2015 | 18+ | 8.6 | Tem na Netflix |
| Brooklyn Nine-Nine | 2013 | 16+ | 8.4 | Não tem na Netlix |
| The Walking Dead | 2010 | 18+ | 8.2 | Tem na Netflix |
| Parks and Recreation | 2009 | 16+ | 8.6 | Não tem na Netlix |
| Mindhunter | 2017 | 18+ | 8.6 | Tem na Netflix |
| South Park | 1997 | 18+ | 8.7 | Não tem na Netlix |
| Suits | 2011 | 16+ | 8.5 | Não tem na Netlix |
| Hannibal | 2013 | 18+ | 8.5 | Tem na Netflix |
| Dexter | 2006 | 18+ | 8.6 | Não tem na Netlix |
| Community | 2009 | 7+ | 8.5 | Não tem na Netlix |
| Fringe | 2008 | 16+ | 8.4 | Não tem na Netlix |
| Modern Family | 2009 | 16+ | 8.4 | Não tem na Netlix |
| The Big Bang Theory | 2007 | 16+ | 8.1 | Não tem na Netlix |
| Firefly | 2002 | 16+ | 9.0 | Não tem na Netlix |
| Mad Men | 2007 | 16+ | 8.6 | Não tem na Netlix |
| Fullmetal Alchemist: Brotherhood | 2009 | 18+ | 9.1 | Não tem na Netlix |
| Ozark | 2017 | 18+ | 8.4 | Tem na Netflix |
| The Witcher | 2019 | 18+ | 8.2 | Tem na Netflix |
| Lucifer | 2016 | 16+ | 8.2 | Tem na Netflix |
| It’s Always Sunny in Philadelphia | 2005 | 18+ | 8.8 | Não tem na Netlix |
Partindo do que foi exposto pela a tabela, a metodologia que será usada para facilitar o entendimento do objetivo que se tem a pesquesquisa são:
• Inspeção, como forma de avaliar e compreender as variáveis que serão utilizada;
• Tabela simples junto aos gráficos;
• gráficos do tipo Boxplot com as variável ano e IMDB;
• Matriz de correlação entre as variáveis ano e IMDB
summary(TV_Shows_Netflix)
## Titles Year Rating IMDB_Rating
## Length:50 Min. :1989 Length:50 Min. :8.000
## Class :character 1st Qu.:2005 Class :character 1st Qu.:8.500
## Mode :character Median :2011 Mode :character Median :8.700
## Mean :2010 Mean :8.722
## 3rd Qu.:2015 3rd Qu.:8.900
## Max. :2019 Max. :9.500
## Netflix
## Length:50
## Class :character
## Mode :character
##
##
##
Mediante a seguinte inspeção de base dados inicia-se o objetivo de ter um conhecimento sucinto e a identificação das variáveis que serão trabalhadas neste relatório. Bases de dados categóricas e qualitativas, onde estão sendo demonstrados os títulos dos filmes/ séries/ documentários etc da plataforma de streaming, os anos de lançamento desses shows, a avaliação dos shows dada pelos assinantes, os números de IMDb (Internet Movie Database e em Português: Base de Dados de Filmes na Internet), que é uma base de dados online de informação sobre cinema TV, e a informação referentes aos shows que fazem parte do catalogo da plataforma Netflix. Também pode-se observar nesta inspeção de base dados, que nas variáveis quantitativas: Anos de lançamento e números de IMDb, foram apresentados os dados do mínimo, 1º quartil, mediana, média, 3º quartil e máxima, relativos aos dados dessas variáveis.
table(TV_Shows_Netflix$Netflix)
##
## Não tem na Netlix Tem na Netflix
## 31 19
A seguinte tabela demostra que o quantidade de shows de televisão (series e filmes) que fazem parte da Netflix é menor dos que não fazem. Desso modo, 31 shows não fazem parte de seu catalogo e só 19 fazem, sendo assim, muito pouco que faz parte.
table(TV_Shows_Netflix$IMDB_Rating)
##
## 8 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9 9.1 9.2 9.3 9.4 9.5
## 1 1 3 1 6 5 5 6 7 3 2 2 3 2 2 1
Já nessa tabela podemos ver que a quantidadeque o IMDB dos shows se rependo e compreender que há uma distribuição. Porém se visualiza uma certa concentração em relação a quantidade que se repete entre o IMDB 8.7 e 8.8 e somente um IMDb de 9.5.
table(TV_Shows_Netflix$Rating)
##
## 16+ 18+ 7+
## 19 27 4
Na tabela pode se ver que a quantidade de shows que tem um induce de 18+ é o que tem mais, seguido por 16+ e logo atrás 7+.
boxplot(IMDB_Rating ~ Netflix, data=TV_Shows_Netflix, col=c("#faa005","#1bc704","yellow"), main="Boxplot 1 - Relação do IMDB com programa que tem ou não na Netflix")
A partir dos gráficos, observa-se que há presença de outliers nos shows que fazem parte do catalogo da Netflix, ou seja, tem filmes dessa variável que possuem taxa em relação aos números de avaliação sobre cinema/ TV muito superiores dos shows que não fazem do catalogo da Netflix. Os shows que pertecem à platraforma possui uma amplitude interquartil. Percebe-se ainda que, há shows que não fazem parte da plataforma que possuem altas taxas em relação aos números de avaliação sobre cinema/ TV, enquanto os filmes que fazem parte do catalogo é levemente inferior no quesito de avaliação em relação aos que não fazem parte do cartalogo, tendo em vista que existem filmes em que há menos de 8.0 de avaliação de IMDb (Base de Dados de Filmes na Internet).
boxplot(Year~ Netflix, data=TV_Shows_Netflix, col=c("red","yellow"), main="Boxplot 2 - Relação dos ano com programa que tem ou não na Netflix")
O segundo gráfico se análisa as variáveis Netflix com os show (filmes e series) que fazem parte ou não dela junto ao anos de lançamento. Observamos aqui a existencia de outliers nos shows que não fazem parte do catalogo da Netflix, pois há shows que foram lançados antes dos anos 90. Além do mais, os shows que pertecem à platraforma também possuem uma amplitude interquartil para essa variável. Os shows que pertencem ao catalogo da Netflix possuem maior concentração de lançamentos nos anos anos entre 2010 e 2015, enquanto há alguns filmes que não estão no catalogo lançados entre os anos 1990 e 2000. A partir do gráfico, pode se concluir que no catalogo da Netflix não há filmes que foram lançados entre os anos 1990 e 2000.
selecao01<- c("Year","IMDB_Rating")
cor_TvNet <- cor(TV_Shows_Netflix[,selecao01])
cor_TvNet
## Year IMDB_Rating
## Year 1.0000000 -0.2537178
## IMDB_Rating -0.2537178 1.0000000
corrplot(cor_TvNet,method = "number")
Uma matriz de correlação analítica concede a observação gráfico e dos dados numéricos do coeficiente de correlação entre as variáveis quantitativas.
É possível observar nesta matriz de correlação que as variáveis IMDB e Anos analisadas neste relatório anteriormente, em razão dos números estarem em vermelho possuem um grau de correlação negativa, tendo em vista que não há a possibilidade de haver uma estimativa sobre os desempenhos desses paradigmas a partir do outro.
Diante dos dados obtidos e analisados, pode se concluir que a Netflix é uma plataforma de streaming que vem diminuindo seus conteúdos de shows (filmes e series, entre outros) que são relacionados a TV. Porém deve se ressaltar que essa diminuição não é completamente.
Em vista disso, quando um conteúdo de televisão é selecionado para seu catalogo, seus números de shows geralmente são mais atualizados como visto nos dados apresentados e seus índices de IMDB relevantes, ou seja, com mais possibilidade de chama a atenção do público. Desse modo, seu público cresce e consequentemente seus assinantes.