CHALLENGE 1: Jaki jest najstarszy film Woody’ego Allena dostępny na Netflixie?

dane %>%
   select(Title,Director,Release.Date) %>% filter(Director == "Woody Allen") %>% top_n(-1,mdy(Release.Date))
##                                                                   Title
## 1 Everything You Always Wanted to Know About Sex But Were Afraid to Ask
##      Director Release.Date
## 1 Woody Allen     8/6/1972

CHALLENGE 2: Jakie są trzy najwyżej oceniane komedie dostępne w języku polskim?

dane %>%
  rowwise() %>%
  mutate(avg_score = mean(c(IMDb.Score * 10
                            ,Hidden.Gem.Score * 10
                            ,Rotten.Tomatoes.Score
                            ,Metacritic.Score)
                          ,na.rm = TRUE) %>%
           round(2)) %>%
   select(Title, Genre, Languages,avg_score) %>% filter(grepl('Polish',Languages) & grepl('Comedy', Genre)) %>% arrange(-avg_score) %>% head(3)
## # A tibble: 3 x 4
## # Rowwise: 
##   Title                              Genre             Languages       avg_score
##   <chr>                              <chr>             <chr>               <dbl>
## 1 Teddy Bear                         Comedy            Polish, English      81.3
## 2 Bogdan Boner: Egzorcysta           Comedy, Animation Polish               78  
## 3 Drunk History - Pó? litra historii Comedy            Polish               76.5

CHALLENGE 3: Dla produkcji z lat 2019 oraz 2020 jaki jest średni czas między premierą a pojawieniem się na Netflixie?

dane %>%
 mutate(Premiera = as.Date(Release.Date, "%m/%d/%Y"), na.rm = TRUE) %>%
  mutate(Netflix.Premiera = as.Date(Netflix.Release.Date, "%m/%d/%Y"), na.rm = TRUE) %>%
  filter(between(Premiera, as.Date("2019-01-01"), as.Date("2020-12-31"))) %>%
  mutate(Czas.Od = as.numeric(Netflix.Premiera - Premiera)) %>%
  filter(Czas.Od >= 0) %>% 
  select(Title, Netflix.Premiera, Premiera, Czas.Od) %>%
   summarize(Avg_Czas_Od = mean(Czas.Od, na.rm = TRUE))
##   Avg_Czas_Od
## 1    132.7216
# miejsce na 

CHALLENGE 4: Jakie są najpopularniejsze tagi dla produkcji dostępnych w języku polskim?

dane %>% 
  select(Title, Languages, Tags) %>% 
  filter(grepl('Polish',Languages)) %>%
  separate_rows(Tags, sep = ',\\s*') %>%
  group_by(Tags) %>%
  summarize(Count = n()) %>%
  arrange(desc(Count))
## # A tibble: 173 x 2
##    Tags                  Count
##    <chr>                 <int>
##  1 Dramas                   50
##  2 Polish Movies            29
##  3 Polish Dramas            17
##  4 TV Dramas                15
##  5 International Dramas     14
##  6 Movies Based on Books    14
##  7 International Movies     13
##  8 Polish TV Shows          13
##  9 Comedies                 12
## 10 Crime Thrillers          10
## # i 163 more rows