Добрый день. В данном отчете мы обратимся к данным Netflix и IMDB, которые предоставляют данные по оценкам фильмов от зрителей и общую информацию о фильмах соответственно. Начнём с того, что наш заказчик - Netflix, который хочет улучшить свой и увеличить доходы. Обратимся к исследовательским вопросам, которые помогут нам дать заказчику необходимую информацию.
На данном графике мы видим 10 компаний, которые выпускают самые окупающиеся фильмы с Universal Pictures, взятой за стопроцентный идеал, с которым сравниваются другие студии. Сервису, который выкупает у компаний эти фильмы и права на них нужно знать, какие фильмы собрали самые большие кассы, поскольку они явно были популярны среди зрителей. Если поместить фильмы компаний на сервис, то это привлечёт больше пользователей, готовых ежемесячно платить за подписку на сервис, если тот будет предоставлять подобные фильмы с большой популярностью.
Как мы можем видеть из графика, чаще всего хорошие оценки набирают фильмы от 80 до 130 минут, хотя и есть исключения в виде документальных фильмов, которые тоже собирают хорошие оценки от зрителей. Сервису стоит обратить внимание на то, что фильмы с меньшей продолжительностью могут нравиться пользователям меньше.
Смотря на график, можно сказать, какие жанры фильмов имеют большие кассовые сборы. Исходя из наших данных, наиболее прибыльны Анимация, Приключения, Фантастика, Семейное кино и Боевик. Соответственно, нужно обратить внимание на данные жанры, поскольку большие кассовые сборы - маркер заинтересованности публики, а публика - потенциальные пользователи платного сервиса.
А теперь обратимся к текстовому анализу, чтобы определить, что привлекает пользователей в описаниях фильмов.
| Сочетание слов | Частота встречаемости |
|---|---|
| year old | 5 |
| christmas eve | 4 |
| los angeles | 4 |
| new york | 3 |
| north pole | 3 |
| peter pan | 3 |
| woman named | 3 |
| adams family’s | 2 |
| american woman | 2 |
| buddy cops | 2 |
Данные сочетания говорят нам о нескольких локациях и сюжетных особенностях, которые привлекают зрителей. Например, мы можем сказать, что самые популярные локации: Лос-Анджелес, Нью-Йорк и Северный Полюс (что удивительно, речь скорее всего идет о рождественских фильмах). Также часто основой сюжета становится Рождество, а buddy cops в нашем случае скорее всего относятся к комедиям о полицейских. Тут также представлен ряд хорошо известных и любимых персонажей: Питэр Пэн, семейка Адамс. В общем и целом, это дает нам представление об общих предпочтениях публики.
Сравнив два получившихся облака слов, мы можем заметить, что в первом облаке (у фильмов со средним рейтингом ниже 3) ключевые слова составляют следующие: независимый фильм, наркотик, убийство, месть, основан на новелле, старшая школа, насилие, Нью-Йорк, вечеринка. Интересно то, что по этим ключевым словам легко отгадывается сюжет фильма и вероятное развитие событий.
Обратимся к фильмам с рейтингом выше 3. Убийство, основан на новелле, секс, напряжение, насилие, спорт, месть, нагота. Данные ключевые слова частоп применяются в описаниях к триллерам и детективам, что может быть интересно зрителю.
Если делать общие рекомендательные заключения, которые могут помочь заказчику улучшить сервис, то определённо стоит обратить внимание на:
Фильмы студий, чьи фильмы чаще всего окупаются;
Продолжительность фильма: золотая середина - от 80 до 130 минут;
Наиболее прибыльные жанры: Анимация, Приключения, Фантастика, Семейное кино и Боевик;
Сочетания слов, встречающиеся в описании фильма - входят ли они в список популярных?
Ключевые слова по фильму: они позволяют предсказать сюжет, а вкупе с жанром можно строить предсказания о том, скольким людям они понравятся.
Как дополнение к имеющимся у нас данным хотелось бы посмотреть на тексты самих отзывов от пользователей, чтобы провести более полный анализ текста, который бы позволил более глубоко оценить отношение к сюжетам фильма (встречаемые сочетания слов и их окраска) и к фильмам в принципе.