По описательной статистике выше видно, что у всех показателей усеченное среднее (trimmed mean) примерно совпадает со средним значением. Это свидетельствует о низком количестве выбросов в выборках. Все распределения имеют скошенность влево, но сильнее всего скошено распределение Индекс.БП, в то время как распределение Индекс.ВТ можно считать симметричным, так как его коэффициент скошенности (skew) очень низкий.
По индексу потребительской активности видно, что он значительно упал в апреле, что может быть связано с пандемией COVID-19. Именно в марте ВОЗ объявила о пандемии, и во многих регионах России были объявлены карантинные и нерабочие дни. Поэтому активность офлайн точек резко снизилась. То же самое мы видим и по количеству внутренних туристов. Данный индекс резко упал в апреле и мае, и начал заметно восстанавливаться в традиционные периоды отпусков: июнь-сентябрь. В то же время, индекс безналичных платежей остался неизменным, что логично, так как на безналичные расчеты пандемия никак не повлияла.
На графике видно, что в показателе Индекс.БП в каждом месяце присутствуют нетипично малые значения, а у Индекса.ВТ наблюдаются как нетипично большие, так и нетипично малые значения. Самые равномерно распределенные данные наблюдаются в показателе Индекс.ПА. В июне и октябре там отсутствуют выбросы.
Нетипично малые значения у Индекса.БП встречаются у представителей, входящих в Северо-Кавказский федеральный округ. Так как в результате традиций, экономического развития и развития IT, данные регионы больше полагаются на использование наличных денег, Индекс.БП у них ожидаемо низок. По Индексу.ВТ сложно сделать однозначные выводы, но можно заметить, что в г. Санкт-Петербурге количество туристов снизилось в апреле и мае, что может быть связано с пандемией COVID-19. То же самое наблюдается и в Калининградской области, но здесь заметен значительный рост в августе и сентябре, что может свидетельствовать о смягчении ограничений. В Индексе.ПА часто фигурирует Белгородская область, что может быть связано с высоким экономическим развитием региона и развитой инфраструктурой для туристов. Также видно, что индекс снизился в Москве в апреле и мае, что может быть связано с неопределенностью, вызванной пандемией COVID-19.
Исходя из проведенного разведовательного анализа при планировании открытия филиалов банка, Михаилу нужно обратить внимание на следующие регионы: Воронежская область, Калининградская область, Камчатский край, Кировская область, Нижегородская область, Самарская область.”
В июле и сентябре потребители этих регионов наиболее активны
В ноябре в этих регионах чаще всего совершаются безналичные платежи.
В январе, феврале и августе в этих регионах количество внутренних туристов увеличилось по сравнению с аналогичным периодом прошлого года.
Коэффициент корреляции по Пирсану
## cor
## 0.005408091
Коэффициент корреляции по Спирмену
## rho
## -0.02688924
p-value статистического теста корреляции Пирсана между двумя показателями
## [1] 0.9640385
p-value статистического теста корреляции Спирмена между двумя показателями
## [1] 0.8225938
Связанными данные показатели считать нельзя. По диаграмме рассеивания видно, что точки расположены плотно, не образуя никакого тренда. Это также подтверждается низким коэффициентом корреляции по Пирсону и Спирмену. Кроме того, были проведены тесты. По обоим показателям значение p-value больше 0.05, что позволяет нам принять нулевую гипотезу об отсутствии связи с 95% уверенностью.
p-value точного теста Фишера между двумя категориальными показателями
## [1] 9.918802e-13
Формально можно считать, что в тех регионах, где жители чаще берут кредиты, число ипотечных сделок также выше. Это видно по тесту Фишера, где p.value заметно меньше 0.05, а это значить, что мы можем отвергнуть нулевую гипотезу об отсутствии связи. По графику видно, что эта связь прямая.
p-value статистического теста корреляции Пирсана между двумя показателями
## [1] 0.04450902
p-value статистического теста корреляции Спирмена между двумя показателями
## [1] 0.03764415
Между долей безналичных платежей и заявками на кредиты онлайн есть слабая прямая связь. Это видно по p.value, который немного меньше 0.05, а это с 95 % вероятности доказывает нам откидывает кгипотезу об отсутсвии связи.
На основании результатов исследования, которые показывают статистически значимую связь между частотой взятия кредитов жителями регионов и числом ипотечных сделок, а также слабую прямую связь между долей безналичных платежей и заявками на кредиты онлайн, можно дать следующие рекомендации заказчику:
Уделить больше внимания регионам, где жители часто берут кредиты. Это может включать улучшение доступности и условий получения кредитов, проведение маркетинговых кампаний для привлечения потенциальных клиентов по ипотечному кредитованию. Эти меры могут способствовать увеличению числа ипотечных сделок в таких регионах.
Разработать и реализовать стратегии по стимулированию безналичных платежей и заявок на кредиты онлайн. Хотя связь между этими переменными является слабой, она указывает на потенциал для развития электронных платежей и онлайн-кредитования. Можно предложить снижение комиссий за безналичные платежи, улучшение удобства онлайн-заявок на кредиты и проведение информационных кампаний, чтобы стимулировать клиентов использовать эти возможности.
По столбчатой диаграмме можно увидеть, что летом и осенью заключается наибольшее количество ипотечных сделок. Если рассматривать категории сделок на суммы от 100 до 500 и от 500 до 1000, то можно отметить, что весной эти категории выделяются особенно.
По графику можно понять, что весной люди чаще оформляют кредиты через онлайн-заявки. Это можно заметить по ящику с усами, относящемуся к весне, у которого верхний и нижний квартили находятся выше, чем у остальных сезонов. Это может быть связано с несколькими факторами:
Начало нового финансового года: Многие компании начинают новый финансовый год с 1 апреля, что может привести к тому, что люди хотят получить кредиты весной, чтобы начать новый год с финансовым запасом.
Выплата налогов: Весной многие люди получают возврат налогов или выплачивают налоги, что может повлиять на их финансовую ситуацию и потребность в кредите.
Сезонные работы: Весной начинается сезонное увеличение спроса на работу в некоторых отраслях, таких как садоводство и сельское хозяйство, что может привести к увеличению занятости и доходов у некоторых людей, что, в свою очередь, может повлиять на их потребность в кредите.
Расходы на отдых и досуг: Весной люди часто планируют отпуска, путешествия и другие виды досуга, что может привести к дополнительным расходам и, соответственно, к потребности в кредите.
Переезды: Весной многие люди переезжают в новые дома или квартиры, что может привести к дополнительным расходам на переезд и мебель, что может повлиять на их потребность в кредите.
## Df Sum Sq Mean Sq F value Pr(>F)
## Сезон 3 525 174.87 1.791 0.157
## Residuals 68 6640 97.65
Из результатов теста ANOVA видно, что p-значение равно 0.157, что значительно превышает уровень значимости 0.05. Поэтому мы не можем отвергнуть нулевую гипотезу об отсутствии связи. Следовательно, наши данные не подтверждают наличие зависимости между долей онлайн-заявок на кредиты и временем года.
По графику видно, что весной люди чаще заключают сделки на вторичное жильё. Объяснений может быть несколько:
Сезонное увеличение активности на рынке недвижимости: весна и начало лета - это традиционный период усиленной активности на рынке недвижимости, когда люди активно ищут и приобретают жилье.
Выплата денежных бонусов и налоговых возвратов: весной многие работники получают денежные бонусы и налоговые возвраты, что может помочь им получить дополнительные денежные средства для покупки жилья.
Улучшение погодных условий: весна и начало лета - это период, когда улучшаются погодные условия, и это может стимулировать людей на поиск и покупку жилья.
Сезонный рост зарплат: в некоторых отраслях экономики зарплаты повышаются весной, что также может стимулировать людей к покупке жилья.
## Df Sum Sq Mean Sq F value Pr(>F)
## Сезон 3 1141 380.2 4.565 0.00567 **
## Residuals 68 5664 83.3
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Исходя из результатов теста ANOVA, видно, что значение p равно 0.00567, что значительно меньше 0.05. Следовательно, мы можем отвергнуть нулевую гипотезу об отсутствии связи. Таким образом, наши данные указывают на наличие зависимости между долей ипотечных сделок на вторичное жилье и временем года.
Результаты анализа и представленные гипотезы о зависимости между долей онлайн-заявок на кредиты и временем года имеют противоречивые выводы. С одной стороны, по графику можно понять, что весной люди чаще оформляют кредиты через онлайн-заявки. С другой стороны, результаты теста ANOVA не выявляют связи между этими показателями. Скорее всего, весной люди просто склонны чаще брать кредиты, но не обязательно делать это онлайн.
А вот связь между долей ипотечных сделок на вторичное жилье и временем года просматривается как на графике, так и с помощью теста ANOVA. Поэтому с уверенностью можно сказать, что весной люди чаще заключают сделки на вторичное жилье.
Для Михаила, эти результаты могут быть полезными при принятии решений в связи с ипотечными сделками и кредитованием.Например, он может учесть следующие аспекты:
Сезонность: Михаил может учитывать сезонные факторы, такие как активность на рынке недвижимости весной и начале лета. Это может помочь ему планировать маркетинговые и продажные стратегии в зависимости от времени года.
Финансовые факторы: Михаил может учесть выплаты налогов, денежные бонусы и возможное увеличение доходов клиентов в определенные периоды времени. Это может помочь ему адаптировать условия и предложения кредитования, чтобы соответствовать финансовым потребностям клиентов в эти периоды.
Сезонные особенности отраслей: Михаил может обратить внимание на отрасли, в которых весной возрастает спрос на работу и повышаются зарплаты. Это может указывать на потенциальных клиентов с увеличенными финансовыми возможностями и интересом к ипотечному кредитованию.
Расходы и потребности: Михаил может принять во внимание сезонные расходы на отдых, переезды и досуг, которые могут повлиять на потребность в кредите. Это может помочь ему разработать целевые продукты и условия кредитования, соответствующие потребностям клиентов в разные времена года.