Задача

На основе данных (и выданных вопросов) постараться выяснить:

** какие проблемы есть в авиаперевозках**

** какие улучшения можно предложить на основе выводов по данным**

Вопросы

Вопрос 1

Вопрос: “1Пишут ли люди более добрые отзывы на авиалинии в выходные (доброту определяем через overall_rating)”

Данные: для ответа на вопрос нужны таблицы airline

1.2Здесь мы видим количество отзывов , написанных в будние и выходные дни.

## [1] "767 отзывов в буднии дни"
## [1] "144  отзыва в выходные дни"
## [1] "729 recommended(satisfied passangers)"
## [1] "271 not recommended(not satisfied passangers)"

1.3Мы также можем посмотреть насколько каждый класс пассажиров удовлетворен своей поездкой

Ответ: <Как мы видим более высокие оценки оставляют в невыходные дни :большее количество людей (примерно на 0.5 ) оставляют более добрые отзывы в будние дни,но это происходит из-за количества пассажиров а не из-за влияния дня недели, и моды данных это подтверждают, плюс каждый класс пассажиров не ставил оценку ниже 6 в overall_rating>

Вывод: <Из полученных данных мы можем сделать вывод о том ,что нет прямой зависимости между днем написания отзыва и рейтингом авиакомпании , так как моды одинаковы,а люди в рабочие дни чаще пишут отзывы , чем в выходные;Следовательно мы можем сделать вывод : большинство клиентов объективно оценивают качество авиаперелета несмотря на день недели.В дальнейшем посмотрим, от чего на самом деле зависит рейтинг авиалиний.>

Вопрос 2

Вопрос: “Отличается ли использование слов "not good", "bad", "awful" в отзывах на авиалинии у путешественников из разных классов (cabin_flown)?”

Данные: для ответа на вопрос нужны таблицы airline

Ответ: Да,различие в применение слов “not good”, “bad” и “awful” в зависимости от класса наблюдается:так наибольшее число этих негативных слов наблюдается в сообщениях класса Economy, меньше всего-First Class.

Вывод: Анализируя полученные данные, мы можем прийти к выводу о том, что большинство недовольных клиентов авиакомпаний- пассажиры эконом класса, самые “довольные”- пассажиры класса First Class, причем слово bad присутствует в каждом из типов класса , что позволяет нам сделать вывод о том , что даже в Premium и First class требуют улучшения качества обслуживания клиентов.

Вопрос 3

Вопрос: "Есть ли взаимосвязь между средним рейтингом разных моделей самолета (aircraft) по критерию комфортности кресла (seat_comfort) и средней оценкой моделей самолетов по местам для хранения (seat_storage)?

Данные: для ответа на вопрос нужны таблицы seat,airline

Здесь важно примечание: самолеты содержащие только цифры- (боенги), так как значение некоторых рейтингов по самолетам все же повторяется , то мы выделим размером количествол идентичнх рейтингов по самолетам

3.1 Зададимся вопросом:насколько хороши авиалинии некоторых компаний по обобщенному среднему рейтингу lounge зон, seat (кресел) и airline(качество обслуживания)"

3.2 А теперь посмотрим на процентное соотношение каждого из рейтингов по авиакомпаниям

Обобщенный рейтинг по компаниям

Ответ: Такой взаимосвязи не наблюдается отчасти из-за недостатовного количества данных, но также по полученным данным мы можем видеть некоторые совпадения , но их очень мало.

Вывод: Анализируя полученные данные , мы можем прийти к выводу о том ,что даже на основе непредставленной выборки нет точного совпадения между оценкой по seat и оценкой по месту хранения, хотя совпадения и есть- они не значительны .Однако мы все же можем сделать выводы об overall seat_rating,lounge_rating and airline_rating для некоторых авиалиний.Предпоследняя таблица демонстрирует соотношения показателей по всем рейтингам по авиакомпаниям.Это позволит последним проанализировать свои рейтинги по авиаперевозке пассажиров и сравнить их с рейтингами своих конкурентов(или найти наиболее приемлемую компанию ,отвечающую вашим требованиям по комфортности).Также можно посмотреть статистику по отдеьным рейтингам по компаниям.

Дэшборд

Полученные выводы обобщены в виде дэшборда со следующими элементами

Элемент 1: - вид: Box-plot - ответ на вопрос: 1 - обоснование: Данные показатели демонстрируют количество среднюю оценку пассажиров в зависимости от дня недели

Элемент 2: - вид: - ответ на вопрос: <2> - обоснование: Наиболее компактный вид , который показывает в каком именно классе пассажиры испытывают наибольшее неудовлетворение от поезки (это определяется количеством использованных негативных слов)

Элемент 3: - вид: - ответ на вопрос: 3 - обоснование:Мы должны продемонстрировать корелляцию между рейтингами (а точнее их отсутствие).

Элемент 5: - вид: - ответ на вопрос: - - обоснование:Если кому-то особенно важен при путешестви комфорт в полете(кресло) или зона отдыха в период ожидания рейса или он хочет выбрать наилучшего перевозчика- то ему потребуются эти данные.

Общие выводы

На основе проделанной работы мы можем сделать следующие выводы: во-первых, рейтинг не зависит от дня недели , но имеет тенденцию к повышению при улучшении класса пассажиров, причем самые недовольные пассажиры- пассажиры класса ‘Economy’, а самые доворльные-“Premium”(это можно понять по употреблению определенных слов).Затем мы можем сделать вывод, что нет четкой взаимосвязи между средним рейтингом разных моделей самолета по критерию комфортности кресла и средней оценкой моделей самолетов по местам для хранения (отчасти из-за недостаточного количества данных), однако мы выяснили , что лучшим рейтингом(обобщенным),обладает компания “asiana-airlines”, по комфортности коресел лидирует “eva-air”, по lounge зонам -“ana-all-nippol-airlines”.Также 729 пассажиров удовлетворены своим полетом(они рекомендуют аэропорт который посетили),а 271 -нет.На основе этих данных авиакомпании и пассажиры смогут(в первом случае) улучшить качество обслуживания и проанализировать рынок, а во втором - найти наиболее приемлемый для себя вариант выбора авиалинии .