Работа по анализу данных

Гришуниной Лидии, Мастюгиной Екатерины и Пикуновой Серафимы

команды The Crazy

В качестве темы исследования мы выбрали отношение людей к изменению климата в Норвегии по данным за 2016 год.

На первом этапе мы составили таблицу, которая определяет каждую выбранную переменную в таких категориях, как “качественная или количественная”, “шкала измерения” и “непрерывная или дискретная”.

Для того, чтобы провести дальнейший анализ, мы изменили тип переменных.

Затем мы сделали саммери наших данных. Так, единственная численная переменная в наших данных - возраст, для которой мы определили минимальное и максимальное значение, медиану, среднее и первый и третий квартили. Для факторных переменных мы определили моду, которая равна самому частовстречающемуся значению в таблице.

##      gndr                agea         eneffap    rdcenr      cflsenr   
##  Length:1531        Min.   :15.0   8      :365   1 : 24   8      :335  
##  Class :character   1st Qu.:31.0   7      :235   2 : 75   10     :321  
##  Mode  :character   Median :47.0   10     :204   3 :394   7      :232  
##                     Mean   :46.9   9      :200   4 :481   9      :173  
##                     3rd Qu.:61.0   5      :193   5 :434   5      :161  
##                     Max.   :98.0   6      :120   6 :120   6      :132  
##                                    (Other):214   55:  3   (Other):177  
##  wrpwrct wrenexp clmchng    cntry          
##  1:430   1:155   1:755   Length:1531       
##  2:760   2:610   2:672   Class :character  
##  3:275   3:563   3: 88   Mode  :character  
##  4: 55   4:181   4: 16                     
##  5: 11   5: 22                             
##                                            
## 

Дальше мы построили графики, которые описывают наши переменные. Данная гистограмма иллюстрирует распределение возраста в наших данных.

Этот график иллюстрирует переменную “вероятность покупки наиболее энергоэффективной бытовой техники” и варьируется от “не совсем вероятно”(0) и заканчивается на “чрезвычайно вероятно” (10). График показывает, что большинство респондентов с довольно высокой вероятностью купит более энергоэффективную бытовую технику.

Следующая диаграмма иллюстрирует количество ответов по переменной “как часто респонденты сокращают энергопотребление”, которое варьируется от никогда (1) до всегда (6), а также есть вариант ответа “не могу уменьшить потребление энергии” (55). Согласно графику, большинство людей со средней частотой сокращает потребление энергии.

Этот график дает информацию о том, “насколько вы уверены, что могли бы использовать меньше энергии, чем сейчас”, и он варьируется от не совсем уверен(а) (0) до полностью уверен(а) (10). Результаты не показывают однозначной тенденции, но существует сильный перевес в сторону большей уверенности.

Этот график иллюстрирует данные из переменной “как сильно вы беспокоитесь о возможности отключения электроэнергии”, и она варьируется от совсем не беспокоюсь (1) до чрезвычайно беспокоюсь (5), и показывает, что люди склонны не беспокоиться об этом (ответ 2 - не очень беспокоятся - преобладает).

Следующий график показывает количество ответов по переменной “как сильно вы беспокоитесь о дороговизне энергии для многих людей”. Как и в прошлом, он варьируется от совсем не беспокоюсь (1) до чрезвычайно беспокоюсь (5), и наиболее часто встречающимся ответом является среднее беспокойство о данной проблеме.

Этот график предоставляет данные о переменной “как вы думаете, меняется ли климат в мире”. Подавляющее большинство респондентов считает, что он “определенно меняется” (1) и “вероятно меняется” (2).

Этот график иллюстрирует ответы на вопрос “как часто вы делаете что-либо, чтобы уменьшить потребление энергии?”(варьируются от никогда (1) до всегда (6), а также есть вариант ответа “не могу уменьшить потребление энергии” (55)) по гендеру. Так, как женщины, так и мужчины, чаще всего выбирают 4 вариант ответа, а реже всего - “не могу уменьшить потребление энергии”. Также по этому графику можно сделать вывод, что мужчин в нашей выборке больше, чем женщин.

Затем мы проверили, есть ли значимая разница между числом ответов женщин и мужчин по возрасту. Как видно на графике, разница незначительна.

Последние бокс-плоты показывают распределение возраста респондентов с различными ответами на вопрос “как сильно вы беспокоитесь о возможности отключения электроэнергии?”. Так как возраст - это единственная численная переменная в нашей базе данных, мы не смогли построить другие информативные графики распределения. Старшее поколение чаще отвечали, что они беспокоятся о возможности отключения электроэнергии, тогда как более молодые респонденты почти не выбирали варианты 4 и 5.

В заключении следует отметить, что общая картина показывает, что люди обеспокоены изменением климата и предпринимают ряд усилий для сокращения потребления энергии, причем люди старшего поколения обеспокоены этой проблемой в большей степени.