Preparation

Downolading packages

# libraries for tables
library(knitr)
library(kableExtra)

# for select
library(dplyr)

# library for graphs
library(ggplot2)

# for regression tables
library(stargazer)

#visualization for variables
library(QuantPsyc)

library(sjPlot)

#for Levene's test
library(car) 

#to run post hoc tests
library(userfriendlyscience) 


library(RCurl)
library(tidyverse)
library(foreign)
library(sjPlot)
library(psych)

Data

#set new directory
setwd("E:/gfgrf/ESS8SE_spss") 
getwd()
## [1] "E:/gfgrf/ESS8SE_spss"
library(foreign)
ESS <- read.spss("ESS8SE.sav", use.value.labels=T, to.data.frame=T)

Project 1

Project 1

Начнем с выбора переменных релевантных нашей теме:

myvars <-  c("happy", "sclmeet", "sclact", "inprdsc", 
                      "gndr", "ipgdtim", "yrbrn", "pplhlp")
ESS1 <- ESS[myvars]
rm(myvars)

ESS1 = na.omit(ESS1) 

Таблица переменных

Variable <- c("Gndr - Gender", "Yrbrn - Year of birth", "Happy - How happy are you", "Sclmeet - How often socially meet with friends, relatives or colleagues", "Sclact - Take part in social activities compared to others of same age", "Inprdsc - How many people with whom you can discuss intimate and personal matters", "Ipgdtim - Important to have a good time")
Qualitative_or_Quantitative <- c("Qualitative", "Quantitative", "Qualitative", "Qualitative", "Qualitative", "Qualitative", "Qualitative")
Level_of_measurement <-c("Nominal", "Interval", "Ordinal", "Ordinal", "Ordinal", "Ordinal", "Ordinal")
Continuous_or_Discrete <- c("Discrete","Continuous", "Discrete", "Discrete", "Discrete", "Discrete", "Discrete")
Table = data.frame(Variable, Qualitative_or_Quantitative, Level_of_measurement, Continuous_or_Discrete)
print(Table)
##                                                                            Variable
## 1                                                                     Gndr - Gender
## 2                                                             Yrbrn - Year of birth
## 3                                                         Happy - How happy are you
## 4           Sclmeet - How often socially meet with friends, relatives or colleagues
## 5            Sclact - Take part in social activities compared to others of same age
## 6 Inprdsc - How many people with whom you can discuss intimate and personal matters
## 7                                           Ipgdtim - Important to have a good time
##   Qualitative_or_Quantitative Level_of_measurement Continuous_or_Discrete
## 1                 Qualitative              Nominal               Discrete
## 2                Quantitative             Interval             Continuous
## 3                 Qualitative              Ordinal               Discrete
## 4                 Qualitative              Ordinal               Discrete
## 5                 Qualitative              Ordinal               Discrete
## 6                 Qualitative              Ordinal               Discrete
## 7                 Qualitative              Ordinal               Discrete

Перекодируем наши переменные в numeric:

ESS1$yrbrn <-as.numeric(ESS1$yrbrn) 

CTM

Describe single variables using CTM

Для лучшего восприятия данных нами была сгенирированна таблица по CTM по нашим переменным:

Moda

Найдем моду у переменных, ее имеют все наши переменные:

## [1] 28
## [1] Somewhat like me
## 6 Levels: Very much like me Like me Somewhat like me ... Not like me at all
## [1] 8
## Levels: Extremely unhappy 1 2 3 4 5 6 7 8 9 Extremely happy
## [1] About the same
## 5 Levels: Much less than most Less than most ... Much more than most
## [1] Several times a week
## 7 Levels: Never Less than once a month ... Every day
## [1] 4-6
## Levels: None 1 2 3 4-6 7-9 10 or more
## [1] Female
## Levels: Male Female

Median

Также посмотрим на медианное и среднее значение наших переменных:

median(as.numeric(ESS1$yrbrn), na.rm = T)
## [1] 45
mean(ESS1$yrbrn, na.rm = T)
## [1] 45.66116

По нашей единственной количественной переменной (“Year of birth”) мы посмотрели первый и третий квартили, медиану, среднее, а также максимальное и минимальное значение:

summary(ESS1$yrbrn) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00   30.00   45.00   45.66   61.00   82.00

Vizualisation

Также мы решили проиллюстрировать графиками (barplots) некоторые из наших переменных:

На данном графике представлены среднее, медианное значения и значение моды по возрасту респондентов. Можно заметить, что наибольшее значение принимает среднее значение возраста (45,5), в то время как медианное значение возраста лишь немного уступает среднему (45). Значение моды возраста не достигает даже тридцати (28) - большинство респондентов были в возрасте 28 лет.

По второму графику можно сказать, что В нашей выборке число мужчин лишь немного превосходит число женщин: 773 мужчины и 777 женщин.

Далее мы обратились к распределению наших переменных:

Распределение респондентов по возрасту:

Из графика видно, что наибольшее число респондентов - в возрасте 28 лет. В принципе респондентов моложе двадцати лет меньше, чем респондентов других возрастов. Наименьшее количество респондентов среди респондентов старше двадцати лет - около 27 респондентов в возрасте около 75 лет.

Распределение переменной - How happy are you?

Данный график отражает уровень счастья, который сами респонденты себе приписывают. Респондентам была предложена шкала, где 0 – очень несчастен, 10 – крайне счастлив. Как можно заметить большинство ответов сконцентрировано в правой части графика, из чего можно сделать вывод, что уровень счастья у превалирующего числа информантов довольно высок.

Распределение переменной - How often socially meet with friends, relatives or colleagues?