library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.2.0     ✔ readr     2.2.0
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ ggplot2   4.0.2     ✔ tibble    3.3.1
## ✔ lubridate 1.9.5     ✔ tidyr     1.3.2
## ✔ purrr     1.2.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(haven)
library(psych)
## 
## Присоединяю пакет: 'psych'
## 
## Следующие объекты скрыты от 'package:ggplot2':
## 
##     %+%, alpha
library(ggstatsplot)
## You can cite this package as:
##      Patil, I. (2021). Visualizations with statistical details: The 'ggstatsplot' approach.
##      Journal of Open Source Software, 6(61), 3167, doi:10.21105/joss.03167
library(rstatix)
## 
## Присоединяю пакет: 'rstatix'
## 
## Следующий объект скрыт от 'package:stats':
## 
##     filter
library(dplyr)

df <- read_sav("База_КлимРиск_2023.sav")

Создадим бинарную переменную, которая будет отражать наличие высшего образования

# 1-3: нет высшего, 4-5: высшее
df <- df %>%
  mutate(
    education = case_when(
      V6 %in% c(1, 2, 3) ~ "Нет высшего образования",
      V6 %in% c(4, 5) ~ "Высшее образование",
      TRUE ~ NA_character_
    ),
    education = factor(education)
  )

Создадим переменную V21

df <- df %>%
  mutate(
    confidence = factor(V21, 
                        levels = c(1, 2, 3, 4, 5),
                        labels = c("Полностью уверены", 
                                   "Скорее уверены", 
                                   "Не очень уверены", 
                                   "Совсем не уверены", 
                                   "Работающие в настоящее время"))
  )

Составим ниже таблицу сопряженности рассматриваемых нами переменных

tbl <- table(df$confidence, df$education)

# Абсолютные частоты
cat("АБСОЛЮТНЫЕ ЧАСТОТЫ:\n")
## АБСОЛЮТНЫЕ ЧАСТОТЫ:
print(tbl)
##                               
##                                Высшее образование Нет высшего образования
##   Полностью уверены                            82                      73
##   Скорее уверены                               92                      73
##   Не очень уверены                             48                      74
##   Совсем не уверены                            55                      67
##   Работающие в настоящее время                 20                      88
# Проценты по столбцам (по образованию)
cat("\nПРОЦЕНТЫ ПО СТОЛБЦАМ (по образованию):\n")
## 
## ПРОЦЕНТЫ ПО СТОЛБЦАМ (по образованию):
prop.table(tbl, 2) %>% round(3) %>% `*`(100)
##                               
##                                Высшее образование Нет высшего образования
##   Полностью уверены                          27.6                    19.5
##   Скорее уверены                             31.0                    19.5
##   Не очень уверены                           16.2                    19.7
##   Совсем не уверены                          18.5                    17.9
##   Работающие в настоящее время                6.7                    23.5
# Проценты по строкам (по уверенности)
cat("\nПРОЦЕНТЫ ПО СТРОКАМ (по уверенности):\n")
## 
## ПРОЦЕНТЫ ПО СТРОКАМ (по уверенности):
prop.table(tbl, 1) %>% round(3) %>% `*`(100)
##                               
##                                Высшее образование Нет высшего образования
##   Полностью уверены                          52.9                    47.1
##   Скорее уверены                             55.8                    44.2
##   Не очень уверены                           39.3                    60.7
##   Совсем не уверены                          45.1                    54.9
##   Работающие в настоящее время               18.5                    81.5

Образование является важным фактором, влияющим на уверенность в трудоустройстве. Люди с высшим образованием демонстрируют более высокий уровень уверенности и реже находятся в ситуации “работающих в настоящее время” (вероятно, подразумевающих временную занятость).58.6% (полностью уверены + скорее уверены) против 39% у людей без высшего образования

Проведем хи-квадрат тест

chi_test <- chisq.test(tbl)
print(chi_test)
## 
##  Pearson's Chi-squared test
## 
## data:  tbl
## X-squared = 43.783, df = 4, p-value = 7.118e-09
round(chi_test$expected, 1)
##                               
##                                Высшее образование Нет высшего образования
##   Полностью уверены                          68.5                    86.5
##   Скорее уверены                             72.9                    92.1
##   Не очень уверены                           53.9                    68.1
##   Совсем не уверены                          53.9                    68.1
##   Работающие в настоящее время               47.7                    60.3

Обнаружена высоко значимая связь между уровнем образования и уверенностью в сохранении заработка (p < 0.001). Нулевая гипотеза о независимости переменных отвергается. Данные подтверждают сделанный ранее вывод.

Построим мозаичную диаграмму

mosaicplot(tbl,
           main = "Уверенность в сохранении заработка\nпо уровню образования",
           xlab = "Уровень образования",
           ylab = "Уверенность",
           color = c("lightcoral", "lightblue", "lightgreen"),
           cex.axis = 0.8)

на данной диаграмме можно наглядно проследить доказанную ранее зависимость.

Построим ассоциативный график.

library(vcd)
## Загрузка требуемого пакета: grid
assoc(tbl, 
      shade = TRUE,
      labeling_args = list(
        set_varnames = c(confidence = "Уверенность", 
                         education = "Образование")
      ),
      main = "Ассоциативный график: Образование × Уверенность")

Гипотеза исследования подтвердилась: уровень образования действительно влияет на уверенность в сохранении заработка. Люди с высшим образованием чувствуют себя более защищенными на рынке труда и реже находятся в ситуации “работающих в настоящее время” (вероятно, подразумевающей временную или нестабильную занятость). Различия статистически значимы и не могут быть объяснены случайностью.