library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.2.0 ✔ readr 2.2.0
## ✔ forcats 1.0.1 ✔ stringr 1.6.0
## ✔ ggplot2 4.0.2 ✔ tibble 3.3.1
## ✔ lubridate 1.9.5 ✔ tidyr 1.3.2
## ✔ purrr 1.2.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(haven)
library(psych)
##
## Присоединяю пакет: 'psych'
##
## Следующие объекты скрыты от 'package:ggplot2':
##
## %+%, alpha
library(ggstatsplot)
## You can cite this package as:
## Patil, I. (2021). Visualizations with statistical details: The 'ggstatsplot' approach.
## Journal of Open Source Software, 6(61), 3167, doi:10.21105/joss.03167
library(rstatix)
##
## Присоединяю пакет: 'rstatix'
##
## Следующий объект скрыт от 'package:stats':
##
## filter
library(dplyr)
df <- read_sav("База_КлимРиск_2023.sav")
Создадим бинарную переменную, которая будет отражать наличие высшего образования
# 1-3: нет высшего, 4-5: высшее
df <- df %>%
mutate(
education = case_when(
V6 %in% c(1, 2, 3) ~ "Нет высшего образования",
V6 %in% c(4, 5) ~ "Высшее образование",
TRUE ~ NA_character_
),
education = factor(education)
)
Создадим переменную V21
df <- df %>%
mutate(
confidence = factor(V21,
levels = c(1, 2, 3, 4, 5),
labels = c("Полностью уверены",
"Скорее уверены",
"Не очень уверены",
"Совсем не уверены",
"Работающие в настоящее время"))
)
Составим ниже таблицу сопряженности рассматриваемых нами переменных
tbl <- table(df$confidence, df$education)
# Абсолютные частоты
cat("АБСОЛЮТНЫЕ ЧАСТОТЫ:\n")
## АБСОЛЮТНЫЕ ЧАСТОТЫ:
print(tbl)
##
## Высшее образование Нет высшего образования
## Полностью уверены 82 73
## Скорее уверены 92 73
## Не очень уверены 48 74
## Совсем не уверены 55 67
## Работающие в настоящее время 20 88
# Проценты по столбцам (по образованию)
cat("\nПРОЦЕНТЫ ПО СТОЛБЦАМ (по образованию):\n")
##
## ПРОЦЕНТЫ ПО СТОЛБЦАМ (по образованию):
prop.table(tbl, 2) %>% round(3) %>% `*`(100)
##
## Высшее образование Нет высшего образования
## Полностью уверены 27.6 19.5
## Скорее уверены 31.0 19.5
## Не очень уверены 16.2 19.7
## Совсем не уверены 18.5 17.9
## Работающие в настоящее время 6.7 23.5
# Проценты по строкам (по уверенности)
cat("\nПРОЦЕНТЫ ПО СТРОКАМ (по уверенности):\n")
##
## ПРОЦЕНТЫ ПО СТРОКАМ (по уверенности):
prop.table(tbl, 1) %>% round(3) %>% `*`(100)
##
## Высшее образование Нет высшего образования
## Полностью уверены 52.9 47.1
## Скорее уверены 55.8 44.2
## Не очень уверены 39.3 60.7
## Совсем не уверены 45.1 54.9
## Работающие в настоящее время 18.5 81.5
Образование является важным фактором, влияющим на уверенность в трудоустройстве. Люди с высшим образованием демонстрируют более высокий уровень уверенности и реже находятся в ситуации “работающих в настоящее время” (вероятно, подразумевающих временную занятость).58.6% (полностью уверены + скорее уверены) против 39% у людей без высшего образования
Проведем хи-квадрат тест
chi_test <- chisq.test(tbl)
print(chi_test)
##
## Pearson's Chi-squared test
##
## data: tbl
## X-squared = 43.783, df = 4, p-value = 7.118e-09
round(chi_test$expected, 1)
##
## Высшее образование Нет высшего образования
## Полностью уверены 68.5 86.5
## Скорее уверены 72.9 92.1
## Не очень уверены 53.9 68.1
## Совсем не уверены 53.9 68.1
## Работающие в настоящее время 47.7 60.3
Обнаружена высоко значимая связь между уровнем образования и уверенностью в сохранении заработка (p < 0.001). Нулевая гипотеза о независимости переменных отвергается. Данные подтверждают сделанный ранее вывод.
Построим мозаичную диаграмму
mosaicplot(tbl,
main = "Уверенность в сохранении заработка\nпо уровню образования",
xlab = "Уровень образования",
ylab = "Уверенность",
color = c("lightcoral", "lightblue", "lightgreen"),
cex.axis = 0.8)
на данной диаграмме можно наглядно проследить доказанную ранее
зависимость.
Построим ассоциативный график.
library(vcd)
## Загрузка требуемого пакета: grid
assoc(tbl,
shade = TRUE,
labeling_args = list(
set_varnames = c(confidence = "Уверенность",
education = "Образование")
),
main = "Ассоциативный график: Образование × Уверенность")
Гипотеза исследования подтвердилась: уровень образования действительно
влияет на уверенность в сохранении заработка. Люди с высшим образованием
чувствуют себя более защищенными на рынке труда и реже находятся в
ситуации “работающих в настоящее время” (вероятно, подразумевающей
временную или нестабильную занятость). Различия статистически значимы и
не могут быть объяснены случайностью.