Дескриптивка Среди студентов есть достаточно большое количество и тех, кто хотя бы раз в жизни пробовал безалкогольные энергетические напитки – таких опрошенных студентов 67,8 %. Причем почти половина респондентов (47,5%) признали, что за последний год также употребляли безалкогольные энергетические напитки, при том из них 32,2% потребляли данный напиток 1-5 раз. За последний месяц только 24,3% опрошенных респондентов отметили, что употребляли безалкогольные энергетические напитки, и среди них большинство (16,4 %) также употребляли их максимум 2 раза.
table(data$energ_life)
##
## 0 10-19 1-2 20-39 3-5 40 и более
## 196 50 123 28 113 48
## 6-9
## 50
608-196
## [1] 412
412/608
## [1] 0.6776316
table(data$energ_12month)
##
## 0 10-19 1-2 20-39 3-5 40 и более
## 319 37 133 10 63 11
## 6-9
## 35
(133+63)/608
## [1] 0.3223684
table(data$energ_30day)
##
## 0 10-19 1-2 20-39 3-5 40 и более
## 460 7 100 3 24 1
## 6-9
## 13
(100)/608
## [1] 0.1644737
Чуть 13,7 % респондентов употребляли безалкогольные энергетические напитки вместе с алкоголем за последни год, из которых 1-2 раза употребляли только 9% студентов, остальные - еще меньше. За последние 30 дней только 4,6% употребяли энергетики, смешанные с алкоглем, причем большинство - 3,3% - употребляли их не больше 2 раз.
table(data$alc_energ_12month)
##
## 0 10-19 1-2 20-39 3-5 6-9
## 525 5 60 1 15 2
(60)/608
## [1] 0.09868421
table(data$alc_energ_30day)
##
## 0 1-2 3-5 6-9
## 580 20 7 1
(20)/608
## [1] 0.03289474
В нашей выборке 491 девушка и 117 парней. Из опрошенных девушек 67,8% употребляли хоть раз в жизни энергетики, что приблизительно равно доле перней, употреблявших энергетики, которая = 67,5. При этом из всех студентов хоть раз за жизнь употреблявших энергетики, 80,8% - девушки, 19,2% - юноши (так как в целом в выборке девушек больше, чем юношей). 21,4% из общего числа девушек употребляли энергетики за последний месяц, при этом большинство девушек - 14,9% употребляло энергетики не больше 2 раз. 20-39 раз зафиксировали только 0,4 процента девушек. Что касается юношей, то 36,8% опрошенных юношей употребялли энергетики за последний месяц, 23% из общего числа парней выпивали энергетик за последний месяц не больше 2 раз. Тест Хи-квадрат показывает, что разница между употреблением по гендеру за год статистически значимая (p-value = 0.004423), в частности число студентов-юношей, употребивших энергетик > 40 раз за год, значительно выше ожидаемого, а число студентов-девушек, употребивших энергетик > 40 раз за год, значительно ниже ожидаемого значения. Что касается разницы в употреблении за месяц, тест Хи-квадрат также показывает значимый результат (p-value = 0.009055), при этом число студентов-юношей, не употребивших энергетик за последний месяц, значительно ниже ожидаемого, тогда как число студентов-юношей, употребивших напитки 1-5 раз и более 40 раз за последние 30 дней, значительно выше ожидаемого значения.
data4 = data
table(data3$gender)
##
## 1 2
## 79 333
79/412
## [1] 0.1917476
data4 = data %>% filter (gender == 2)
summary(data4$energ_life)
## 0 10-19 1-2 20-39 3-5 40 и более
## 158 40 104 25 95 28
## 6-9
## 41
(491-158)/491
## [1] 0.6782077
summary(data4$energ_30day)
## 0 10-19 1-2 20-39 3-5 40 и более
## 386 5 73 2 15 0
## 6-9
## 10
(2)/491
## [1] 0.00407332
data5 = data %>% filter (gender == 1)
summary(data5$energ_life)
## 0 10-19 1-2 20-39 3-5 40 и более
## 38 10 19 3 18 20
## 6-9
## 9
(117-38)/117
## [1] 0.6752137
summary(data5$energ_30day)
## 0 10-19 1-2 20-39 3-5 40 и более
## 74 2 27 1 9 1
## 6-9
## 3
(27)/117
## [1] 0.2307692
ch = chisq.test(data$energ_life, data$gender)
ch
##
## Pearson's Chi-squared test
##
## data: data$energ_life and data$gender
## X-squared = 18.851, df = 6, p-value = 0.004423
library(corrplot)
## corrplot 0.84 loaded
corrplot(ch$residuals, is.cor = FALSE)
ch = chisq.test(data$energ_30day, data$gender)
## Warning in chisq.test(data$energ_30day, data$gender): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: data$energ_30day and data$gender
## X-squared = 17.063, df = 6, p-value = 0.009055
library(corrplot)
corrplot(ch$residuals, is.cor = FALSE)
Этническая принадлежность не имеет особого значения при употреблении энергетических напитков – студенты разной этнической принадлежности почти в равнозначной мере как и употребляют, так и не употребляют данный вид напитка. Кавк др рус: Tect chi square также подтвердил этот факт (p-value = 0.7209). рус и др-p-value = 0.7817
Что касается разницы в употреблении за месяц, тест Хи-квадрат показывает значимый результат (p-value = 0.02), при этом число студентов, не относящих себя к русской этничности, употребляли энергетики 1-2 раза и более 40 раз значительно выше ожидаемого значения.
table(data$ethnicity)
##
## Другая этническая принадлежность Другие славянские народы
## 54 23
## Западноевропейские народы Кавказские народы
## 3 11
## Народы финно-угорской группы Русская/русский
## 4 506
## Тюркские народы
## 7
library(stringr)
data$ethnicity = str_replace(data$ethnicity, "Западноевропейские народы", "Другая этническая принадлежность")
data$ethnicity = str_replace(data$ethnicity, "Народы финно-угорской группы", "Другая этническая принадлежность")
data$ethnicity = str_replace(data$ethnicity, "Тюркские народы", "Другая этническая принадлежность")
data$ethnicity = str_replace(data$ethnicity, "Другие славянские народы", "Другая этническая принадлежность")
data$ethnicity = str_replace(data$ethnicity, "Кавказские народы", "Другая этническая принадлежность")
ch = chisq.test(data$energ_life, data$ethnicity)
## Warning in chisq.test(data$energ_life, data$ethnicity): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: data$energ_life and data$ethnicity
## X-squared = 3.213, df = 6, p-value = 0.7817
ch = chisq.test(data$energ_30day, data$ethnicity)
## Warning in chisq.test(data$energ_30day, data$ethnicity): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: data$energ_30day and data$ethnicity
## X-squared = 14.13, df = 6, p-value = 0.02822
library(corrplot)
что касается религии, студенты, исповедующие Ислам, реже всех употребляют энергетические напитки - только 36.36% данной группы студентов когда-либо употребляли энергетические напитки. Довольно высокий % пробоввавших энергетики среди студентов, относящих себя к категории “Другое” (такие ответы, как Адвентизм, джедаизм, Вайшнавизм, Пастафарианство и др.) - 92.3%, буддизм - 84.61%, а также среди тех, кто не относит себя ни к какой религии -72.06. Среди опрошенных студентов, придерживающих русской православной церкви, 61.3% пробовали когда-либо энергетики, что приблизительно равно доле употреблявших за жизнь среди Другая христианская религия (напр. католицизм, протестантизм) - 63.63.Наиболее активными пользователями энергетиков за последний месяц являются студенты, придерживающиеся буддизма, - 69.23% из них употребляли энергетики за последнйи месяц. Реже остальных - студенты, ответившие на вопрос “Другое” - 15.38%.
unique(data$religion)
## [1] Нет, не считаю
## [2] Русская православная
## [3] Ислам
## [4] Агностицизм
## [5] Буддизм
## [6] Другая христианская религия (напр. католицизм, протестантизм)
## [7] Неофициальное религиозное направление внутри христианской религии
## [8] Понятие бога по Спинозе.
## [9] Не определилась
## [10] К вопросу об этнической принадлежности. Внутренний мигрант. Вероисповедание - нет? Агностик?
## [11] Я не считаю себя представителем какой-либо религии
## [12] викка
## [13] Вайшнавизм
## [14] Верю в добро, истину, в "высшие силы"
## [15] Адвентизм
## [16] Пастафарианство
## [17] Светский гуманизм
## [18] джедаизм
## 18 Levels: Агностицизм Адвентизм Буддизм ... Я не считаю себя представителем какой-либо религии
data$religion = str_replace(data$religion, "Агностицизм", "Другое")
data$religion = str_replace(data$religion, "Адвентизм", "Другое")
data$religion = str_replace(data$religion, "Вайшнавизм", "Другое")
data$religion = str_replace(data$religion, "викка", "Другое")
data$religion = str_replace(data$religion, "Не определилась", "Другое")
data$religion = str_replace(data$religion, "джедаизм", "Другое")
data$religion = str_replace(data$religion, "К вопросу об этнической принадлежности. Внутренний мигрант. Вероисповедание - нет? Агностик?", "Другое")
data$religion = str_replace(data$religion, "Не определилась", "Другое")
data$religion = str_replace(data$religion, "Неофициальное религиозное направление внутри христианской религии", "Другое")
data$religion = str_replace(data$religion, "Пастафарианство", "Другое")
data$religion = str_replace(data$religion, "Понятие бога по Спинозе.", "Другое")
data$religion = str_replace(data$religion, "Светский гуманизм", "Другое")
data$religion = str_replace(data$religion, "Я не считаю себя представителем какой-либо религии", "Нет, не считаю")
data$religion = str_replace(data$religion, "К вопросу об этнической принадлежности. Внутренний мигрант. Вероисповедание - нет? Агностик?", "Нет, не считаю")
datarel = data %>% filter(religion == "Русская православная" | religion == "Нет, не считаю" | religion == "Ислам" | religion == "Другое" | religion == "Другая христианская религия (напр. католицизм, протестантизм)" | religion == "Буддизм" )
ch = chisq.test(datarel$energ_life, datarel$religion)
## Warning in chisq.test(datarel$energ_life, datarel$religion): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: datarel$energ_life and datarel$religion
## X-squared = 54.436, df = 30, p-value = 0.00411
unique(datarel$religion)
## [1] "Нет, не считаю"
## [2] "Русская православная"
## [3] "Ислам"
## [4] "Другое"
## [5] "Буддизм"
## [6] "Другая христианская религия (напр. католицизм, протестантизм)"
datanorel = datarel %>% filter(religion == "Нет, не считаю")
summary(datanorel$energ_life) #(315-88)/315 = 72.06
## 0 10-19 1-2 20-39 3-5 40 и более
## 88 24 71 22 60 26
## 6-9
## 24
summary(datanorel$energ_30day) #(315-226)/315 = 28.25
## 0 10-19 1-2 20-39 3-5 40 и более
## 226 5 56 2 16 0
## 6-9
## 10
dataprav = datarel %>% filter(religion == "Русская православная")
summary(dataprav$energ_life) #(243-94)/243 = 61.3
## 0 10-19 1-2 20-39 3-5 40 и более
## 94 20 46 5 46 12
## 6-9
## 20
summary(dataprav$energ_30day) #(243-202)/243=16.87
## 0 10-19 1-2 20-39 3-5 40 и более
## 202 1 33 1 5 0
## 6-9
## 1
dataisl = datarel %>% filter(religion == "Ислам")
summary(dataisl$energ_life) #(11-7)/11 = 36.36
## 0 10-19 1-2 20-39 3-5 40 и более
## 7 0 0 0 1 3
## 6-9
## 0
summary(dataisl$energ_30day) #(11-8)/11 = 27.27
## 0 10-19 1-2 20-39 3-5 40 и более
## 8 0 1 0 1 1
## 6-9
## 0
datadrrel = datarel %>% filter(religion == "Другое")
summary(datadrrel$energ_life)#12/13 = 0.9230769
## 0 10-19 1-2 20-39 3-5 40 и более
## 1 2 1 0 3 2
## 6-9
## 4
summary(datadrrel$energ_30day)#2/13 = 15.38
## 0 10-19 1-2 20-39 3-5 40 и более
## 10 0 2 0 1 0
## 6-9
## 0
datadrchris = datarel %>% filter(religion == "Другая христианская религия (напр. католицизм, протестантизм)")
summary(datadrchris$energ_life)#7/11 = 63.63
## 0 10-19 1-2 20-39 3-5 40 и более
## 4 2 0 1 1 2
## 6-9
## 1
summary(datadrchris$energ_30day)#2/11 = 18.18
## 0 10-19 1-2 20-39 3-5 40 и более
## 9 0 1 0 0 0
## 6-9
## 1
databud = datarel %>% filter(religion == "Буддизм")
summary(databud$energ_life) #11/13 = 84.61
## 0 10-19 1-2 20-39 3-5 40 и более
## 2 2 4 0 2 2
## 6-9
## 1
summary(databud$energ_30day)#9/13 = 69.23
## 0 10-19 1-2 20-39 3-5 40 и более
## 4 1 6 0 1 0
## 6-9
## 1
Что касается оцениваемого уровня дохода, то он почти не влияет на употребление энергетическийх напитков за жизнь. Доли когда-либо пробовавших энергетические напитки среди всех уровней приблизительно равны и варьируются от 59.09 до 75.14. Тест Хи-квадрат также подвтерждает, что зависимость между переменными слабая (p-value = 0.078). Если говорить об актуальном потреблении, то наибольшая доля употреблявших среди респондентов, ответивших, что они Живут от зарплаты до зарплаты, иногда не хватает на самое необходимое, и равна 42.37. Наименьшая доля употреблявших за последний месяц приходится на тех, кто В настоящее время могжет ни в чем себе не отказывать (18.18). Анализ теста Хи-квадрат подтверждает, что связь между актуальным употреблением и оцениваемым уровнем дохода имеется.
[1] Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования. [2] На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.
[3] В принципе, могу накопить на квартиру или автомобиль.
[4] Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.
[5] В настоящее время могу ни в чем себе не отказывать.
unique(data$income_est)
## [1] Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования.
## [2] На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.
## [3] В принципе, могу накопить на квартиру или автомобиль.
## [4] Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.
## [5] В настоящее время могу ни в чем себе не отказывать.
## 5 Levels: В настоящее время могу ни в чем себе не отказывать. ...
inc1 = data %>% filter(income_est == "Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования.")
summary(inc1$energ_life) #(335-118)/335 = 64.77
## 0 10-19 1-2 20-39 3-5 40 и более
## 118 23 71 15 57 22
## 6-9
## 29
summary(inc1$energ_30day) #(335-262)/335 = 21.79
## 0 10-19 1-2 20-39 3-5 40 и более
## 262 6 48 1 11 0
## 6-9
## 7
inc2 = data %>% filter(income_est == "На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.")
summary(inc2$energ_life) #(173-43)/173 = 75.14
## 0 10-19 1-2 20-39 3-5 40 и более
## 43 24 31 7 40 12
## 6-9
## 16
summary(inc2$energ_30day) #(173-134)/173 = 22.54
## 0 10-19 1-2 20-39 3-5 40 и более
## 134 1 30 1 5 0
## 6-9
## 2
inc3 = data %>% filter(income_est == "В принципе, могу накопить на квартиру или автомобиль.")
summary(inc3$energ_life) #(19-6)/19 = 68.42
## 0 10-19 1-2 20-39 3-5 40 и более
## 6 0 1 1 5 4
## 6-9
## 2
summary(inc3$energ_30day) #(19-12)/19 = 36.84
## 0 10-19 1-2 20-39 3-5 40 и более
## 12 0 4 1 2 0
## 6-9
## 0
inc4 = data %>% filter(income_est == "Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.")
summary(inc4$energ_life) #(59-20)/59 = 66.1
## 0 10-19 1-2 20-39 3-5 40 и более
## 20 3 14 4 9 7
## 6-9
## 2
summary(inc4$energ_30day) #(59-34)/59 = 42.37
## 0 10-19 1-2 20-39 3-5 40 и более
## 34 0 15 0 5 1
## 6-9
## 4
inc5 = data %>% filter(income_est == "В настоящее время могу ни в чем себе не отказывать.")
summary(inc5$energ_life) #(22-9)/22 = 59.09
## 0 10-19 1-2 20-39 3-5 40 и более
## 9 0 6 1 2 3
## 6-9
## 1
summary(inc5$energ_30day) #(22-18)/22 = 18.18
## 0 10-19 1-2 20-39 3-5 40 и более
## 18 0 3 0 1 0
## 6-9
## 0
ch = chisq.test(data$income_est, data$energ_life)
## Warning in chisq.test(data$income_est, data$energ_life): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: data$income_est and data$energ_life
## X-squared = 34.385, df = 24, p-value = 0.07806
corrplot(ch$residuals, is.cor = FALSE)
## Warning in corrplot(ch$residuals, is.cor = FALSE): Not been able to
## calculate text margin, please try again with a clean new empty window using
## {plot.new(); dev.off()} or reduce tl.cex
ch = chisq.test(data$income_est, data$energ_30day)
## Warning in chisq.test(data$income_est, data$energ_30day): Chi-squared
## approximation may be incorrect
ch
##
## Pearson's Chi-squared test
##
## data: data$income_est and data$energ_30day
## X-squared = 42.86, df = 24, p-value = 0.01032
??? работа
unique(data$job)
## [1] нет да
## Levels: да нет
jobyes = data %>% filter(job == "да")
summary(jobyes$energ_life) #(195-51)/195 = 73.85
## 0 10-19 1-2 20-39 3-5 40 и более
## 51 21 33 15 39 16
## 6-9
## 20
summary(jobyes$energ_30day)#(195-144)/195 = 26.15
## 0 10-19 1-2 20-39 3-5 40 и более
## 144 4 34 1 6 1
## 6-9
## 5
jobno = data %>% filter(job == "нет")
summary(jobno$energ_life) #(413-145)/413= 64.89
## 0 10-19 1-2 20-39 3-5 40 и более
## 145 29 90 13 74 32
## 6-9
## 30
summary(jobno$energ_30day) #(413-316)/413= 23.49
## 0 10-19 1-2 20-39 3-5 40 и более
## 316 3 66 2 18 0
## 6-9
## 8
ch = chisq.test(data$job, data$energ_life)
ch
##
## Pearson's Chi-squared test
##
## data: data$job and data$energ_life
## X-squared = 14.836, df = 6, p-value = 0.02157
corrplot(ch$residuals, is.cor = FALSE) #p-value = 0.02157
ch = chisq.test(data$job, data$energ_30day)
## Warning in chisq.test(data$job, data$energ_30day): Chi-squared
## approximation may be incorrect
ch #p-value = 0.5148
##
## Pearson's Chi-squared test
##
## data: data$job and data$energ_30day
## X-squared = 5.2294, df = 6, p-value = 0.5148
unique(data$bad_habits)
## [1] да нет
## Levels: да нет
habyes = data %>% filter(bad_habits == "да")
summary(habyes$energ_life) #(218-42)/218 = 80.73
## 0 10-19 1-2 20-39 3-5 40 и более
## 42 27 35 16 38 35
## 6-9
## 25
summary(habyes$energ_30day)#(218-141)/218 = 35.32
## 0 10-19 1-2 20-39 3-5 40 и более
## 141 6 46 2 16 0
## 6-9
## 7
habno = data %>% filter(bad_habits == "нет")
summary(habno$energ_life) #(390-154)/390= 60.51
## 0 10-19 1-2 20-39 3-5 40 и более
## 154 23 88 12 75 13
## 6-9
## 25
summary(habno$energ_30day) #(390-319)/390= 18.21
## 0 10-19 1-2 20-39 3-5 40 и более
## 319 1 54 1 8 1
## 6-9
## 6
ch = chisq.test(data$bad_habits, data$energ_life)
ch #p-value = 2.033e-12
##
## Pearson's Chi-squared test
##
## data: data$bad_habits and data$energ_life
## X-squared = 66.599, df = 6, p-value = 2.033e-12
corrplot(ch$residuals, is.cor = FALSE)
ch = chisq.test(data$bad_habits, data$energ_30day)
## Warning in chisq.test(data$bad_habits, data$energ_30day): Chi-squared
## approximation may be incorrect
ch #p-value = 2.548e-05
##
## Pearson's Chi-squared test
##
## data: data$bad_habits and data$energ_30day
## X-squared = 30.989, df = 6, p-value = 2.548e-05
corrplot(ch$residuals, is.cor = FALSE)
unique(data$ac_perform)
## [1] Отличную Хорошую Удовлетворительную
## [4] Неудовлетворительную
## Levels: Неудовлетворительную Отличную Удовлетворительную Хорошую
ch = chisq.test(data$ac_perform, data$energ_life)
## Warning in chisq.test(data$ac_perform, data$energ_life): Chi-squared
## approximation may be incorrect
ch #p-value = p-value = 0.004684
##
## Pearson's Chi-squared test
##
## data: data$ac_perform and data$energ_life
## X-squared = 37.373, df = 18, p-value = 0.004684
ch = chisq.test(data$ac_perform, data$energ_30day)
## Warning in chisq.test(data$ac_perform, data$energ_30day): Chi-squared
## approximation may be incorrect
ch #p-value = 3.22e-05
##
## Pearson's Chi-squared test
##
## data: data$ac_perform and data$energ_30day
## X-squared = 52.424, df = 18, p-value = 3.22e-05
ac1 = data %>% filter(ac_perform == "Отличную")
summary(ac1$energ_life) #(115-44)/115 = 64.77
## 0 10-19 1-2 20-39 3-5 40 и более
## 44 11 19 7 22 4
## 6-9
## 8
summary(ac1$energ_30day) #(115-92)/115 = 20.0
## 0 10-19 1-2 20-39 3-5 40 и более
## 92 1 17 0 3 0
## 6-9
## 2
ac2 = data %>% filter(ac_perform == "Хорошую")
summary(ac2$energ_life) #(351-121)/351 = 65.53
## 0 10-19 1-2 20-39 3-5 40 и более
## 121 24 80 12 65 23
## 6-9
## 26
summary(ac2$energ_30day) #(351-276)/351 = 21.37
## 0 10-19 1-2 20-39 3-5 40 и более
## 276 5 47 2 11 0
## 6-9
## 10
ac3 = data %>% filter(ac_perform == "Удовлетворительную")
summary(ac3$energ_life) #(132-31)/132 = 76.52
## 0 10-19 1-2 20-39 3-5 40 и более
## 31 14 24 8 23 19
## 6-9
## 13
summary(ac3$energ_30day) #(132-87)/132 = 34.09
## 0 10-19 1-2 20-39 3-5 40 и более
## 87 0 33 0 10 1
## 6-9
## 1
ac4 = data %>% filter(ac_perform == "Неудовлетворительную")
summary(ac4$energ_life) #(10-0)/10 = 100
## 0 10-19 1-2 20-39 3-5 40 и более
## 0 1 0 1 3 2
## 6-9
## 3
summary(ac4$energ_30day) #(10-5)/10 = 50
## 0 10-19 1-2 20-39 3-5 40 и более
## 5 1 3 1 0 0
## 6-9
## 0
unique(data$study_contract)
## [1] договорная бюджетная
## Levels: бюджетная договорная
ch = chisq.test(data$study_contract, data$energ_life)
ch #p-value = 0.8027
##
## Pearson's Chi-squared test
##
## data: data$study_contract and data$energ_life
## X-squared = 3.0491, df = 6, p-value = 0.8027
ch = chisq.test(data$study_contract, data$energ_30day)
## Warning in chisq.test(data$study_contract, data$energ_30day): Chi-squared
## approximation may be incorrect
ch #p-value = 0.1627
##
## Pearson's Chi-squared test
##
## data: data$study_contract and data$energ_30day
## X-squared = 9.1983, df = 6, p-value = 0.1627
bud = data %>% filter(study_contract == "бюджетная")
summary(bud$energ_life) #(306-102)/306 = 66.67
## 0 10-19 1-2 20-39 3-5 40 и более
## 102 25 56 15 57 22
## 6-9
## 29
summary(bud$energ_30day)#(306-242)/306 = 20.92
## 0 10-19 1-2 20-39 3-5 40 и более
## 242 4 42 2 13 0
## 6-9
## 3
contr = data %>% filter(study_contract == "договорная")
summary(contr$energ_life) #(302-154)/302= 49.0
## 0 10-19 1-2 20-39 3-5 40 и более
## 94 25 67 13 56 26
## 6-9
## 21
summary(contr$energ_30day) #(302-218)/302 = 27.81
## 0 10-19 1-2 20-39 3-5 40 и более
## 218 3 58 1 11 1
## 6-9
## 10
регрессионный анализ
energ1 = data %>% filter(religion == "Русская православная" | religion == "Нет, не считаю" | religion == "Ислам" | religion == "Другое" | religion == "Другая христианская религия (напр. католицизм, протестантизм)" | religion == "Буддизм" )
energ1$religion = as.factor(energ1$religion)
energ1$energ_life = str_replace(energ1$energ_life, "10-19", "1")
energ1$energ_life = str_replace(energ1$energ_life, "3-5", "1")
energ1$energ_life = str_replace(energ1$energ_life, "20-39", "1")
energ1$energ_life = str_replace(energ1$energ_life, "1-2", "1")
energ1$energ_life = str_replace(energ1$energ_life, "40 и более", "1")
energ1$energ_life = str_replace(energ1$energ_life, "6-9", "1")
energ1$energ_life = as.factor(energ1$energ_life)
unique(energ1$ac_perform)
## [1] Отличную Хорошую Удовлетворительную
## [4] Неудовлетворительную
## Levels: Неудовлетворительную Отличную Удовлетворительную Хорошую
energ1$ac_perform = str_replace(energ1$ac_perform, "Неудовлетворительную", "1")
energ1$ac_perform = str_replace(energ1$ac_perform, "Удовлетворительную", "2")
energ1$ac_perform = str_replace(energ1$ac_perform, "Хорошую", "3")
energ1$ac_perform = str_replace(energ1$ac_perform, "Отличную", "4")
energ1$ac_perform = as.numeric(energ1$ac_perform )
energ1$income_est = str_replace(energ1$income_est, "Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования.", "3")
energ1$income_est = str_replace(energ1$income_est, "На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.", "2")
energ1$income_est = str_replace(energ1$income_est, "В принципе, могу накопить на квартиру или автомобиль.", "4")
energ1$income_est = str_replace(energ1$income_est, "Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.", "1")
energ1$income_est = str_replace(energ1$income_est, "В настоящее время могу ни в чем себе не отказывать.", "5")
energ1$income_est = as.numeric(energ1$income_est)
energ1$ethnicity = as.factor(energ1$ethnicity)
energ1$sig_life = str_replace(energ1$sig_life, "10-19", "1")
energ1$sig_life = str_replace(energ1$sig_life, "3-5", "1")
energ1$sig_life = str_replace(energ1$sig_life, "20-39", "1")
energ1$sig_life = str_replace(energ1$sig_life, "1-2", "1")
energ1$sig_life = str_replace(energ1$sig_life, "40 и более", "1")
energ1$sig_life = str_replace(energ1$sig_life, "6-9", "1")
energ1$sig_life = as.factor(energ1$sig_life)
energ1$alc_life = str_replace(energ1$alc_life, "10-19", "1")
energ1$alc_life = str_replace(energ1$alc_life, "3-5", "1")
energ1$alc_life = str_replace(energ1$alc_life, "20-39", "1")
energ1$alc_life = str_replace(energ1$alc_life, "1-2", "1")
energ1$alc_life = str_replace(energ1$alc_life, "40 и более", "1")
energ1$alc_life = str_replace(energ1$alc_life, "6-9", "1")
energ1$alc_life = as.factor(energ1$alc_life)
energ1$gender = as.factor(energ1$gender)
model1 = glm(energ_life ~ gender + age + job + bad_habits + ac_perform + income_est + religion + ethnicity + study_contract + sig_life + alc_life, data = energ1, family = "binomial")
summary(model1)
##
## Call:
## glm(formula = energ_life ~ gender + age + job + bad_habits +
## ac_perform + income_est + religion + ethnicity + study_contract +
## sig_life + alc_life, family = "binomial", data = energ1)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.2416 -0.8908 0.5417 0.7163 1.9453
##
## Coefficients:
## Estimate
## (Intercept) -0.89778
## gender2 0.30962
## age 0.06333
## jobнет -0.14058
## bad_habitsнет -0.27961
## ac_perform -0.16065
## income_est -0.13646
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.45605
## religionДругое 0.87490
## religionИслам -1.48778
## religionНет, не считаю -0.69624
## religionРусская православная -1.20874
## ethnicityРусская/русский 0.04002
## study_contractдоговорная 0.29685
## sig_life1 1.41892
## alc_life1 1.37158
## Std. Error
## (Intercept) 1.96641
## gender2 0.27156
## age 0.07893
## jobнет 0.23270
## bad_habitsнет 0.23921
## ac_perform 0.16306
## income_est 0.11985
## religionДругая христианская религия (напр. католицизм, протестантизм) 1.08678
## religionДругое 1.43302
## religionИслам 1.09472
## religionНет, не считаю 0.82555
## religionРусская православная 0.83110
## ethnicityРусская/русский 0.30916
## study_contractдоговорная 0.21108
## sig_life1 0.22077
## alc_life1 0.35876
## z value
## (Intercept) -0.457
## gender2 1.140
## age 0.802
## jobнет -0.604
## bad_habitsнет -1.169
## ac_perform -0.985
## income_est -1.139
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.340
## religionДругое 0.611
## religionИслам -1.359
## religionНет, не считаю -0.843
## religionРусская православная -1.454
## ethnicityРусская/русский 0.129
## study_contractдоговорная 1.406
## sig_life1 6.427
## alc_life1 3.823
## Pr(>|z|)
## (Intercept) 0.647987
## gender2 0.254224
## age 0.422362
## jobнет 0.545747
## bad_habitsнет 0.242439
## ac_perform 0.324510
## income_est 0.254871
## religionДругая христианская религия (напр. католицизм, протестантизм) 0.180316
## religionДругое 0.541511
## religionИслам 0.174133
## religionНет, не считаю 0.399024
## religionРусская православная 0.145841
## ethnicityРусская/русский 0.897010
## study_contractдоговорная 0.159622
## sig_life1 1.3e-10
## alc_life1 0.000132
##
## (Intercept)
## gender2
## age
## jobнет
## bad_habitsнет
## ac_perform
## income_est
## religionДругая христианская религия (напр. католицизм, протестантизм)
## religionДругое
## religionИслам
## religionНет, не считаю
## religionРусская православная
## ethnicityРусская/русский
## study_contractдоговорная
## sig_life1 ***
## alc_life1 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 762.87 on 605 degrees of freedom
## Residual deviance: 622.19 on 590 degrees of freedom
## AIC: 654.19
##
## Number of Fisher Scoring iterations: 5
energ1 = data %>% filter(religion == "Русская православная" | religion == "Нет, не считаю" | religion == "Ислам" | religion == "Другое" | religion == "Другая христианская религия (напр. католицизм, протестантизм)" | religion == "Буддизм" )
energ1$religion = as.factor(energ1$religion)
energ1$energ_30day = str_replace(energ1$energ_30day, "10-19", "1")
energ1$energ_30day = str_replace(energ1$energ_30day, "3-5", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "20-39", "1")
energ1$energ_30day = str_replace(energ1$energ_30day, "1-2", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "40 и более", "1")
energ1$energ_30day = str_replace(energ1$energ_30day, "6-9", "1")
energ1$energ_30day = as.factor(energ1$energ_30day)
unique(energ1$ac_perform)
## [1] Отличную Хорошую Удовлетворительную
## [4] Неудовлетворительную
## Levels: Неудовлетворительную Отличную Удовлетворительную Хорошую
energ1$ac_perform = str_replace(energ1$ac_perform, "Неудовлетворительную", "1")
energ1$ac_perform = str_replace(energ1$ac_perform, "Удовлетворительную", "2")
energ1$ac_perform = str_replace(energ1$ac_perform, "Хорошую", "3")
energ1$ac_perform = str_replace(energ1$ac_perform, "Отличную", "4")
energ1$ac_perform = as.numeric(energ1$ac_perform )
energ1$income_est = str_replace(energ1$income_est, "Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования.", "3")
energ1$income_est = str_replace(energ1$income_est, "На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.", "2")
energ1$income_est = str_replace(energ1$income_est, "В принципе, могу накопить на квартиру или автомобиль.", "4")
energ1$income_est = str_replace(energ1$income_est, "Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.", "1")
energ1$income_est = str_replace(energ1$income_est, "В настоящее время могу ни в чем себе не отказывать.", "5")
energ1$income_est = as.numeric(energ1$income_est)
energ1$ethnicity = as.factor(energ1$ethnicity)
energ1$sig_30day = str_replace(energ1$sig_30day, "10-19", "1")
energ1$sig_30day = str_replace(energ1$sig_30day, "3-5", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "20-39", "1")
energ1$sig_30day = str_replace(energ1$sig_30day, "1-2", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "40 и более", "1")
energ1$sig_30day = str_replace(energ1$sig_30day, "6-9", "1")
energ1$sig_30day = as.factor(energ1$sig_30day)
energ1$alc_30day = str_replace(energ1$alc_30day, "10-19", "1")
energ1$alc_30day = str_replace(energ1$alc_30day, "3-5", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "20-39", "1")
energ1$alc_30day = str_replace(energ1$alc_30day, "1-2", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "40 и более", "1")
energ1$alc_30day = str_replace(energ1$alc_30day, "6-9", "1")
energ1$alc_30day = as.factor(energ1$alc_30day)
energ1$gender = as.factor(energ1$gender)
model2 = glm(energ_life ~ gender + age + job + bad_habits + ac_perform + income_est + religion + ethnicity + study_contract + sig_30day + alc_30day, data = energ1, family = "binomial")
summary(model2)
##
## Call:
## glm(formula = energ_life ~ gender + age + job + bad_habits +
## ac_perform + income_est + religion + ethnicity + study_contract +
## sig_30day + alc_30day, family = "binomial", data = energ1)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.5989 -1.1888 0.5312 0.9506 1.6169
##
## Coefficients:
## Estimate
## (Intercept) 0.46921
## gender2 0.35970
## age 0.10169
## jobнет -0.22014
## bad_habitsнет -0.29792
## ac_perform -0.32696
## income_est -0.13749
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.39396
## religionДругое 0.42722
## religionИслам -1.73969
## religionНет, не считаю -0.82972
## religionРусская православная -1.24574
## ethnicityРусская/русский 0.46822
## study_contractдоговорная 0.14094
## sig_30day1 1.42306
## alc_30day1 0.96272
## Std. Error
## (Intercept) 1.79201
## gender2 0.25496
## age 0.07324
## jobнет 0.22028
## bad_habitsнет 0.23418
## ac_perform 0.15461
## income_est 0.11098
## religionДругая христианская религия (напр. католицизм, протестантизм) 1.07499
## religionДругое 1.33677
## religionИслам 1.04107
## religionНет, не считаю 0.81545
## religionРусская православная 0.82116
## ethnicityРусская/русский 0.27496
## study_contractдоговорная 0.19673
## sig_30day1 0.37638
## alc_30day1 0.47133
## z value
## (Intercept) 0.262
## gender2 1.411
## age 1.389
## jobнет -0.999
## bad_habitsнет -1.272
## ac_perform -2.115
## income_est -1.239
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.297
## religionДругое 0.320
## religionИслам -1.671
## religionНет, не считаю -1.017
## religionРусская православная -1.517
## ethnicityРусская/русский 1.703
## study_contractдоговорная 0.716
## sig_30day1 3.781
## alc_30day1 2.043
## Pr(>|z|)
## (Intercept) 0.793450
## gender2 0.158292
## age 0.164981
## jobнет 0.317616
## bad_habitsнет 0.203307
## ac_perform 0.034450
## income_est 0.215413
## religionДругая христианская религия (напр. католицизм, протестантизм) 0.194728
## religionДругое 0.749278
## religionИслам 0.094711
## religionНет, не считаю 0.308919
## religionРусская православная 0.129252
## ethnicityРусская/русский 0.088591
## study_contractдоговорная 0.473731
## sig_30day1 0.000156
## alc_30day1 0.041097
##
## (Intercept)
## gender2
## age
## jobнет
## bad_habitsнет
## ac_perform *
## income_est
## religionДругая христианская религия (напр. католицизм, протестантизм)
## religionДругое
## religionИслам .
## religionНет, не считаю
## religionРусская православная
## ethnicityРусская/русский .
## study_contractдоговорная
## sig_30day1 ***
## alc_30day1 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 762.87 on 605 degrees of freedom
## Residual deviance: 681.12 on 590 degrees of freedom
## AIC: 713.12
##
## Number of Fisher Scoring iterations: 5
energ1 = data %>% filter(religion == "Русская православная" | religion == "Нет, не считаю" | religion == "Ислам" | religion == "Другое" | religion == "Другая христианская религия (напр. католицизм, протестантизм)" | religion == "Буддизм" )
energ1$religion = as.factor(energ1$religion)
energ1$energ_30day = str_replace(energ1$energ_30day, "10-19", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "3-5", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "20-39", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "1-2", "0")
energ1$energ_30day = str_replace(energ1$energ_30day, "40 и более", "1")
energ1$energ_30day = str_replace(energ1$energ_30day, "6-9", "0")
energ1$energ_30day = as.factor(energ1$energ_30day)
unique(energ1$ac_perform)
## [1] Отличную Хорошую Удовлетворительную
## [4] Неудовлетворительную
## Levels: Неудовлетворительную Отличную Удовлетворительную Хорошую
energ1$ac_perform = str_replace(energ1$ac_perform, "Неудовлетворительную", "1")
energ1$ac_perform = str_replace(energ1$ac_perform, "Удовлетворительную", "2")
energ1$ac_perform = str_replace(energ1$ac_perform, "Хорошую", "3")
energ1$ac_perform = str_replace(energ1$ac_perform, "Отличную", "4")
energ1$ac_perform = as.numeric(energ1$ac_perform )
energ1$income_est = str_replace(energ1$income_est, "Дохода хватает на нормальную жизнь, можно кое-что откладывать, в том числе, для приобретения вещей длительного пользования.", "3")
energ1$income_est = str_replace(energ1$income_est, "На ежедневные расходы денег хватает, но покупка одежды и обуви уже проблематична.", "2")
energ1$income_est = str_replace(energ1$income_est, "В принципе, могу накопить на квартиру или автомобиль.", "4")
energ1$income_est = str_replace(energ1$income_est, "Живу от зарплаты до зарплаты, иногда не хватает на самое необходимое.", "1")
energ1$income_est = str_replace(energ1$income_est, "В настоящее время могу ни в чем себе не отказывать.", "5")
energ1$income_est = as.numeric(energ1$income_est)
energ1$ethnicity = as.factor(energ1$ethnicity)
energ1$sig_30day = str_replace(energ1$sig_30day, "10-19", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "3-5", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "20-39", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "1-2", "0")
energ1$sig_30day = str_replace(energ1$sig_30day, "40 и более", "1")
energ1$sig_30day = str_replace(energ1$sig_30day, "6-9", "0")
energ1$sig_30day = as.factor(energ1$sig_30day)
energ1$alc_30day = str_replace(energ1$alc_30day, "10-19", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "3-5", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "20-39", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "1-2", "0")
energ1$alc_30day = str_replace(energ1$alc_30day, "40 и более", "1")
energ1$alc_30day = str_replace(energ1$alc_30day, "6-9", "0")
energ1$alc_30day = as.factor(energ1$alc_30day)
energ1$gender = as.factor(energ1$gender)
model3 = glm(energ_life ~ gender + age + job + bad_habits + ac_perform + income_est + religion + ethnicity + study_contract + sig_30day + alc_30day, data = energ1, family = "binomial")
summary(model3)
##
## Call:
## glm(formula = energ_life ~ gender + age + job + bad_habits +
## ac_perform + income_est + religion + ethnicity + study_contract +
## sig_30day + alc_30day, family = "binomial", data = energ1)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.6735 -1.2154 0.6736 0.9416 1.6427
##
## Coefficients:
## Estimate
## (Intercept) 0.81090
## gender2 0.39828
## age 0.09208
## jobнет -0.23455
## bad_habitsнет -0.57699
## ac_perform -0.29315
## income_est -0.13842
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.21696
## religionДругое 0.85191
## religionИслам -1.77997
## religionНет, не считаю -0.66296
## religionРусская православная -1.06818
## ethnicityРусская/русский 0.36891
## study_contractдоговорная 0.09408
## sig_30day1 1.80454
## alc_30day1 12.60344
## Std. Error
## (Intercept) 1.78285
## gender2 0.25125
## age 0.07274
## jobнет 0.21777
## bad_habitsнет 0.21912
## ac_perform 0.15036
## income_est 0.10993
## religionДругая христианская религия (напр. католицизм, протестантизм) 1.07409
## religionДругое 1.33666
## religionИслам 1.05062
## religionНет, не считаю 0.81796
## religionРусская православная 0.82350
## ethnicityРусская/русский 0.26864
## study_contractдоговорная 0.19407
## sig_30day1 0.62328
## alc_30day1 462.77472
## z value
## (Intercept) 0.455
## gender2 1.585
## age 1.266
## jobнет -1.077
## bad_habitsнет -2.633
## ac_perform -1.950
## income_est -1.259
## religionДругая христианская религия (напр. католицизм, протестантизм) -1.133
## religionДругое 0.637
## religionИслам -1.694
## religionНет, не считаю -0.811
## religionРусская православная -1.297
## ethnicityРусская/русский 1.373
## study_contractдоговорная 0.485
## sig_30day1 2.895
## alc_30day1 0.027
## Pr(>|z|)
## (Intercept) 0.64923
## gender2 0.11292
## age 0.20554
## jobнет 0.28146
## bad_habitsнет 0.00846
## ac_perform 0.05122
## income_est 0.20795
## religionДругая христианская религия (напр. католицизм, протестантизм) 0.25721
## religionДругое 0.52390
## religionИслам 0.09023
## religionНет, не считаю 0.41765
## religionРусская православная 0.19459
## ethnicityРусская/русский 0.16968
## study_contractдоговорная 0.62785
## sig_30day1 0.00379
## alc_30day1 0.97827
##
## (Intercept)
## gender2
## age
## jobнет
## bad_habitsнет **
## ac_perform .
## income_est
## religionДругая христианская религия (напр. католицизм, протестантизм)
## religionДругое
## religionИслам .
## religionНет, не считаю
## religionРусская православная
## ethnicityРусская/русский
## study_contractдоговорная
## sig_30day1 **
## alc_30day1
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 762.87 on 605 degrees of freedom
## Residual deviance: 693.64 on 590 degrees of freedom
## AIC: 725.64
##
## Number of Fisher Scoring iterations: 13