library(ggplot2)

data <- read.csv2("StudentMotivation.csv", sep = "\t")
data$uroven_ocenok <- factor(data$uroven_ocenok, labels  = c("отличник", "хорошист+", "хорошист-", "задолженности"))

Описание выборки

Направление подготовки

table(data$Learning_area)
## 
##      музыка       театр хореография 
##          39          10          19

Возраст

mean(data$Age, na.rm = TRUE)
## [1] 20.75556
summary(data$Age)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   19.00   19.00   20.00   20.76   21.00   28.00      23

Средний возраст 20,76 (медиана 20). Минимум 19, максимум 28.

Город

table(data$City, data$Learning_area)
##                      
##                       музыка театр хореография
##                            0     1           0
##   Алма-Аты                 0     0           1
##   Ангарск                  0     0           1
##   Барнаул                  0     0           1
##   Вел. Новгород            1     0           0
##   Г.Лянтор                 0     0           1
##   Гатчина                  1     0           0
##   Гомель                   0     0           1
##   Ижевск                   0     1           0
##   Иркутск                  0     0           1
##   Калининград              1     0           0
##   Камч.край, Елизово       0     1           0
##   Кемерово                 1     0           0
##   Красноярск               1     0           0
##   Липецк                   0     0           1
##   Норильск                 0     0           1
##   Петрозаводск             1     0           0
##   Псков                    1     0           0
##   Самарканд                1     0           0
##   Симферополь              1     0           0
##   СПб                     10     0           5
##   Тыва г.Кызыл             0     0           1
##   Тюмень                   1     0           0
##   Усть-Каменогорск         1     0           0
##   Якутск                   0     0           1

Оценки

Распределение пятерок. Гистограмма. Доля пятерок от всех сданных диференцированных зачетов и экзаменов.

ggplot(data, aes(dolya_5)) +
        geom_histogram(binwidth = 0.1
                       , fill = "white"
                       , col = "black")

Распределение пятерок с разделением по направлениям. box-plot. Коробчатая диаграмма: горизонтальная линия - медиана, верх-низ ящика - второй и третий квартили (внутри 50 процентов выборки) Линии - максимум и минимум. Точки - выбросы.

ggplot(data, aes(Learning_area, dolya_5)) +
        geom_boxplot()

Распределение четвёрок

ggplot(data, aes(dolya_4)) +
        geom_histogram(binwidth = 0.1
                       , fill = "white"
                       , col = "black")

Распределение четверок с разделением по направлениям

ggplot(data, aes(Learning_area, dolya_4)) +
        geom_boxplot()

Распределение троек

ggplot(data, aes(dolya_3)) +
        geom_histogram(binwidth = 0.1
                       , fill = "white"
                       , col = "black")

Распределение четверок с разделением по направлениям

ggplot(data, aes(Learning_area, dolya_5)) +
        geom_boxplot()

table(data$Learning_area, data$uroven_ocenok)
##              
##               отличник хорошист+ хорошист- задолженности
##   музыка            13         8         3            15
##   театр              2         2         4             2
##   хореография        4         4         8             3

Потребность в достижениях

ggplot(data, aes(Potrebnost_dostigeni)) +
               geom_histogram(binwidth = 1
                              , fill = "white"
                              , col = "black")
## Warning: Removed 17 rows containing non-finite values (stat_bin).

ggplot(data, aes(Learning_area, Potrebnost_dostigeni)) +
        geom_boxplot()
## Warning: Removed 17 rows containing non-finite values (stat_boxplot).

Групповая оценка личности

ggplot(data, aes(Gr.ocenka_mean)) +
        geom_histogram(binwidth = 0.2
                , fill = "white"
                , col = "black")

Групповая оценка личности по группам

ggplot(data, aes(Learning_area, Gr.ocenka_mean)) +
        geom_boxplot()

##Мотивация Знания

ggplot(data, aes(Motiv_znaniya)) +
        geom_histogram(binwidth = 1
                , fill = "white"
                , col = "black")
## Warning: Removed 15 rows containing non-finite values (stat_bin).

ggplot(data, aes(Learning_area, Motiv_znaniya)) +
        geom_boxplot()
## Warning: Removed 15 rows containing non-finite values (stat_boxplot).

Профессия

ggplot(data, aes(Motiv_prof)) +
        geom_histogram(binwidth = 1
                , fill = "white"
                , col = "black")
## Warning: Removed 15 rows containing non-finite values (stat_bin).

ggplot(data, aes(Learning_area, Motiv_prof)) +
        geom_boxplot()
## Warning: Removed 15 rows containing non-finite values (stat_boxplot).

Диплом

ggplot(data, aes(Motiv_diplom)) +
        geom_histogram(binwidth = 1
                , fill = "white"
                , col = "black")
## Warning: Removed 15 rows containing non-finite values (stat_bin).

ggplot(data, aes(Learning_area, Motiv_diplom)) +
        geom_boxplot()
## Warning: Removed 15 rows containing non-finite values (stat_boxplot).