Вариационный анализ

Золотарёв А.А.

Вариация

Вариация значений какого-либо признака в совокупности — различие его значений у разных единиц совокупности в один и тот же период или момент времени.

Причина вариации — разные условия существования разных единиц совокупности

Порядок проведения вариационного анализа

1. Ряд распределения изображается графически

Дискретный и ранжированный ряды — в виде полигона распределения, интервальный — в виде гистограммы распределения.

Полигон распределения

Величина варьирующего признака, \( x_i \) Частота, \( f_i \)
\( x_1 \) \( f_1 \)
\( x_2 \) \( f_2 \)
\( \vdots \) \( \vdots \)
\( x_n \) \( f_n \)

Полигон распределения

deti<-0:4
chislo_semej<-c(10,18,15,5,1)
library(ggplot2)

Полигон распределения

qplot(x=deti,y=chislo_semej,geom = c("point","path"))

plot of chunk unnamed-chunk-2

Гистограмма распределения

Распределение варьирующего признака по группам, \( x_{ij} \) Частота, \( f_i \)
\( x_{1н}-x_{1к} \) \( f_1 \)
\( x_{2н}-x_{2к} \) \( f_2 \)
\( \vdots \) \( \vdots \)
\( x_{nн}-x_{nк} \) \( f_n \)

Гистограмма распределения

data(diamonds)
head(diamonds)
  carat       cut color clarity depth table price    x    y    z
1  0.23     Ideal     E     SI2  61.5    55   326 3.95 3.98 2.43
2  0.21   Premium     E     SI1  59.8    61   326 3.89 3.84 2.31
3  0.23      Good     E     VS1  56.9    65   327 4.05 4.07 2.31
4  0.29   Premium     I     VS2  62.4    58   334 4.20 4.23 2.63
5  0.31      Good     J     SI2  63.3    58   335 4.34 4.35 2.75
6  0.24 Very Good     J    VVS2  62.8    57   336 3.94 3.96 2.48

Гистограмма распределения

qplot(carat, data=diamonds,geom = "histogram")

plot of chunk unnamed-chunk-4

processing file: Variation.Rpres
stat_bin: binwidth defaulted to range/30. Use 'binwidth = x' to adjust this.
Quitting from lines 79-212 (Variation.Rpres) 
  base::parse(text = code, srcfile = NULL) : 
  2:0:   
1: round(400+100*23/33, digits = 2
   ^