Проведём анализ равенства двух дисперсий:

## 
##  F test to compare two variances
## 
## data:  x and y
## F = 1.0747, num df = 49, denom df = 49, p-value = 0.8018
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.6098928 1.8939053
## sample estimates:
## ratio of variances 
##           1.074746

Так как p-value=0.8018, то есть больше \(\alpha\)=0.05, то гипотеза Hо о равенстве дисперсий генеральных совокупностей не отвергается на уровне значимости \(\alpha\)=0.05. Кроме того, интервальная оценка включает в себя единицу(от 0.6099 до 1.894).

Проверим через F-критическое:

## [1] 1.607289

Fкр.=1.607, а Fнабл.=1.0747

Так как Fнабл < Fкр, то гипотеза Hо о равенстве дисперсий генеральных совокупностей не отвергается на уровне значимости \(\alpha\)=0.05

Теперь проведём тесты на равенство средних:

Сделаем это для первой части выборки.

Оценим среднее значение.

##  num [1:50] 109 102 104 103 104 ...
## [1] 103.578

Как мы видим, среднее значение из совокупности X равно 103.578.

Проверим Ho: \(\mu\)=104

Первый тест на равенство средней совокупности-параметрический тест(t-тест Стьюдента).

## 
##  One Sample t-test
## 
## data:  x
## t = -1.4992, df = 49, p-value = 0.1402
## alternative hypothesis: true mean is not equal to 104
## 95 percent confidence interval:
##  103.0123 104.1437
## sample estimates:
## mean of x 
##   103.578

Как мы видим, p-value=0.1402, что больше \(\alpha\)=0.05.Значит, гипотеза Ho: \(\mu\)=104 не отвергается на уровне значимости \(\alpha\)=0.05.

Доверительный интервал для генеральной средней:

P(103.023<\(\mu\) <104.1437)

Содержит проверяемое значение.

Аналогично сделаем для второй части выборки.

Оценим среднее значение.

##  num [1:50] 101 103 103 102 106 ...
## [1] 103.452

Как мы видим, среднее значение из совокупности X равно 103.452. Проверим Ho: \(\mu\)=104

Первый тест на равенство средней совокупности-параметрический тест(t-тест Стьюдента).

## 
##  One Sample t-test
## 
## data:  y
## t = -2.0182, df = 49, p-value = 0.04906
## alternative hypothesis: true mean is not equal to 104
## 95 percent confidence interval:
##  102.9064 103.9976
## sample estimates:
## mean of x 
##   103.452

Как мы видим, p-value=0.04906, что меньше \(\alpha\)=0.05.Значит, гипотеза Ho: \(\mu\)=104 отвергается с вероятностью ошибки \(\alpha\)=0.05.

Доверительный интервал для генеральной средней:

P(102.9064<\(\mu\) <103.9976)

Не содержит проверяемое значение.

Сравнение средних двух независимых нормально распределенных совокупностей -параметрический тест (t-тест Стьюдента)

## 
##  Two Sample t-test
## 
## data:  x and y
## t = 0.32217, df = 98, p-value = 0.748
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.6501258  0.9021258
## sample estimates:
## mean of x mean of y 
##   103.578   103.452

Как мы видим, p-value=0.748 и оно больше \(\alpha\)=0.05 Значит гипотеза о равенстве средних двух независимо распределённых совокупностей не отвергается на уровне значимости \(\alpha\)=0.05.

Кроме того, доверительный интервал их разности (от -0.65 до 0.9021) содержит 0.

Статистика tнабл.=0.32217

Статистика tкр.=

## [1] 1.984467

tнабл < tкр.=>Значит гипотеза о равенстве средних двух независимо распределённых совокупностей не отвергается на уровне значимости \(\alpha\)=0.05.

Визуализируем данные:

##     group something
## 1       x     108.6
## 2       x     101.8
## 3       x     103.6
## 4       x     102.6
## 5       x     103.6
## 6       x     104.5
## 7       x     102.6
## 8       x     104.5
## 9       x     104.5
## 10      x     103.6
## 11      x     100.8
## 12      x     100.8
## 13      x     101.8
## 14      x     100.3
## 15      x     105.7
## 16      x      99.0
## 17      x     101.3
## 18      x     103.6
## 19      x     104.5
## 20      x     103.6
## 21      x     106.3
## 22      x     103.6
## 23      x     104.5
## 24      x     104.5
## 25      x     106.2
## 26      x     105.3
## 27      x     102.6
## 28      x     104.5
## 29      x     102.6
## 30      x     104.5
## 31      x     105.3
## 32      x     105.3
## 33      x     100.3
## 34      x     105.3
## 35      x     103.6
## 36      x     105.6
## 37      x     103.6
## 38      x     104.5
## 39      x     105.7
## 40      x     105.7
## 41      x     106.2
## 42      x     101.8
## 43      x     102.6
## 44      x     105.7
## 45      x     103.6
## 46      x      99.4
## 47      x     101.3
## 48      x     102.6
## 49      x     101.3
## 50      x     103.6
## 51      y     101.3
## 52      y     102.6
## 53      y     102.6
## 54      y     101.8
## 55      y     106.2
## 56      y     102.6
## 57      y     100.8
## 58      y     101.8
## 59      y     105.3
## 60      y     105.3
## 61      y     101.3
## 62      y     100.3
## 63      y     103.6
## 64      y     100.8
## 65      y     106.2
## 66      y     105.3
## 67      y     101.8
## 68      y     102.6
## 69      y     101.8
## 70      y     107.3
## 71      y     101.8
## 72      y     105.7
## 73      y     104.5
## 74      y     101.8
## 75      y     106.2
## 76      y     107.3
## 77      y     101.8
## 78      y     102.6
## 79      y     105.7
## 80      y     102.6
## 81      y     105.3
## 82      y     102.6
## 83      y     103.6
## 84      y     100.8
## 85      y     104.5
## 86      y     104.5
## 87      y     102.6
## 88      y     103.6
## 89      y     102.6
## 90      y     107.3
## 91      y     105.7
## 92      y     102.9
## 93      y     102.6
## 94      y     103.6
## 95      y     103.6
## 96      y     101.3
## 97      y     103.6
## 98      y     101.3
## 99      y     105.7
## 100     y     103.6

Построим ящичковые диаграммы:

Рис.1. Ящичковые диаграммы (boxplots) для переменных Х и У

Полученные график показывает разброс каждой переменной. Как мы видим, среднее значение в первой группе действительно немного больше, чем во второй.

Проверим данные типового расчёта на согласие эмпирического распределения с теоретическим.

Рис.2. Эмпирическая плотность распределения объема основных фондов

Как мы видим, полученный график напоминает кривую Гаусса, но не идеально, поэтому необходимо проверить гипотезу о ппринадлежности изучаемой случайной величины нормальному распределению.

Рис.3. Квантильный график (Q-Q plot) - эмпирическое распределение квантилей объема основных фондов и квантилей нормального распределения

Видим, что Q-Q plot (рис. 3) также позволяет выдвинуть гипотезу о нормальном распределении изучаемой совокупности.

Проведём Шапиро тест:

## 
##  Shapiro-Wilk normality test
## 
## data:  volume
## W = 0.97934, p-value = 0.1181

p-value =0.1181>0.05=> Ho о том, что выборка подчиняется нормальному распределению не отвергается на уровне значимости 0,05.

Проведём тест Жарка-Бера(обе модификации):

## 
##  Jarque Bera Test
## 
## data:  x
## X-squared = 0.45325, df = 2, p-value = 0.7972
## 
##  Robust Jarque Bera Test
## 
## data:  x
## X-squared = 0.43029, df = 2, p-value = 0.8064

p-value >0.05 в каждом случае=>Ho о том, что выборка подчиняется нормальному распределению не отвергается на уровне значимости 0.05

Проведём тест Андерсона-Дарлинга:

## 
##  Anderson-Darling normality test
## 
## data:  volume
## A = 0.93835, p-value = 0.01677

p-value=0.01677<0.05 Ho отвергается с вероятностью ошибки 0.05, данные типового расчёта не подчиняются нормальному распределению.

Проведём тест Лиллиефорса:

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  volume
## D = 0.11084, p-value = 0.004103

p-value=0.004103<0.05 Ho отвергается с вероятностью ошибки 0.05, данные типового расчёта не подчиняются нормальному распределению.

Проведём Д’Агустино тест:

## 
## Title:
##  D'Agostino Normality Test
## 
## Test Results:
##   STATISTIC:
##     Chi2 | Omnibus: 1.6742
##     Z3  | Skewness: 0.3676
##     Z4  | Kurtosis: -1.2406
##   P VALUE:
##     Omnibus  Test: 0.433 
##     Skewness Test: 0.7132 
##     Kurtosis Test: 0.2148 
## 
## Description:
##  Wed Jun 26 13:08:31 2019 by user: User
## 
## Title:
##  D'Agostino Normality Test
## 
## Test Results:
##   STATISTIC:
##     Chi2 | Omnibus: 1.6742
##     Z3  | Skewness: 0.3676
##     Z4  | Kurtosis: -1.2406
##   P VALUE:
##     Omnibus  Test: 0.433 
##     Skewness Test: 0.7132 
##     Kurtosis Test: 0.2148 
## 
## Description:
##  Wed Jun 26 13:08:31 2019 by user: User

p-value Kurtosis Test =0.2148>0.05 Ho не отвергается на уровне значимости 0.05, данные типового расчёта подчиняются нормальному распределению.

Задание:

Проведём тест на равенство вероятности успеха в испытании Бернули 10%

Ho:p0=10. n>30.

Для первой выборки:

## 
##  1-sample proportions test with continuity correction
## 
## data:  18 out of 105, null probability 0.1
## X-squared = 5.1852, df = 1, p-value = 0.02278
## alternative hypothesis: true p is not equal to 0.1
## 95 percent confidence interval:
##  0.1074358 0.2600998
## sample estimates:
##         p 
## 0.1714286

p-value=0.02278>0.02, следовательно гипотеза Ho: p=p0=0.1 принимается на уровне значимости 0.02. То есть данные соответствуют озвученным.

Аналогично для второй выборки:

## 
##  1-sample proportions test with continuity correction
## 
## data:  12 out of 170, null probability 0.1
## X-squared = 1.3235, df = 1, p-value = 0.25
## alternative hypothesis: true p is not equal to 0.1
## 95 percent confidence interval:
##  0.03866545 0.12288019
## sample estimates:
##          p 
## 0.07058824

p-value=0.25>0.02, следовательно гипотеза Ho: p=p0=0.1 принимается на уровне значимости 0.02. То есть данные соответствуют озвученным.

Проверим гипотезу о равенстве вероятностей:

Ho: p1=p2

## 
##  2-sample test for equality of proportions without continuity
##  correction
## 
## data:  c(12, 18) out of c(170, 105)
## X-squared = 6.7913, df = 1, p-value = 0.00916
## alternative hypothesis: two.sided
## 98 percent confidence interval:
##  -0.197843313 -0.003837359
## sample estimates:
##     prop 1     prop 2 
## 0.07058824 0.17142857
## [1] 5.411894

Мы получили, что \(\chi^2\) наблюдаемое=6.7913 > \(\chi^2\) критического= 5.411894

И p-value=0.0916, что меньше 0.02.

Поэтому нулевая гипотеза об однородности вероятностей отвергается с вероятностью ошибки 0.02, не выполнение нормативов по районам с большой долей вероятности имеют разную вероятность.