Проведём анализ равенства двух дисперсий:
##
## F test to compare two variances
##
## data: x and y
## F = 1.0747, num df = 49, denom df = 49, p-value = 0.8018
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.6098928 1.8939053
## sample estimates:
## ratio of variances
## 1.074746
Так как p-value=0.8018, то есть больше \(\alpha\)=0.05, то гипотеза Hо о равенстве дисперсий генеральных совокупностей не отвергается на уровне значимости \(\alpha\)=0.05. Кроме того, интервальная оценка включает в себя единицу(от 0.6099 до 1.894).
Проверим через F-критическое:
## [1] 1.607289
Fкр.=1.607, а Fнабл.=1.0747
Так как Fнабл < Fкр, то гипотеза Hо о равенстве дисперсий генеральных совокупностей не отвергается на уровне значимости \(\alpha\)=0.05
Теперь проведём тесты на равенство средних:
Сделаем это для первой части выборки.
Оценим среднее значение.
## num [1:50] 109 102 104 103 104 ...
## [1] 103.578
Как мы видим, среднее значение из совокупности X равно 103.578.
Проверим Ho: \(\mu\)=104
Первый тест на равенство средней совокупности-параметрический тест(t-тест Стьюдента).
##
## One Sample t-test
##
## data: x
## t = -1.4992, df = 49, p-value = 0.1402
## alternative hypothesis: true mean is not equal to 104
## 95 percent confidence interval:
## 103.0123 104.1437
## sample estimates:
## mean of x
## 103.578
Как мы видим, p-value=0.1402, что больше \(\alpha\)=0.05.Значит, гипотеза Ho: \(\mu\)=104 не отвергается на уровне значимости \(\alpha\)=0.05.
Доверительный интервал для генеральной средней:
P(103.023<\(\mu\) <104.1437)
Содержит проверяемое значение.
Аналогично сделаем для второй части выборки.
Оценим среднее значение.
## num [1:50] 101 103 103 102 106 ...
## [1] 103.452
Как мы видим, среднее значение из совокупности X равно 103.452. Проверим Ho: \(\mu\)=104
Первый тест на равенство средней совокупности-параметрический тест(t-тест Стьюдента).
##
## One Sample t-test
##
## data: y
## t = -2.0182, df = 49, p-value = 0.04906
## alternative hypothesis: true mean is not equal to 104
## 95 percent confidence interval:
## 102.9064 103.9976
## sample estimates:
## mean of x
## 103.452
Как мы видим, p-value=0.04906, что меньше \(\alpha\)=0.05.Значит, гипотеза Ho: \(\mu\)=104 отвергается с вероятностью ошибки \(\alpha\)=0.05.
Доверительный интервал для генеральной средней:
P(102.9064<\(\mu\) <103.9976)
Не содержит проверяемое значение.
Сравнение средних двух независимых нормально распределенных совокупностей -параметрический тест (t-тест Стьюдента)
##
## Two Sample t-test
##
## data: x and y
## t = 0.32217, df = 98, p-value = 0.748
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.6501258 0.9021258
## sample estimates:
## mean of x mean of y
## 103.578 103.452
Как мы видим, p-value=0.748 и оно больше \(\alpha\)=0.05 Значит гипотеза о равенстве средних двух независимо распределённых совокупностей не отвергается на уровне значимости \(\alpha\)=0.05.
Кроме того, доверительный интервал их разности (от -0.65 до 0.9021) содержит 0.
Статистика tнабл.=0.32217
Статистика tкр.=
## [1] 1.984467
tнабл < tкр.=>Значит гипотеза о равенстве средних двух независимо распределённых совокупностей не отвергается на уровне значимости \(\alpha\)=0.05.
Визуализируем данные:
## group something
## 1 x 108.6
## 2 x 101.8
## 3 x 103.6
## 4 x 102.6
## 5 x 103.6
## 6 x 104.5
## 7 x 102.6
## 8 x 104.5
## 9 x 104.5
## 10 x 103.6
## 11 x 100.8
## 12 x 100.8
## 13 x 101.8
## 14 x 100.3
## 15 x 105.7
## 16 x 99.0
## 17 x 101.3
## 18 x 103.6
## 19 x 104.5
## 20 x 103.6
## 21 x 106.3
## 22 x 103.6
## 23 x 104.5
## 24 x 104.5
## 25 x 106.2
## 26 x 105.3
## 27 x 102.6
## 28 x 104.5
## 29 x 102.6
## 30 x 104.5
## 31 x 105.3
## 32 x 105.3
## 33 x 100.3
## 34 x 105.3
## 35 x 103.6
## 36 x 105.6
## 37 x 103.6
## 38 x 104.5
## 39 x 105.7
## 40 x 105.7
## 41 x 106.2
## 42 x 101.8
## 43 x 102.6
## 44 x 105.7
## 45 x 103.6
## 46 x 99.4
## 47 x 101.3
## 48 x 102.6
## 49 x 101.3
## 50 x 103.6
## 51 y 101.3
## 52 y 102.6
## 53 y 102.6
## 54 y 101.8
## 55 y 106.2
## 56 y 102.6
## 57 y 100.8
## 58 y 101.8
## 59 y 105.3
## 60 y 105.3
## 61 y 101.3
## 62 y 100.3
## 63 y 103.6
## 64 y 100.8
## 65 y 106.2
## 66 y 105.3
## 67 y 101.8
## 68 y 102.6
## 69 y 101.8
## 70 y 107.3
## 71 y 101.8
## 72 y 105.7
## 73 y 104.5
## 74 y 101.8
## 75 y 106.2
## 76 y 107.3
## 77 y 101.8
## 78 y 102.6
## 79 y 105.7
## 80 y 102.6
## 81 y 105.3
## 82 y 102.6
## 83 y 103.6
## 84 y 100.8
## 85 y 104.5
## 86 y 104.5
## 87 y 102.6
## 88 y 103.6
## 89 y 102.6
## 90 y 107.3
## 91 y 105.7
## 92 y 102.9
## 93 y 102.6
## 94 y 103.6
## 95 y 103.6
## 96 y 101.3
## 97 y 103.6
## 98 y 101.3
## 99 y 105.7
## 100 y 103.6
Построим ящичковые диаграммы:
Рис.1. Ящичковые диаграммы (boxplots) для переменных Х и У
Полученные график показывает разброс каждой переменной. Как мы видим, среднее значение в первой группе действительно немного больше, чем во второй.
Проверим данные типового расчёта на согласие эмпирического распределения с теоретическим.
Рис.2. Эмпирическая плотность распределения объема основных фондов
Как мы видим, полученный график напоминает кривую Гаусса, но не идеально, поэтому необходимо проверить гипотезу о ппринадлежности изучаемой случайной величины нормальному распределению.
Рис.3. Квантильный график (Q-Q plot) - эмпирическое распределение квантилей объема основных фондов и квантилей нормального распределения
Видим, что Q-Q plot (рис. 3) также позволяет выдвинуть гипотезу о нормальном распределении изучаемой совокупности.
Проведём Шапиро тест:
##
## Shapiro-Wilk normality test
##
## data: volume
## W = 0.97934, p-value = 0.1181
p-value =0.1181>0.05=> Ho о том, что выборка подчиняется нормальному распределению не отвергается на уровне значимости 0,05.
Проведём тест Жарка-Бера(обе модификации):
##
## Jarque Bera Test
##
## data: x
## X-squared = 0.45325, df = 2, p-value = 0.7972
##
## Robust Jarque Bera Test
##
## data: x
## X-squared = 0.43029, df = 2, p-value = 0.8064
p-value >0.05 в каждом случае=>Ho о том, что выборка подчиняется нормальному распределению не отвергается на уровне значимости 0.05
Проведём тест Андерсона-Дарлинга:
##
## Anderson-Darling normality test
##
## data: volume
## A = 0.93835, p-value = 0.01677
p-value=0.01677<0.05 Ho отвергается с вероятностью ошибки 0.05, данные типового расчёта не подчиняются нормальному распределению.
Проведём тест Лиллиефорса:
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: volume
## D = 0.11084, p-value = 0.004103
p-value=0.004103<0.05 Ho отвергается с вероятностью ошибки 0.05, данные типового расчёта не подчиняются нормальному распределению.
Проведём Д’Агустино тест:
##
## Title:
## D'Agostino Normality Test
##
## Test Results:
## STATISTIC:
## Chi2 | Omnibus: 1.6742
## Z3 | Skewness: 0.3676
## Z4 | Kurtosis: -1.2406
## P VALUE:
## Omnibus Test: 0.433
## Skewness Test: 0.7132
## Kurtosis Test: 0.2148
##
## Description:
## Wed Jun 26 13:08:31 2019 by user: User
##
## Title:
## D'Agostino Normality Test
##
## Test Results:
## STATISTIC:
## Chi2 | Omnibus: 1.6742
## Z3 | Skewness: 0.3676
## Z4 | Kurtosis: -1.2406
## P VALUE:
## Omnibus Test: 0.433
## Skewness Test: 0.7132
## Kurtosis Test: 0.2148
##
## Description:
## Wed Jun 26 13:08:31 2019 by user: User
p-value Kurtosis Test =0.2148>0.05 Ho не отвергается на уровне значимости 0.05, данные типового расчёта подчиняются нормальному распределению.
Задание:
Проведём тест на равенство вероятности успеха в испытании Бернули 10%
Ho:p0=10. n>30.
Для первой выборки:
##
## 1-sample proportions test with continuity correction
##
## data: 18 out of 105, null probability 0.1
## X-squared = 5.1852, df = 1, p-value = 0.02278
## alternative hypothesis: true p is not equal to 0.1
## 95 percent confidence interval:
## 0.1074358 0.2600998
## sample estimates:
## p
## 0.1714286
p-value=0.02278>0.02, следовательно гипотеза Ho: p=p0=0.1 принимается на уровне значимости 0.02. То есть данные соответствуют озвученным.
Аналогично для второй выборки:
##
## 1-sample proportions test with continuity correction
##
## data: 12 out of 170, null probability 0.1
## X-squared = 1.3235, df = 1, p-value = 0.25
## alternative hypothesis: true p is not equal to 0.1
## 95 percent confidence interval:
## 0.03866545 0.12288019
## sample estimates:
## p
## 0.07058824
p-value=0.25>0.02, следовательно гипотеза Ho: p=p0=0.1 принимается на уровне значимости 0.02. То есть данные соответствуют озвученным.
Проверим гипотезу о равенстве вероятностей:
Ho: p1=p2
##
## 2-sample test for equality of proportions without continuity
## correction
##
## data: c(12, 18) out of c(170, 105)
## X-squared = 6.7913, df = 1, p-value = 0.00916
## alternative hypothesis: two.sided
## 98 percent confidence interval:
## -0.197843313 -0.003837359
## sample estimates:
## prop 1 prop 2
## 0.07058824 0.17142857
## [1] 5.411894
Мы получили, что \(\chi^2\) наблюдаемое=6.7913 > \(\chi^2\) критического= 5.411894
И p-value=0.0916, что меньше 0.02.
Поэтому нулевая гипотеза об однородности вероятностей отвергается с вероятностью ошибки 0.02, не выполнение нормативов по районам с большой долей вероятности имеют разную вероятность.