Небольшая информация о данных:
## v11
## Min. : 99.0
## 1st Qu.:101.8
## Median :103.6
## Mean :103.5
## 3rd Qu.:105.3
## Max. :108.6
Полная информация о данных:
## -------------------------------------------------------------------------
## Describe data (data.frame):
##
## data.frame: 100 obs. of 1 variables
##
## Nr ColName Class NAs Levels
## 1 v11 numeric .
##
##
## -------------------------------------------------------------------------
## 1 - v11 (numeric)
##
## length n NAs unique 0s mean
## 1e+02 1e+02 0 2e+01 0 1.035e+02
## 100.0% 0.0% 0.0%
##
## .05 .10 .25 median .75 .90
## 1.008e+02 1.012e+02 1.018e+02 1.036e+02 1.053e+02 1.058e+02
##
## range sd vcoef mad IQR skew
## 9.600e+00 1.947e+00 1.881e-02 2.520e+00 3.500e+00 8.345e-02
##
## meanCI
## 1.031e+02
## 1.039e+02
##
## .95
## 1.062e+02
##
## kurt
## -5.912e-01
##
## lowest : 9.900e+01, 9.940e+01, 1.003e+02 (3e+00), 1.008e+02 (5e+00), 1.013e+02 (7e+00)
## highest: 1.057e+02 (8e+00), 1.062e+02 (5e+00), 1.063e+02, 1.073e+02 (3e+00), 1.086e+02
Рис. 1. Гистограмма, ящичковая диаграмма и кумулята исследуемой переменной.
Рис. 2. Гистограмма эмпирических частот объема основных фондов.
Рис. 3. Гистограмма эмпирических частот объема основных фондов и теоретическая кривая нормального распределения.
Точечная оценка и доверительный интервал при неизвестной генеральной дисперсии:
## mean lwr.ci upr.ci
## 103.5150 103.0037 104.0263
\(\overline x\)=103.515
P(103.0037\(\leq\)\(\mu\)\(\le\) 104.0263)=0.99
Точечная оценка и доверительный интервал для дисперсии:
## var lwr.ci upr.ci
## 3.789369 2.690130 4.973122
\(\sigma^2\)=3.789369
P(2.671518\(\leq\)\(\sigma^2\)\(\le\) 5.0386)
Асимптотический доверительный интервал:
## sd_min sd_max
## 1.657256 2.402259
P(1.657256\(\leq\)\(\sigma\)\(\leq\) 2.402259)=0.99
Задание: (И вторая выборка 28 человек, из которых 2 из них ниже прожиточного минимума)
Для второй выборки(n=28, m=2). Получим три разных доверительных интервала вероятности.
## est lwr.ci upr.ci
## [1,] 0.07142857 0.008770497 0.2350348
## est lwr.ci upr.ci
## [1,] 0.07142857 0.01981206 0.2264536
## est lwr.ci upr.ci
## [1,] 0.07142857 0.01514083 0.2099472
Первый интервал Клоппера-Пирсона: P(0.00877<p<.0235)=0.95
Второй интервал Уилсона: P(0.01981<p<0.2265)=0.95
Третий интервал Джеффриса: P(0.01514<p<0.20995)=0.95
Как мы видим, интервалы Уилсона и Джеффриса значительно уже интервала Клоппера-Пирсона. У интервала Уилсона самое высокое значение левой границы, а у интервала Джеффриса-правой.
Для первой выборки (n=500, m=35) получим следующие доверительные интервалы:
## est lwr.ci upr.ci
## [1,] 0.07 0.04763579 0.09236421
## est lwr.ci upr.ci
## [1,] 0.07327847 0.05052414 0.09603279
Первый интервал Вальда: P(0.047636<p<0.09236)=0.95
Второй интервал Агрести-Коула: P(0.073279<p<0.09603)=0.95
Ширина второго интервала получилась меньше первого.
Таким образом были найдены доверительные интервалы, в которых будет лежать число жителей региона с доходами ниже прожиточного минимума, для выборки из 500 человек и из 28, в которых 35 и 2 человека соответственно обладали доходами ниже прожиточного минимума.