Небольшая информация о данных:

##       v11       
##  Min.   : 99.0  
##  1st Qu.:101.8  
##  Median :103.6  
##  Mean   :103.5  
##  3rd Qu.:105.3  
##  Max.   :108.6

Полная информация о данных:

## ------------------------------------------------------------------------- 
## Describe data (data.frame):
## 
## data.frame:  100 obs. of  1 variables
## 
##   Nr  ColName  Class    NAs  Levels
##   1   v11      numeric  .          
## 
## 
## ------------------------------------------------------------------------- 
## 1 - v11 (numeric)
## 
##      length          n        NAs     unique         0s       mean
##       1e+02      1e+02          0      2e+01          0  1.035e+02
##                 100.0%       0.0%                  0.0%           
##                                                                   
##         .05        .10        .25     median        .75        .90
##   1.008e+02  1.012e+02  1.018e+02  1.036e+02  1.053e+02  1.058e+02
##                                                                   
##       range         sd      vcoef        mad        IQR       skew
##   9.600e+00  1.947e+00  1.881e-02  2.520e+00  3.500e+00  8.345e-02
##                                                                   
##       meanCI
##    1.031e+02
##    1.039e+02
##             
##          .95
##    1.062e+02
##             
##         kurt
##   -5.912e-01
##             
## lowest : 9.900e+01, 9.940e+01, 1.003e+02 (3e+00), 1.008e+02 (5e+00), 1.013e+02 (7e+00)
## highest: 1.057e+02 (8e+00), 1.062e+02 (5e+00), 1.063e+02, 1.073e+02 (3e+00), 1.086e+02

Рис. 1. Гистограмма, ящичковая диаграмма и кумулята исследуемой переменной.

Рис. 2. Гистограмма эмпирических частот объема основных фондов.

Рис. 3. Гистограмма эмпирических частот объема основных фондов и теоретическая кривая нормального распределения.

Точечная оценка и доверительный интервал при неизвестной генеральной дисперсии:

##     mean   lwr.ci   upr.ci 
## 103.5150 103.0037 104.0263

\(\overline x\)=103.515

P(103.0037\(\leq\)\(\mu\)\(\le\) 104.0263)=0.99

Точечная оценка и доверительный интервал для дисперсии:

##      var   lwr.ci   upr.ci 
## 3.789369 2.690130 4.973122

\(\sigma^2\)=3.789369

P(2.671518\(\leq\)\(\sigma^2\)\(\le\) 5.0386)

Асимптотический доверительный интервал:

##   sd_min   sd_max 
## 1.657256 2.402259

P(1.657256\(\leq\)\(\sigma\)\(\leq\) 2.402259)=0.99

Задание: (И вторая выборка 28 человек, из которых 2 из них ниже прожиточного минимума)

Для второй выборки(n=28, m=2). Получим три разных доверительных интервала вероятности.

##             est      lwr.ci    upr.ci
## [1,] 0.07142857 0.008770497 0.2350348
##             est     lwr.ci    upr.ci
## [1,] 0.07142857 0.01981206 0.2264536
##             est     lwr.ci    upr.ci
## [1,] 0.07142857 0.01514083 0.2099472

Первый интервал Клоппера-Пирсона: P(0.00877<p<.0235)=0.95

Второй интервал Уилсона: P(0.01981<p<0.2265)=0.95

Третий интервал Джеффриса: P(0.01514<p<0.20995)=0.95

Как мы видим, интервалы Уилсона и Джеффриса значительно уже интервала Клоппера-Пирсона. У интервала Уилсона самое высокое значение левой границы, а у интервала Джеффриса-правой.

Для первой выборки (n=500, m=35) получим следующие доверительные интервалы:

##       est     lwr.ci     upr.ci
## [1,] 0.07 0.04763579 0.09236421
##             est     lwr.ci     upr.ci
## [1,] 0.07327847 0.05052414 0.09603279

Первый интервал Вальда: P(0.047636<p<0.09236)=0.95

Второй интервал Агрести-Коула: P(0.073279<p<0.09603)=0.95

Ширина второго интервала получилась меньше первого.

Таким образом были найдены доверительные интервалы, в которых будет лежать число жителей региона с доходами ниже прожиточного минимума, для выборки из 500 человек и из 28, в которых 35 и 2 человека соответственно обладали доходами ниже прожиточного минимума.