Количественное исследование: выборка

Олеся Волченко

16 сентября 2021

Total Survey Error Framework (Общая теория ошибок)

Total Survey Error Framework = measurement errors + representation errors

(Bit by Bit: Social Research in the Digital Age, M. Salganik)

(Groves, R. M., & Lyberg, L. (2010). Total survey error: Past, present, and future. Public opinion quarterly, 74(5), 849-879.)

Зачем нужна выборка?

Цель выборочного метода — выбор элементов из генеральной совокупности таким образом, чтобы распределение элементов в выборке повторяло их распределение в генеральной совокупности.

Зачем нужна выборка?

Единицы анализа, единицы отбора

Что может быть единицами отбора и единицами анализа?

Выборка и генеральная совокупность

Размер выборки

От чего зависит?

https://www.youtube.com/watch?v=7sBzhII-sNA (Gilmore Girls, s05e04, sorry for the quality)

Размер выборки

При оценке доли:

для бесконечной генеральной совокупности \[n = \frac{Z^2*p(1-p)}{\Delta^2}\] для конечной генеральной совокупности

\[n = \frac{Z^2Np(1-p)}{\Delta^2N + Z^2p(1-p)}\]

При оценке среднего:

для бесконечной генеральной совокупности \[n = \frac{Z^2\sigma^2}{\Delta^2}\]

для конечной генеральной совокупности \[n = \frac{Z^2N\sigma^2}{\Delta^2N + Z^2\sigma^2}\]

Z

\[Z_{90\%} = 1.645\]

\[Z_{95\%} = 1.96\]

\[Z_{99\%} = 2.576\]

Image source: https://slideplayer.com/slide/7364031/

Размер выборки: пример

((1.96^2) * 10000 * (0.6*0.4))/ ((0.05^2) * 10000 + (1.96^2)*(0.6*0.4))
## [1] 355.6765

Предельная ошибка выборки

Для среднего (для количественного признака) \[\Delta = Z\sqrt{\frac{\sigma^2}{n}}\]

Для доли (для качественного признака) \[\Delta = Z\sqrt{\frac{p(p-1)}{n}}\]

Отношение размера выборки и размера предельной ошибки

https://www.aapor.org/Education-Resources/Election-Polling-Resources/Margin-of-Sampling-Error-Credibility-Interval.aspx

Репрезентативность

свойство выборочной совокупности воспроизводить параметры и значимые элементы структуры генеральной совокупности

Типы методов отбора

Случайная выборка

При помощи генератора случайных чисел отбираются единицы, включаемые в выборочную совокупность.

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html

Систематическая/механическая выборка

Выбирается шаг отбора (n) и в выборку попадает каждая n-ная единица

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html

Стратифицированная выборка

Г.С. разбивается на группы (страты), в каждой страте отбор совершается случайным или механическим образом

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html

Гнездовая / кластерная / серийная выборка

единицей отбора выступает не сами объекты, а кластеры, они обследуются сплошным методом

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html

Квотная выборка

Недостатки:

Image source: https://www.mathstopia.net/sampling/quota-sampling

Метод снежного кома

Опрашивается несколько респондентов, которых также спрашивают о том, кого еще имеет смысл опросить.

Image source: https://umkc.instructure.com/courses/14994/pages/nonprobability-sampling-methods?module_item_id=7131

Метод основного массива

Целевая выборка

Стихийная выборка

Домашнее задание 3 (сдать до 23:59 29.09)

Объем, сдаваемого вами текста, должен составлять от 300 до 500 слов.