Количественное исследование: выборка
Олеся Волченко
16 сентября 2021
Total Survey Error Framework (Общая теория ошибок)
Total Survey Error Framework = measurement errors + representation errors
(Bit by Bit: Social Research in the Digital Age, M. Salganik)

(Groves, R. M., & Lyberg, L. (2010). Total survey error: Past, present, and future. Public opinion quarterly, 74(5), 849-879.)
Зачем нужна выборка?
Цель выборочного метода — выбор элементов из генеральной совокупности таким образом, чтобы распределение элементов в выборке повторяло их распределение в генеральной совокупности.
Зачем нужна выборка?
- экономия денег
- экономия времени
- повысить качество сбора данных
Единицы анализа, единицы отбора
- Единицы анализа - элементы выборочной совокупности, подлежащие изучению
- Единицы отбора - элемент или набор элементов, использующийся для отбора на определенной ступени выборки
Что может быть единицами отбора и единицами анализа?
Выборка и генеральная совокупность
- Генеральная совокупность — вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений общественной жизни (единиц отбора), имеющих общие качественные признаки или количественные переменные.
- Выборочная совокупность (выборка) — представительная часть генеральной совокупности. Процесс выборки основан на правомерности выводов о целом на основании изучения его части при условии, что по своей структуре эта часть является микромоделью целого
Размер выборки
От чего зависит?
- от размера генеральной совокупности
- от оцениваемого признака
- от того, насколько мы готовы ошибаться
https://www.youtube.com/watch?v=7sBzhII-sNA (Gilmore Girls, s05e04, sorry for the quality)
Размер выборки
При оценке доли:
для бесконечной генеральной совокупности \[n = \frac{Z^2*p(1-p)}{\Delta^2}\] для конечной генеральной совокупности
\[n = \frac{Z^2Np(1-p)}{\Delta^2N + Z^2p(1-p)}\]
При оценке среднего:
для бесконечной генеральной совокупности \[n = \frac{Z^2\sigma^2}{\Delta^2}\]
для конечной генеральной совокупности \[n = \frac{Z^2N\sigma^2}{\Delta^2N + Z^2\sigma^2}\]
Размер выборки: пример
- Нам нужно рассчитать размер выборки для опроса в городе с населением в 10 000 человек.
- Мы предполагаем, что распределение оцениваемого признака 40/60 (т.е. p и p-1)
- В качестве доверительного интервала возьмём 95% (т.е. Z = 1.96)
- Предельная ошибка (\(\Delta\)) 5%
((1.96^2) * 10000 * (0.6*0.4))/ ((0.05^2) * 10000 + (1.96^2)*(0.6*0.4))
## [1] 355.6765
Предельная ошибка выборки
Для среднего (для количественного признака) \[\Delta = Z\sqrt{\frac{\sigma^2}{n}}\]
Для доли (для качественного признака) \[\Delta = Z\sqrt{\frac{p(p-1)}{n}}\]
Репрезентативность
свойство выборочной совокупности воспроизводить параметры и значимые элементы структуры генеральной совокупности
Типы методов отбора
- случайные (вероятностные)
- случайная
- систематическая / механическая
- стратифицированная
- гнездовая / кластерная / серийная
- неслучайные (невероятностные)
- квотная
- метод снежного кома
- метод основного массива
- стихийная
- целевая выборка
Случайная выборка
При помощи генератора случайных чисел отбираются единицы, включаемые в выборочную совокупность.
- однородность генеральной совокупности
- нужен актуальный список единиц генеральной совокупности
- все элементы генеральной совокупности имеют равную вероятность попасть в выборку

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Систематическая/механическая выборка
Выбирается шаг отбора (n) и в выборку попадает каждая n-ная единица
- однородность генеральной совокупности
- нужен актуальный список единиц генеральной совокупности
- все элементы генеральной совокупности имеют равную вероятность попасть в выборку
- важно чтобы шаг не совпал с существующей закономерностью

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Гнездовая / кластерная / серийная выборка
единицей отбора выступает не сами объекты, а кластеры, они обследуются сплошным методом
- Применяется в случае неоднородности Г.С.
- Удобна, когда есть группа-“микромодель” Г.С.
- Позволяет экономить ресурсы

Image source: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Квотная выборка
- распространенный метод при масовых опросах
- используется, если есть данные о рапределении интересуемых признаков
Недостатки:
- велика роль интервьюера
- требует детального знания изучаемой совокупности

Image source: https://www.mathstopia.net/sampling/quota-sampling
Метод основного массива
- опрашивается 50-60% от генеральной совокупности
- чаще используется не сам по себе, а как ступень построения выборки
Целевая выборка

Стихийная выборка
- формируется произвольно
- Пример - опросы с помощью СМИ, выборка первого встречного
- невозможно определить какую Г.С. они представляют
Домашнее задание 3 (сдать до 23:59 29.09)
- найти социологическую эмпирическую статью, выполненную с использованием количественных методов (рекомендую брать англоязычную статью, т.к. в них обычно более подробно описана методология)
- описать процедуру построения выборки. Что является единицами отбора, что является единицами анализа? Какой тип (типы?) выборок были использованы? Все ли хорошо с выборкой? (Посмотрите в раздел limitations, если такой есть. Иногда авторы сами пишут, что могло пойти не так)
- Описать, каким образом были измерены основные конструкты (понятия) исследования. Какие шкалы использованы? В качестве модели ответа на данный подпункт можно воспользоваться таблицей 2.3 на странице 71 учебника Энди Филда (есть в папке books MS Teams).
Объем, сдаваемого вами текста, должен составлять от 300 до 500 слов.