Количественное исследование: измерение

Олеся Волченко

10 сентября 2022

План на эту пару:

Количественные данные

Вторичные данные

Оценка экспоненциального роста данных с 2010 по 2020

Image source: Borgi, T., Zoghlami, N., Abed, M., & Naceur, M. S. (2017, July). Big Data for Operational Efficiency of Transport and Logistics: A Review. In 2017 6th IEEE International Conference on Advanced Logistics and Transport (ICALT) (pp. 113-120). IEEE.

Что такое вторичные данные?

Возможные задачи количественного анализа данных

Total Survey Error Framework (Общая теория ошибок)

Total Survey Error Framework = measurement errors + representation errors

(Bit by Bit: Social Research in the Digital Age, M. Salganik)

(Groves, R. M., & Lyberg, L. (2010). Total survey error: Past, present, and future. Public opinion quarterly, 74(5), 849-879.)

Что такое измерение?

Процедура перехода от того, что респонденты говорят, делают или думают к формализованной мере.

Уровни измерения

Акроним NOIR

Stevens, S. S. (1946). On the theory of scales of measurement. Science, vol. 103, p. 677–680.

Номинальная шкала

Image source: Practical Data Cleaning. 19 Essential Tips to Scrub Your Dirty Data (and keep your boss happy)

Ординальная / порядковая шкала

Image source: Practical Data Cleaning. 19 Essential Tips to Scrub Your Dirty Data (and keep your boss happy)

Интервальная шкала

Image source: Practical Data Cleaning. 19 Essential Tips to Scrub Your Dirty Data (and keep your boss happy)

Шкала отношений

Image source: Practical Data Cleaning. 19 Essential Tips to Scrub Your Dirty Data (and keep your boss happy)

Интервальные шкалы vs шкалы отношений

Категориальные переменные

Image source: https://github.com/allisonhorst

Дискретные vs. непрерывные

Image source: https://github.com/allisonhorst

Примеры шкал - 1

Примеры шкал - 2

Какая разница?

Image source: https://www.mymarketresearchmethods.com/types-of-data-nominal-ordinal-interval-ratio/

Меры центральности

Меры центральности

Индексы

агрегированный количественный показатель, обобщающий первичную социологическую информацию, полученную в ходе измерения с помощью одной или нескольких шкал.

Примеры:

Требования к шкалам

Полнота шкалы

Насколько шкала покрывает все значения измеряемого конструкта, т.е. позволяет каждому респонденту найти “свое место” в предложеном континууме вариантов.

Пример неполной шкалы:

Понравилась ли вам сегодняшняя пара?

Надежность (reliability)

Воспроизводимость результатов измерения

Хороший дополнительный материал про надёжность: https://conjointly.com/kb/types-of-reliability/

Валидность

Свойство инструмента измерять именно тот конструкт, который он должен измерять (тот, который предполагает исследователь).

Нельзя сказать, глядя на анкету, что какой-либо вопрос не валидный (т.к. из анкеты не ясно, какой конструкт мы измеряем)

Например, у нас есть вопрос: “За какую политическую партию вы проголосовали на последних выборах?”

Валидность и надёжность

Image source: https://commons.wikimedia.org/wiki/File:Reliability_and_validity.svg

Почему следует выбирать одно измерение, а не другое?

https://twitter.com/ShelbyWolstein/status/1299108862486695936