Лекция 3: bias and confounding

Артемий Охотин

Поваренная книга дата-аналитика

Bias and confounding

  • Confounding (смешивание) – обнаружение корреляций, имеющих некаузальную природу, но существующих в реальности.

  • Selection bias (ошибка отбора) – анализируют не тех, кого хотели

  • Information bias – анализируют не то, что хотели

    • Суррогатные конечные точки

    • Мисклассификация

      • Дифференциальная

      • Недифференциальная

Валидность

  • Внутренняя
    • Выводы приложимы к выборке исследования
  • Внешняя
    • Выводы переносимы на более широкую популяцию

Смешивание (confounding)

Смешивание

Without confounder

Events Total
Exposed 5 100
Unexposed 50 1000

With confounder

Events Total
Exposed 500 1000
Unexposed 50 100

Both with and without confounder

Events Total
Exposed 505 1100
Unexposed 100 1100

Как избавиться от конфаундинга?

  • Обнаружить/заподозрить конфаундеры

  • Провести стратификацию/поправку на конфаундеры

  • В обсервационных исследованиях всегда возможен остаточный конфаундинг

  • В данных может не быть сведений о конфаундинге

  • Не путать конфаундер с коллайдером и медиатором

Пример

Barchuk et al. (2022)

Ошибка отбора

Пример: возраст и тяжелое течение пневмонии

Ruiz et al. (2017)

Возраст и тяжелое течение пневмонии

In the adjusted multivariate analysis, the older patients were less likely to be admitted to the ICU (OR 0.14; 95% CI 0.05–0.39; P < 0.001).

Шансы попадания в реанимацию у пожилых были в 7 раз меньше.

Конфаундер?

Распределение по тяжести

Госпитализация по тяжести

Критерии госпитализации

The severity of patients’ clinical condition was assessed on admission using the CURB-65 score.

Госпитализация по тяжести и возрасту

Госпитализация по тяжести и возрасту

Молодые тяжелее среди госпитализированных и среди негоспитализированных.

Но в общей популяции пожилые тяжелее.

Коллайдер

Healthy worker bias

При сравнении с общей популяцией работники на тяжелых работах часто оказываются здоровее

Ошибка отбора – кто в контрольной группе (больные, старики и дети)

Конфаундинг – для работы нужно крепкое здоровье

Рандомизированное клинические испытание

  • Устраняет конфаундеры (на рандомизацию ничто не влияет)

  • Позволяет избежать контроля по коллайдерам

  • Наименее подвержено искажениям

Рандомизированное клиническое испытание

РКИ: Пример

Reis et al. (2022)

Снижение смертности

Умерли Живы
Флувоксамин 1 547
Плацебо 12 607

There was one death in the fluvoxamine group and 12 in the placebo group for the per-protocol population (OR 0·09; 95% CI 0·01–0·47).

Intention-to-treat analysis

Те, кто получил лечение

Умерли Живы OR
Флувоксамин 1 547 0.09
Плацебо 12 607 p<0.05

Те, кто должен был получить лечение

Умерли Живы OR
Флувоксамин 17 724 0.69
Плацебо 25 731 p>0.05

Не получили назначенное лечение

Умерли Живы
Флувоксамин 94% 24%
Плацебо 52% 16%

Коллайдер

R – рандомизация

D – назначенное лечение

C – завершение лечения

Y – исход

Петля времени

Будущее не должно влиять на прошлое (исход на воздействие)

Взгляд исследователя всегда должен быть направлен в будущее

Обсервационное исследование должно имитировать РКИ

Наблюдение должно начинаться после того, как известно воздействие

Аортальный стеноз: кривая выживаемости

ROSS and BRAUNWALD (1968)

Симптомный аортальный стеноз

ROSS and BRAUNWALD (1968)

Eugène et al. (2021)

Oh et al. (2019)

Time loop: все были обречены

ROSS and BRAUNWALD (1968)

Immortal time bias

Продленное воздействие. Учет исходов до начала воздействия.

Исход до завершения воздействия реклассифицирует участника в группу без воздействия.

В группе воздействия невозможно наступление исхода до завершения воздействия (“период бессмертия”).

Immortal time bias: практическое применение

«Ведь за двадцать лет, кто-нибудь из нас троих обязательно умрёт — или эмир, или ишак, или я. А тогда поди разбирайся, кто лучше знал богословие!» Ходжа Насреддин

Chile COVID-19 vaccine study

Jara et al. (2021)

Сколько доз?

D – число доз вакцины (0, 1 или 2)

Y – заболевание КОВИД-19

Time loop

Знаем ли мы, сколько будет доз в начала наблюдения?

От чего зависит количество доз?

Immortal time – пока не получено 2 дозы

Анализ по person-time under exposure

Immortal time bias и per protocol analysis

Анализ РКИ по протоколу (per protocol) аналогичен immortal time bias:

Пока пациент не получил лечение он не может получить исход, потому что если получит – перейдет в группу “не получивших лечение”.

Информационное искажение

Измеряем не то, что хотим измерить (или плохо измеряем то, что хотим измерять)

  • Суррогатные конечные точки
  • Мисклассификация

    • Недифференцильная

    • Дифференциальная

Information bias

Суррогатная конечная точка

D – воздействие

Y′ – суррогат исхода

Y – исход

CAST Trial

Echt et al. (1991)

CAST Trial

Частая желудочковая экстрасистолия (аритмия) после инфаркта миокарда — предиктор риска аритмогенной смерти.

Есть препараты, эффективно подавляющие желудочковую экстрасистолию (флекаинид, энкаинид).

Гипотеза: флекаинид и энкаинид будут снижать риск аритмогенной смерти.

\[ \frac{(A \implies B) \land (B \implies C)}{A \implies C} \]

CAST Trial

The mechanisms underlying the excess mortality during treatment with encainide or flecainide remain unknown. (N Engl J Med 1991; 324:781–8.)

Мисклассификация

D′, Y′ – способы оценки (операционализации) исхода и воздействия.

Мисклассификация исхода

Недифференциальная мисклассификация

Events Non events Total
Exposed pA (1-p)B A + B
Unexposed pC (1-p)D C + D

\[ RR' = \frac{p}{p}RR = RR \]

Дифференциальная мисклассификация

Events Non events Total
Exposed pA (1-p)B A + B
Unexposed qC (1-q)D C + D

\[ RR' = \frac{p}{q} RR \]

RCT: EXCEL trial

Stone et al. (2019)

Take home messages

  • Данные сами ничего не говорят (даже бигдата и ИИ)

  • Данные обманывают, когда их плохо спрашивают

  • Конфаундинг можно учесть, но не всегда

  • Коллайдер искажает данные, если принять его за конфаундер

  • Ошибка отбора – кто не смог попасть в аналитическую выборку?

  • Информационное искажение – что и как мы измеряем?

  • На данные стоит посмотреть так, как будто это РКИ – это подскажет как провести анализ (Hernán 2021)

Ссылки

Barchuk, Anton, Anna Bulina, Mikhail Cherkashin, Natalia Berezina, Tatyana Rakova, Darya Kuplevatskaya, Oksana Stanevich, Dmitriy Skougarevskiy, and Artemiy Okhotin. 2022. “COVID-19 Vaccines Effectiveness Against Symptomatic SARS-CoV-2 During Delta Variant Surge: A Preliminary Assessment from a Case-Control Study in St. Petersburg, Russia.” BMC Public Health 22 (1). https://doi.org/10.1186/s12889-022-14202-9.
Echt, Debra S., Philip R. Liebson, L. Brent Mitchell, Robert W. Peters, Dulce Obias-Manno, Allan H. Barker, Daniel Arensberg, et al. 1991. “Mortality and Morbidity in Patients Receiving Encainide, Flecainide, or Placebo.” New England Journal of Medicine 324 (12): 781–88. https://doi.org/10.1056/nejm199103213241201.
Eugène, Marc, Piotr Duchnowski, Bernard Prendergast, Olaf Wendler, Cécile Laroche, Jean-Luc Monin, Yannick Jobic, et al. 2021. “Contemporary Management of Severe Symptomatic Aortic Stenosis.” Journal of the American College of Cardiology 78 (22): 2131–43. https://doi.org/10.1016/j.jacc.2021.09.864.
Hernán, Miguel A. 2021. “Methods of Public Health Research Strengthening Causal Inference from Observational Data.” New England Journal of Medicine 385 (15): 1345–48. https://doi.org/10.1056/nejmp2113319.
Jara, Alejandro, Eduardo A. Undurraga, Cecilia González, Fabio Paredes, Tomás Fontecilla, Gonzalo Jara, Alejandra Pizarro, et al. 2021. “Effectiveness of an Inactivated SARS-CoV-2 Vaccine in Chile.” New England Journal of Medicine 385 (10): 875–84. https://doi.org/10.1056/nejmoa2107715.
Oh, Jin Kyung, Jae-Hyeong Park, Jin Kyung Hwang, Chang Hoon Lee, Jong Seon Park, Joong-Il Park, Hoon-Ki Park, et al. 2019. “Long-Term Survival in Korean Elderly Patients with Symptomatic Severe Aortic Stenosis Who Refused Aortic Valve Replacement.” Korean Circulation Journal 49 (2): 160. https://doi.org/10.4070/kcj.2018.0208.
Reis, Gilmar, Eduardo Augusto dos Santos Moreira-Silva, Daniela Carla Medeiros Silva, Lehana Thabane, Aline Cruz Milagres, Thiago Santiago Ferreira, Castilho Vitor Quirino dos Santos, et al. 2022. “Effect of Early Treatment with Fluvoxamine on Risk of Emergency Care and Hospitalisation Among Patients with COVID-19: The TOGETHER Randomised, Platform Clinical Trial.” The Lancet Global Health 10 (1): e42–51. https://doi.org/10.1016/s2214-109x(21)00448-4.
ROSS, JOHN, and EUGENE BRAUNWALD. 1968. “Aortic Stenosis.” Circulation 38 (1s5). https://doi.org/10.1161/01.cir.38.1s5.v-61.
Ruiz, Luis A., Pedro P. España, Ainhoa Gómez, Amaia Bilbao, Carmen Jaca, Amaia Arámburu, Alberto Capelastegui, Marcos I. Restrepo, and Rafael Zalacain. 2017. “Age-Related Differences in Management and Outcomes in Hospitalized Healthy and Well-Functioning Bacteremic Pneumococcal Pneumonia Patients: A Cohort Study.” BMC Geriatrics 17 (1). https://doi.org/10.1186/s12877-017-0518-0.
Stone, Gregg W., A. Pieter Kappetein, Joseph F. Sabik, Stuart J. Pocock, Marie-Claude Morice, John Puskas, David E. Kandzari, et al. 2019. “Five-Year Outcomes After PCI or CABG for Left Main Coronary Disease.” New England Journal of Medicine 381 (19): 1820–30. https://doi.org/10.1056/nejmoa1909406.