Real
Кластеризация
Количество кластеров.
Видно, что кластеров 7-10. Но похоже, что более устойчиво 9 (иначе модель со взаимодействием не строится, а меньше уходит кластер с BRAF 100%).
Иерархическая кластеризация (дендограмма).
Заметных замечаний нет.
Графики визуализации кластеров на 2D-пространстве.
В целом оптимально.
По PCA интересна форма должна быть (словно треугольник или конус).
Графики визуализации кластеров на 3D-пространстве.
Через снижение размерности с помощью PCA.
Через снижение размерности с помощью NMDS.
Через снижение размерности с помощью t-SNE.
Таблица клинических параметров и частот генов.
Показатели | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
|---|---|---|---|---|---|---|---|---|---|
Возраст | 67 (62, 72) | 65 (56, 73) | 66 (59, 74) | 67 (54, 76) | 67 (57, 72) | 68 (54, 76) | 67 (64, 71) | 63 (59, 68) | 66 (56, 71) |
Пол | |||||||||
Женский | 9 (41%) | 13 (59%) | 19 (51%) | 23 (64%) | 25 (57%) | 28 (58%) | 34 (44%) | 5 (45%) | 29 (41%) |
Мужской | 13 (59%) | 9 (41%) | 18 (49%) | 13 (36%) | 19 (43%) | 20 (42%) | 43 (56%) | 6 (55%) | 41 (59%) |
Сторона | |||||||||
Левая половина | 11 (50%) | 9 (41%) | 16 (43%) | 7 (19%) | 28 (64%) | 22 (46%) | 29 (38%) | 3 (27%) | 42 (60%) |
Правая половина | 3 (14%) | 6 (27%) | 6 (16%) | 28 (78%) | 7 (16%) | 17 (35%) | 19 (25%) | 5 (45%) | 7 (10%) |
Прямая кишка | 8 (36%) | 7 (32%) | 15 (41%) | 1 (2.8%) | 9 (20%) | 9 (19%) | 29 (38%) | 3 (27%) | 21 (30%) |
Стадия | |||||||||
I-II | 10 (45%) | 12 (55%) | 13 (35%) | 20 (56%) | 18 (41%) | 19 (40%) | 16 (21%) | 3 (27%) | 27 (39%) |
III | 7 (32%) | 6 (27%) | 12 (32%) | 15 (42%) | 17 (39%) | 12 (25%) | 29 (38%) | 4 (36%) | 17 (24%) |
IV | 5 (23%) | 4 (18%) | 12 (32%) | 1 (2.8%) | 9 (20%) | 17 (35%) | 32 (42%) | 4 (36%) | 26 (37%) |
MSI | 0 (0%) | 0 (0%) | 0 (0%) | 36 (100%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) |
BRAF | 4 (18%) | 1 (4.5%) | 0 (0%) | 15 (42%) | 0 (0%) | 0 (0%) | 0 (0%) | 11 (100%) | 0 (0%) |
KRAS | 0 (0%) | 22 (100%) | 37 (100%) | 9 (25%) | 0 (0%) | 48 (100%) | 77 (100%) | 0 (0%) | 0 (0%) |
NRAS | 2 (9.1%) | 0 (0%) | 1 (2.7%) | 0 (0%) | 9 (20%) | 2 (4.2%) | 0 (0%) | 0 (0%) | 17 (24%) |
PIK3CA | 11 (50%) | 7 (32%) | 13 (35%) | 8 (22%) | 7 (16%) | 20 (42%) | 14 (18%) | 1 (9.1%) | 3 (4.3%) |
TP53 | 0 (0%) | 0 (0%) | 37 (100%) | 6 (17%) | 42 (95%) | 0 (0%) | 77 (100%) | 11 (100%) | 70 (100%) |
PTEN | 2 (9.1%) | 7 (32%) | 9 (24%) | 8 (22%) | 14 (32%) | 10 (21%) | 30 (39%) | 3 (27%) | 25 (36%) |
TRANSL | 0 (0%) | 0 (0%) | 0 (0%) | 4 (11%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) |
APC | 15 (68%) | 0 (0%) | 0 (0%) | 9 (25%) | 0 (0%) | 48 (100%) | 77 (100%) | 1 (9.1%) | 70 (100%) |
CTNNB1 | 0 (0%) | 2 (9.1%) | 2 (5.4%) | 4 (11%) | 1 (2.3%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) |
FBXW7 | 2 (9.1%) | 0 (0%) | 2 (5.4%) | 9 (25%) | 1 (2.3%) | 3 (6.3%) | 12 (16%) | 0 (0%) | 6 (8.6%) |
SMAD4 | 0 (0%) | 4 (18%) | 4 (11%) | 2 (5.6%) | 1 (2.3%) | 6 (13%) | 8 (10%) | 2 (18%) | 5 (7.1%) |
PTEN_3 | 0 (0%) | 1 (4.5%) | 1 (2.7%) | 4 (11%) | 1 (2.3%) | 1 (2.1%) | 0 (0%) | 0 (0%) | 2 (2.9%) |
TP53_4 | 4 (18%) | 1 (4.5%) | 0 (0%) | 7 (19%) | 0 (0%) | 9 (19%) | 0 (0%) | 0 (0%) | 0 (0%) |
Клинически оправданные, но лучше внимательно посмотреть. Меня немного удивляют 1 (гетерогенностью) и 2 (прогнозом) кластеры.
Анализ выживаемости
Медианы по кластерам.
Кластеры | Медиана ОВ (95% ДИ) |
|---|---|
1 | 90.5 (НД, НД) |
2 | 96.4 (67.6, НД) |
3 | 48.4 (26.0, НД) |
4 | НД (НД, НД) |
5 | 51.5 (38.0, НД) |
6 | 50.4 (33.2, НД) |
7 | 44.2 (37.1, 56.6) |
8 | 18.8 (14.1, НД) |
9 | 49.3 (41.7, 104.5) |
В целом ожидаемо и даже интересно (наилучший 4 = MSI 100%, наихудший 8 = BRAF 100%).
Кривые Каплана-Мейера по кластерам.
Достаточно наглядно.
Показатели выживаемости по кластерам.
Кластеры | 1-летняя | 3-летняя | 5-летняя | p-value1 |
|---|---|---|---|---|
groups | <0.001 | |||
1 | 95% (87%, 100%) | 90% (79%, 100%) | 90% (79%, 100%) | |
2 | 100% (100%, 100%) | 100% (100%, 100%) | 75% (57%, 100%) | |
3 | 83% (71%, 96%) | 60% (46%, 80%) | 39% (24%, 64%) | |
4 | 93% (85%, 100%) | 82% (69%, 98%) | 77% (62%, 95%) | |
5 | 95% (88%, 100%) | 67% (53%, 85%) | 44% (29%, 67%) | |
6 | 92% (83%, 100%) | 64% (50%, 83%) | 38% (24%, 61%) | |
7 | 92% (85%, 98%) | 63% (52%, 76%) | 33% (21%, 50%) | |
8 | 81% (60%, 100%) | 30% (12%, 78%) | 20% (5.9%, 70%) | |
9 | 93% (87%, 100%) | 70% (59%, 84%) | 44% (32%, 61%) | |
1Log-rank test | ||||
Результат теста ожидаем.
Проверяем пропорциональность рисков.
Закономерно, что она здесь нарушается.
Однофакторная регрессия Коксов.
Кластер | HR (95% ДИ) | p-value |
|---|---|---|
1 | 0.72 (0.2, 2.58) | 0.618 |
2 | 1.21 (0.41, 3.51) | 0.731 |
3 | 4.01 (1.6, 10.07) | 0.003 |
5 | 2.75 (1.08, 6.97) | 0.033 |
6 | 3.11 (1.25, 7.72) | 0.014 |
7 | 3.78 (1.59, 8.98) | 0.003 |
8 | 6.76 (2.33, 19.62) | <0.001 |
9 | 2.81 (1.18, 6.71) | 0.02 |
Сравниваем с 4 (наилучшим). Ожидаемо, ДИ широкие из-за размеров кластеров.
Выводим скорректированные кривые общей выживаемости (adjusted survival curve).
Так же через g-формулу получаем контрфактуальные результаты.
Выводим скорректированные предельные результаты многофакторной регрессии Кокса (adjusted marginal HR).
Сравнение | HR (95% ДИ) |
|---|---|
1 | 0.87 (0, 21.13) |
2 | 1.61 (0.06, 9.2) |
3 | 4.26 (0.31, 38.43) |
5 | 3.17 (0.19, 21.93) |
6 | 3.04 (0.17, 21.27) |
7 | 2.81 (0.14, 16.17) |
8 | 8.89 (0.57, 290.37) |
9 | 2.79 (0.16, 17.16) |
Тут все грустно. Здесь становится интересно, т.к. очень широкие ДИ появились (т.е. размер кластеров слишком слишком малый). Но это уже наши проблемы, явно мы будем какие-то объединять и т.п.
Выводим resticted mean survival time (ограниченное среднее время выживаемости).
Кластеры | RMST (95% ДИ) |
|---|---|
1 | 55.4 (52.3, 58.5) |
2 | 55.3 (53.1, 57.4) |
3 | 39.2 (35.5, 42.9) |
4 | 50 (46.3, 53.7) |
5 | 44.8 (41.8, 47.8) |
6 | 43.5 (40.5, 46.6) |
7 | 41.6 (39.3, 43.8) |
8 | 27.1 (20.9, 33.3) |
9 | 45 (42.7, 47.4) |
Ограничение наблюдения в 5 лет. Результаты немного искажены (из-за срока ограничения, опционально).
Сравним 4 (наилучший) кластер с остальными по RMST.
Сравнения (4 vs all) | Оценка (95% ДИ) | p-value |
|---|---|---|
RMST different | 5.9 (-1.7, 13.4) | 0.129 |
RMST ratio | 1.1 (1, 1.3) | 0.110 |
Результаты ожидались лучше, но скорее всего искажены из-за срока ограничения (в 5 лет).
Сравним 8 (наихудший) кластер с остальными по RMST.
Сравнения (8 vs all) | Оценка (95% ДИ) | p-value |
|---|---|---|
RMST different | -18.1 (-30.4, -5.8) | 0.004 |
RMST ratio | 0.6 (0.4, 0.9) | 0.026 |
А вот здесь результаты скорее всего соответствуют ожиданиям, т.е. у пациентов с BRAF прогноз хуже в среднем на 18 месяцев.