Real

Кластеризация

Количество кластеров.

Видно, что кластеров 7-10. Но похоже, что более устойчиво 9 (иначе модель со взаимодействием не строится, а меньше уходит кластер с BRAF 100%).

Иерархическая кластеризация (дендограмма).

Заметных замечаний нет.

Графики визуализации кластеров на 2D-пространстве.

В целом оптимально.

По PCA интересна форма должна быть (словно треугольник или конус).

Графики визуализации кластеров на 3D-пространстве.

Через снижение размерности с помощью PCA.

Через снижение размерности с помощью NMDS.

Через снижение размерности с помощью t-SNE.

Таблица клинических параметров и частот генов.

Показатели

1
N = 22

2
N = 22

3
N = 37

4
N = 36

5
N = 44

6
N = 48

7
N = 77

8
N = 11

9
N = 70

Возраст

67 (62, 72)

65 (56, 73)

66 (59, 74)

67 (54, 76)

67 (57, 72)

68 (54, 76)

67 (64, 71)

63 (59, 68)

66 (56, 71)

Пол

Женский

9 (41%)

13 (59%)

19 (51%)

23 (64%)

25 (57%)

28 (58%)

34 (44%)

5 (45%)

29 (41%)

Мужской

13 (59%)

9 (41%)

18 (49%)

13 (36%)

19 (43%)

20 (42%)

43 (56%)

6 (55%)

41 (59%)

Сторона

Левая половина

11 (50%)

9 (41%)

16 (43%)

7 (19%)

28 (64%)

22 (46%)

29 (38%)

3 (27%)

42 (60%)

Правая половина

3 (14%)

6 (27%)

6 (16%)

28 (78%)

7 (16%)

17 (35%)

19 (25%)

5 (45%)

7 (10%)

Прямая кишка

8 (36%)

7 (32%)

15 (41%)

1 (2.8%)

9 (20%)

9 (19%)

29 (38%)

3 (27%)

21 (30%)

Стадия

I-II

10 (45%)

12 (55%)

13 (35%)

20 (56%)

18 (41%)

19 (40%)

16 (21%)

3 (27%)

27 (39%)

III

7 (32%)

6 (27%)

12 (32%)

15 (42%)

17 (39%)

12 (25%)

29 (38%)

4 (36%)

17 (24%)

IV

5 (23%)

4 (18%)

12 (32%)

1 (2.8%)

9 (20%)

17 (35%)

32 (42%)

4 (36%)

26 (37%)

MSI

0 (0%)

0 (0%)

0 (0%)

36 (100%)

0 (0%)

0 (0%)

0 (0%)

0 (0%)

0 (0%)

BRAF

4 (18%)

1 (4.5%)

0 (0%)

15 (42%)

0 (0%)

0 (0%)

0 (0%)

11 (100%)

0 (0%)

KRAS

0 (0%)

22 (100%)

37 (100%)

9 (25%)

0 (0%)

48 (100%)

77 (100%)

0 (0%)

0 (0%)

NRAS

2 (9.1%)

0 (0%)

1 (2.7%)

0 (0%)

9 (20%)

2 (4.2%)

0 (0%)

0 (0%)

17 (24%)

PIK3CA

11 (50%)

7 (32%)

13 (35%)

8 (22%)

7 (16%)

20 (42%)

14 (18%)

1 (9.1%)

3 (4.3%)

TP53

0 (0%)

0 (0%)

37 (100%)

6 (17%)

42 (95%)

0 (0%)

77 (100%)

11 (100%)

70 (100%)

PTEN

2 (9.1%)

7 (32%)

9 (24%)

8 (22%)

14 (32%)

10 (21%)

30 (39%)

3 (27%)

25 (36%)

TRANSL

0 (0%)

0 (0%)

0 (0%)

4 (11%)

0 (0%)

0 (0%)

0 (0%)

0 (0%)

0 (0%)

APC

15 (68%)

0 (0%)

0 (0%)

9 (25%)

0 (0%)

48 (100%)

77 (100%)

1 (9.1%)

70 (100%)

CTNNB1

0 (0%)

2 (9.1%)

2 (5.4%)

4 (11%)

1 (2.3%)

0 (0%)

0 (0%)

0 (0%)

0 (0%)

FBXW7

2 (9.1%)

0 (0%)

2 (5.4%)

9 (25%)

1 (2.3%)

3 (6.3%)

12 (16%)

0 (0%)

6 (8.6%)

SMAD4

0 (0%)

4 (18%)

4 (11%)

2 (5.6%)

1 (2.3%)

6 (13%)

8 (10%)

2 (18%)

5 (7.1%)

PTEN_3

0 (0%)

1 (4.5%)

1 (2.7%)

4 (11%)

1 (2.3%)

1 (2.1%)

0 (0%)

0 (0%)

2 (2.9%)

TP53_4

4 (18%)

1 (4.5%)

0 (0%)

7 (19%)

0 (0%)

9 (19%)

0 (0%)

0 (0%)

0 (0%)

Клинически оправданные, но лучше внимательно посмотреть. Меня немного удивляют 1 (гетерогенностью) и 2 (прогнозом) кластеры.

Анализ выживаемости

Медианы по кластерам.

Кластеры

Медиана ОВ (95% ДИ)

1

90.5 (НД, НД)

2

96.4 (67.6, НД)

3

48.4 (26.0, НД)

4

НД (НД, НД)

5

51.5 (38.0, НД)

6

50.4 (33.2, НД)

7

44.2 (37.1, 56.6)

8

18.8 (14.1, НД)

9

49.3 (41.7, 104.5)

В целом ожидаемо и даже интересно (наилучший 4 = MSI 100%, наихудший 8 = BRAF 100%).

Кривые Каплана-Мейера по кластерам.

Достаточно наглядно.

Показатели выживаемости по кластерам.

Кластеры

1-летняя

3-летняя

5-летняя

p-value1

groups

<0.001

1

95% (87%, 100%)

90% (79%, 100%)

90% (79%, 100%)

2

100% (100%, 100%)

100% (100%, 100%)

75% (57%, 100%)

3

83% (71%, 96%)

60% (46%, 80%)

39% (24%, 64%)

4

93% (85%, 100%)

82% (69%, 98%)

77% (62%, 95%)

5

95% (88%, 100%)

67% (53%, 85%)

44% (29%, 67%)

6

92% (83%, 100%)

64% (50%, 83%)

38% (24%, 61%)

7

92% (85%, 98%)

63% (52%, 76%)

33% (21%, 50%)

8

81% (60%, 100%)

30% (12%, 78%)

20% (5.9%, 70%)

9

93% (87%, 100%)

70% (59%, 84%)

44% (32%, 61%)

1Log-rank test

Результат теста ожидаем.

Проверяем пропорциональность рисков.

Закономерно, что она здесь нарушается.

Однофакторная регрессия Коксов.

Кластер

HR (95% ДИ)

p-value

1

0.72 (0.2, 2.58)

0.618

2

1.21 (0.41, 3.51)

0.731

3

4.01 (1.6, 10.07)

0.003

5

2.75 (1.08, 6.97)

0.033

6

3.11 (1.25, 7.72)

0.014

7

3.78 (1.59, 8.98)

0.003

8

6.76 (2.33, 19.62)

<0.001

9

2.81 (1.18, 6.71)

0.02

Сравниваем с 4 (наилучшим). Ожидаемо, ДИ широкие из-за размеров кластеров.

Выводим скорректированные кривые общей выживаемости (adjusted survival curve).

Так же через g-формулу получаем контрфактуальные результаты.

Выводим скорректированные предельные результаты многофакторной регрессии Кокса (adjusted marginal HR).

Сравнение

HR (95% ДИ)

1

0.87 (0, 21.13)

2

1.61 (0.06, 9.2)

3

4.26 (0.31, 38.43)

5

3.17 (0.19, 21.93)

6

3.04 (0.17, 21.27)

7

2.81 (0.14, 16.17)

8

8.89 (0.57, 290.37)

9

2.79 (0.16, 17.16)

Тут все грустно. Здесь становится интересно, т.к. очень широкие ДИ появились (т.е. размер кластеров слишком слишком малый). Но это уже наши проблемы, явно мы будем какие-то объединять и т.п.

Выводим resticted mean survival time (ограниченное среднее время выживаемости).

Кластеры

RMST (95% ДИ)

1

55.4 (52.3, 58.5)

2

55.3 (53.1, 57.4)

3

39.2 (35.5, 42.9)

4

50 (46.3, 53.7)

5

44.8 (41.8, 47.8)

6

43.5 (40.5, 46.6)

7

41.6 (39.3, 43.8)

8

27.1 (20.9, 33.3)

9

45 (42.7, 47.4)

Ограничение наблюдения в 5 лет. Результаты немного искажены (из-за срока ограничения, опционально).

Сравним 4 (наилучший) кластер с остальными по RMST.

Сравнения (4 vs all)

Оценка (95% ДИ)

p-value

RMST different

5.9 (-1.7, 13.4)

0.129

RMST ratio

1.1 (1, 1.3)

0.110

Результаты ожидались лучше, но скорее всего искажены из-за срока ограничения (в 5 лет).

Сравним 8 (наихудший) кластер с остальными по RMST.

Сравнения (8 vs all)

Оценка (95% ДИ)

p-value

RMST different

-18.1 (-30.4, -5.8)

0.004

RMST ratio

0.6 (0.4, 0.9)

0.026

А вот здесь результаты скорее всего соответствуют ожиданиям, т.е. у пациентов с BRAF прогноз хуже в среднем на 18 месяцев.