Khung lý thuyết và quy trình xây dựng khung vaccine đa epitope cho ung thư tuyến giáp thể nhú

Phiên bản: 1.0
Mục tiêu: hệ thống hóa khung lý thuyết và workflow thiết kế vaccine đa epitope (multi-epitope vaccine, MEV) cho ung thư tuyến giáp thể nhú (papillary thyroid carcinoma, PTC) dựa trên các epitope MHC-I, MHC-II và B-cell đã sàng lọc từ BRAF, RET, NTRK3, HRAS và TP53.
Đầu vào tham chiếu: epitope_mhci.xlsx, epitope_mhcii.xlsx, bepipred3_bcell_5genes.xlsx và tài liệu nền do người dùng cung cấp.

Ghi chú phạm vi: tài liệu này phục vụ thiết kế in silico và báo cáo phương pháp nghiên cứu. Đây không phải là khuyến cáo sử dụng vaccine trên người. Mọi construct cần được kiểm định bằng in vitro, ex vivo và in vivo trước khi có bất kỳ kết luận tiền lâm sàng hoặc lâm sàng nào.

Mục lục

  1. Nguyên lý trung tâm của vaccine đa epitope
  2. Cơ sở miễn dịch học của từng nhóm epitope
  3. Antigenicity, safety và cytokine prediction
  4. Linker, adjuvant, PADRE và tag
  5. Khung vaccine đề xuất cho project hiện tại
  6. Nguyên tắc chọn số lượng epitope
  7. Workflow chuẩn xây dựng vaccine construct
  8. Tiêu chí chọn construct cuối cùng
  9. Cách diễn giải đặc biệt với epitope từ wild-type driver genes
  10. Checklist báo cáo
  11. Tài liệu tham khảo

1. Nguyên lý trung tâm của vaccine đa epitope

Vaccine đa epitope (multi-epitope vaccine, MEV) là một cấu trúc protein hoặc polypeptide nhân tạo chứa nhiều epitope được tuyển chọn từ một hoặc nhiều protein kháng nguyên. Mục tiêu của MEV là phối hợp đáp ứng miễn dịch qua ba trục chính: tế bào T CD8+ thông qua MHC class I, tế bào T CD4+ thông qua MHC class II, và đáp ứng kháng thể thông qua B-cell epitope. Cách tiếp cận này khác với việc dùng toàn bộ protein vì chỉ giữ các vùng có khả năng trình diện miễn dịch cao, giảm các đoạn không cần thiết và cho phép kiểm soát cấu trúc vaccine bằng linker, adjuvant và các tag kỹ thuật.

Trong thiết kế MEV, chuỗi vaccine không được hiểu đơn giản là phép cộng cơ học của các peptide. Một construct hợp lý phải đáp ứng đồng thời các yêu cầu: được tế bào trình diện kháng nguyên xử lý đúng, giải phóng epitope theo cách phù hợp, tránh tạo junctional epitope bất lợi tại vùng nối, duy trì tính kháng nguyên, không dị ứng, không độc, có độ ổn định sinh hóa, dễ hòa tan, và có độ phủ HLA đủ rộng. VaxiJen, NetMHCpan, NetMHCIIpan, BepiPred, ToxinPred, IEDB Population Coverage, AlphaFold và ClusPro là các công cụ thường gặp trong pipeline immunoinformatics để đánh giá từng tầng của vấn đề này [1-4,7,10,11].

Với ung thư tuyến giáp thể nhú, các gene như BRAF, RET, NTRK3, HRAS và TP53 thường được xem là driver genes hoặc genes liên quan tiến triển ung thư. Nếu epitope được lấy từ protein wild-type của người, bản chất của vaccine là nhắm vào tumor-associated antigen (TAA), không phải vaccine neoantigen đột biến. Điều này có ý nghĩa phương pháp học rất quan trọng: các epitope này có thể giống proteome người vì chúng vốn đến từ protein người. Vì vậy, BLASTp chống human proteome không nên được dùng như tiêu chí loại tuyệt đối, mà nên được dùng để ghi nhận self-homology, đánh giá nguy cơ dung nạp miễn dịch (immune tolerance), nguy cơ tự miễn tiềm tàng và giới hạn diễn giải. Cancer vaccine nhắm self-antigen thường cần adjuvant mạnh để vượt qua tolerance và vi môi trường u ức chế miễn dịch [8].

2. Cơ sở miễn dịch học của từng nhóm epitope

2.1. Epitope MHC-I / CTL epitope

Epitope MHC-I, còn gọi là CTL epitope (cytotoxic T lymphocyte epitope), thường có chiều dài 8-11 amino acid. Các peptide này được sinh ra từ protein nội bào thông qua proteasome hoặc immunoproteasome, sau đó được vận chuyển vào lưới nội chất qua TAP (transporter associated with antigen processing), gắn với MHC class I, rồi được trình diện trên bề mặt tế bào để tế bào T CD8+ nhận diện. Vì vậy, một peptide MHC-I tốt cần vượt qua ít nhất ba tầng sinh học: được tạo ra bởi proteasome, được TAP vận chuyển, và gắn ổn định với HLA class I.

NetMHCpan 4.x là công cụ trung tâm để dự đoán peptide-MHC class I binding/presentation. Phiên bản NetMHCpan-4.1 kết hợp dữ liệu binding affinity và eluted ligand, giúp tăng tính gần với peptide được trình diện tự nhiên trên bề mặt tế bào [2]. Trong bước chọn epitope cuối, nên ưu tiên %Rank_EL thấp. Theo hướng dẫn thường dùng của NetMHCpan, strong binder thường nằm dưới ngưỡng rank rất thấp; trong thực hành, nên ưu tiên nhóm rank tốt nhất, sau đó mới xét đến số lượng HLA được bao phủ, antigenicity, immunogenicity, NetChop và TAP/DeepTAP.

NetChop dự đoán vị trí cắt C-terminal của proteasome. Đây là bước quan trọng vì MHC-I peptide thường phụ thuộc rất nhiều vào đầu C-terminal sau cắt proteasome [5]. TAPPred hoặc DeepTAP giúp bổ sung tầng đánh giá vận chuyển qua TAP. Một peptide có MHC-I binding tốt nhưng không được cắt đúng hoặc vận chuyển kém vẫn có thể không được trình diện hiệu quả.

2.2. Epitope MHC-II / HTL epitope

Epitope MHC-II, còn gọi là HTL epitope (helper T lymphocyte epitope), thường dài hơn MHC-I epitope, hay được dự đoán ở dạng 15-mer. Các peptide này được xử lý trong endosome/lysosome của tế bào trình diện kháng nguyên và được trình diện qua HLA-DR, HLA-DP hoặc HLA-DQ để kích hoạt tế bào T CD4+. Trong vaccine ung thư, tế bào T CD4+ có vai trò hỗ trợ tế bào T CD8+, hỗ trợ B-cell, tăng hình thành trí nhớ miễn dịch và điều hướng cytokine.

NetMHCIIpan 4.x là công cụ trung tâm cho dự đoán MHC-II. Phiên bản NetMHCIIpan-4.0/4.3 sử dụng dữ liệu binding affinity và eluted ligand để cải thiện dự đoán peptide trình diện qua MHC-II [2]. Với construct cuối, không nên chọn MHC-II epitope chỉ vì rank đủ rộng ở bước khám phá ban đầu. Nên ưu tiên các peptide có rank thấp, bind nhiều allele HLA-DR/DQ/DP, có profile cytokine thuận lợi, không độc, không dị ứng và không làm construct quá dài.

Trong vaccine ung thư, HTL epitope có dự đoán IFN-gamma inducing và IL-2 inducing thường được ưu tiên vì liên quan đáp ứng Th1 và tăng sinh T-cell. IL-4 inducing có thể hỗ trợ đáp ứng dịch thể (humoral response). IL-10 inducing cần diễn giải thận trọng vì IL-10 có vai trò điều hòa miễn dịch và có thể liên quan ức chế effector response nếu quá mạnh.

2.3. B-cell epitope

B-cell epitope là vùng peptide hoặc vùng bề mặt protein có thể được B-cell receptor hoặc kháng thể nhận diện. Trong thiết kế MEV dạng tuyến tính, B-cell epitope thường được dùng để tăng khả năng tạo đáp ứng kháng thể. Tuy nhiên, dự đoán B-cell epitope, đặc biệt là conformational epitope, có độ bất định cao hơn so với dự đoán T-cell epitope. Vì vậy, B-cell block nên được giữ gọn, ưu tiên các đoạn ngắn, ưa nước, dễ tiếp cận bề mặt, không độc và không dị ứng.

BepiPred-3.0 là công cụ hiện đại dự đoán B-cell epitope dựa trên protein language model, cải thiện so với các phương pháp cổ điển như propensity scale đơn giản [3]. Trong thực hành, nếu BepiPred tạo ra segment quá dài, nên trim về vùng lõi có điểm cao nhất, thường khoảng 8-20 amino acid, rồi chạy lại các tiêu chí safety và physicochemical. Không nên đưa nguyên các segment quá dài vào construct vì dễ làm tăng instability index và làm giảm solubility.

3. Antigenicity, safety và cytokine prediction

3.1. Tính kháng nguyên (antigenicity)

Antigenicity là khả năng một peptide hoặc protein được hệ miễn dịch nhận diện như một kháng nguyên. Trong immunoinformatics, VaxiJen thường được dùng vì đây là phương pháp alignment-independent, dựa trên các đặc tính lý hóa của amino acid và biến đổi auto cross covariance. VaxiJen có mô hình cho tumour antigen, vì vậy khi thiết kế vaccine ung thư nên chạy bằng tumour model và ghi rõ threshold sử dụng [1].

Với epitope riêng lẻ, VaxiJen giúp loại các peptide có khả năng kháng nguyên thấp. Với construct hoàn chỉnh, VaxiJen cần được chạy lại vì việc thêm linker, adjuvant, PADRE và tag có thể làm thay đổi score toàn chuỗi. Không được suy luận construct là antigenic chỉ vì từng epitope riêng lẻ có antigenicity tốt.

3.2. Tính an toàn: allergenicity và toxicity

Tính an toàn tối thiểu gồm hai trục: không dị ứng (non-allergenic) và không độc (non-toxic). AllerTOP hoặc AlgPred có thể được dùng để dự đoán allergenicity. ToxinPred 3.0 là phiên bản cải tiến của ToxinPred, công bố năm 2024, kết hợp các phương pháp alignment-based, alignment-free, machine learning, deep learning và motif-based để dự đoán peptide/protein toxicity [4].

Nguyên tắc chọn rất rõ: epitope hoặc construct bị dự đoán là toxic nên loại. Epitope hoặc construct bị dự đoán allergenic cần loại hoặc ít nhất không đưa vào candidate chính nếu chưa có lý do mạnh để giữ. Với construct cuối, nên báo cáo cả kết quả epitope-level và construct-level.

3.3. Cytokine prediction

Cytokine prediction chủ yếu áp dụng cho MHC-II/HTL epitope. Với vaccine ung thư, ưu tiên IFN-gamma, IL-2 và đáp ứng Th1 là hợp lý vì mục tiêu chính là tăng đáp ứng tế bào T chống u. IL-4 có thể hỗ trợ đáp ứng kháng thể, nhưng không nên biến vaccine ung thư thành construct quá thiên Th2 nếu mục tiêu chính là CTL response. IL-10 cần được gắn nhãn diễn giải, không nên tự động xem là điểm tốt nếu vaccine cần hiệu ứng chống u mạnh.

Kết quả cytokine chỉ là tầng sàng lọc hỗ trợ. Nó không thay thế được MHC binding, antigen processing, immunogenicity, safety hoặc validation thực nghiệm.

4. Linker, adjuvant, PADRE và tag

4.1. Linker

Linker là thành phần then chốt trong MEV. Khi nối nhiều epitope thành một chuỗi dài, vùng nối có thể tạo junctional epitope mới, làm thay đổi cấu trúc cục bộ hoặc cản trở xử lý kháng nguyên. Do đó, linker phải được chọn theo cơ chế trình diện của từng block.

Bảng 1. Linker khuyến nghị cho construct hiện tại.

Vị trí sử dụng Linker Vai trò chính
Giữa adjuvant và epitope block EAAAK Linker cứng, tạo khoảng cách giữa domain lớn, giảm tương tác không mong muốn
Giữa các MHC-I epitope AAY Hỗ trợ xử lý theo hướng proteasome/MHC-I, giảm junctional epitope
Giữa PADRE và HTL hoặc giữa các MHC-II epitope GPGPG Linker mềm, thường dùng cho HTL epitope, giúp tách epitope MHC-II
Giữa các B-cell epitope KK Linker ngắn, hay dùng trong B-cell block, giúp phân tách các epitope tuyến tính
Trước His-tag nếu cần Không bắt buộc hoặc linker ngắn Tránh ảnh hưởng quá nhiều lên cấu trúc C-terminal

Không có một bộ linker tuyệt đối đúng cho mọi vaccine. Bộ linker đúng là bộ linker phù hợp với logic sinh học của block epitope và giúp construct cuối vượt qua kiểm định antigenicity, safety, physicochemical, 3D model và immune simulation.

4.2. Adjuvant

Peptide vaccine thường có tính sinh miễn dịch yếu nếu thiếu tín hiệu nguy hiểm (danger signal). Adjuvant giúp kích hoạt miễn dịch bẩm sinh, đặc biệt thông qua các pattern recognition receptors (PRR) như Toll-like receptors (TLR), từ đó tăng hoạt hóa tế bào tua (dendritic cell), tăng biểu lộ co-stimulatory molecules và thúc đẩy đáp ứng miễn dịch thích ứng. Trong cancer vaccine, TLR agonists được xem là nhóm adjuvant có cơ sở sinh học vì chúng hỗ trợ vượt qua immune tolerance và môi trường u ức chế miễn dịch [8].

Với construct đầu tiên, nên chọn một adjuvant ngắn và có cơ sở rõ. RS09 là peptide agonist TLR4 ngắn thường được dùng trong thiết kế MEV in silico. Ưu điểm là làm construct gọn hơn so với các adjuvant protein dài. Không nên dùng đồng thời nhiều adjuvant ngay từ đầu vì sẽ làm khó diễn giải kết quả và tăng chiều dài construct.

4.3. PADRE

PADRE (pan-DR epitope) là epitope helper T-cell tổng quát được thiết kế để gắn nhiều HLA-DR phổ biến, giúp tăng hỗ trợ CD4+ T-cell. Trong MEV, PADRE không nên được xem là một “đuôi phụ” tùy ý mà nên được đặt trong hoặc cạnh block HTL, thường nối bằng GPGPG. Vai trò của PADRE đặc biệt quan trọng nếu construct có nhiều CTL epitope nhưng cần tăng hỗ trợ CD4+ T-cell để duy trì memory và hiệu quả lâu dài [9].

4.4. His-tag và signal peptide

His-tag, thường là HHHHHH, chủ yếu phục vụ tinh sạch protein tái tổ hợp bằng Ni-NTA affinity chromatography. Đây là thành phần kỹ thuật, không phải thành phần miễn dịch chính. Nếu báo cáo hướng tới recombinant protein vaccine, có thể giữ His6-tag ở C-terminal. Nếu báo cáo chỉ dừng ở construct in silico hoặc mRNA/DNA vaccine, cần giải thích rõ vai trò của tag hoặc cân nhắc bỏ tag trong variant so sánh.

Signal peptide và MITD chỉ nên thêm khi định hướng nền tảng vaccine là DNA/mRNA hoặc cần điều hướng protein qua secretory pathway/MHC-I trafficking. Nếu project hiện tại đang xây protein/polypeptide MEV, không nên thêm signal peptide hoặc MITD nếu chưa có mục tiêu nền tảng rõ.

5. Khung vaccine đề xuất cho project hiện tại

Với dữ liệu hiện tại gồm MHC-I, MHC-II và B-cell epitope từ 5 genes, khung construct đầu tiên nên gọn, có logic miễn dịch rõ và dễ báo cáo. Khung đề xuất:

N-terminus
RS09
EAAAK
MHC-I epitope 1
AAY
MHC-I epitope 2
AAY
...
MHC-I epitope n
EAAAK
PADRE
GPGPG
MHC-II epitope 1
GPGPG
MHC-II epitope 2
GPGPG
...
MHC-II epitope n
EAAAK
B-cell epitope 1
KK
B-cell epitope 2
KK
...
B-cell epitope n
HHHHHH
C-terminus

Dạng rút gọn:

RS09-EAAAK-[CTL epitopes joined by AAY]-EAAAK-PADRE-GPGPG-[HTL epitopes joined by GPGPG]-EAAAK-[B-cell epitopes joined by KK]-His6

Thứ tự này ưu tiên CTL response trước, sau đó tăng hỗ trợ CD4+ qua PADRE và HTL, cuối cùng thêm B-cell block. Đây là lựa chọn hợp lý cho vaccine ung thư vì đáp ứng tế bào T, đặc biệt CD8+ T-cell, thường là trọng tâm chính của miễn dịch chống u.

6. Nguyên tắc chọn số lượng epitope

Không có số lượng epitope chuẩn tuyệt đối. Mục tiêu không phải là đưa càng nhiều epitope càng tốt, mà là đạt cân bằng giữa breadth miễn dịch, độ phủ HLA, tính ổn định của construct và khả năng sản xuất. Construct quá dài dễ tăng instability index, giảm solubility, tăng nguy cơ junctional epitope và làm mô hình 3D khó tin cậy hơn.

Bảng 2. Số lượng epitope thực hành cho construct đầu tiên.

Nhóm epitope Số lượng nên chọn Số lượng tối đa nên cân nhắc Tiêu chí ưu tiên
MHC-I / CTL 8-12 15 %Rank_EL thấp, nhiều HLA, pass NetChop/DeepTAP, immunogenicity dương
MHC-II / HTL 5-8 10 Rank thấp, đại diện DR/DQ/DP, IFN-gamma/IL-2 inducing, không độc, không dị ứng
B-cell 3-6 8 BepiPred3 cao, đoạn ngắn, ưa nước/bề mặt, non-toxic, non-allergen

Về chiều dài, construct đầu tiên nên hướng đến khoảng 250-450 amino acid nếu có thể. Nếu construct vượt quá khoảng này, cần xem lại số B-cell epitope, các segment quá dài, số lượng linker và adjuvant.

7. Workflow chuẩn xây dựng vaccine construct

Bước 1. Chuẩn hóa dữ liệu đầu vào

Tạo một bảng master để gom toàn bộ epitope:

gene | epitope_type | peptide | length | best_EL_rank | n_binding_hla | hla_list | position | antigenicity | allergenicity | toxicity | cytokine | netchop | deeptap | note

Các thao tác bắt buộc: chuyển toàn bộ sequence sang chữ hoa, loại khoảng trắng, loại ký tự không phải amino acid chuẩn, loại peptide trùng hoàn toàn, hợp nhất peptide giống nhau xuất hiện ở nhiều gene/vị trí và giữ lại thông tin nguồn gốc.

Bước 2. Lọc MHC-I cuối cùng

Tiêu chí ưu tiên:

  1. %Rank_EL tốt nhất, ưu tiên strong binders.
  2. Bind nhiều HLA class I hoặc đại diện tốt cho các HLA phổ biến.
  3. Pass NetChop tại vị trí C-terminal tương ứng.
  4. Pass DeepTAP/TAPPred mức high hoặc moderate.
  5. IEDB MHC-I immunogenicity score dương nếu có.
  6. VaxiJen tumour model positive.
  7. Non-allergen và non-toxic.
  8. Phân bố hợp lý giữa các genes, tránh một gene chiếm toàn bộ construct.

Không nên chọn peptide chỉ vì score VaxiJen cao nếu MHC binding yếu hoặc không pass processing.

Bước 3. Lọc MHC-II cuối cùng

Tiêu chí ưu tiên:

  1. Rank thấp trên NetMHCIIpan.
  2. Có HLA promiscuity, đại diện DR, DQ và DP nếu dữ liệu cho phép.
  3. IFN-gamma inducing và IL-2 inducing được ưu tiên.
  4. IL-4 inducing có thể giữ nếu muốn bổ sung humoral support.
  5. IL-10 inducing mạnh cần gắn nhãn cân nhắc.
  6. VaxiJen positive, non-allergen, non-toxic.
  7. Không trùng lặp quá mức với các peptide khác nếu không làm tăng coverage.

Bước 4. Lọc B-cell epitope cuối cùng

Tiêu chí ưu tiên:

  1. BepiPred3 positive hoặc thuộc vùng có điểm cao.
  2. Chiều dài ưu tiên 8-20 amino acid.
  3. Nếu segment dài, trim vùng lõi có điểm trung bình/cực đại tốt nhất.
  4. Ưu tiên đoạn ưa nước, dễ tiếp cận bề mặt.
  5. Non-allergen và non-toxic.
  6. Không đưa quá nhiều B-cell epitope vào construct đầu tiên.

Bước 5. Chọn adjuvant, linker, PADRE và tag

Construct v1 nên dùng:

  • Adjuvant: RS09.
  • Linker tách adjuvant/block: EAAAK.
  • Linker MHC-I: AAY.
  • Linker MHC-II/PADRE: GPGPG.
  • Linker B-cell: KK.
  • Helper epitope: PADRE.
  • Tag: His6 ở C-terminal nếu định hướng recombinant protein.

Bước 6. Sinh construct FASTA và annotation

Tạo file FASTA:

>PTC_MEV_v1_RS09_CTL_HTL_BCL_PADRE_His6
APPHALSEAAAK...HHHHHH

Tạo thêm file annotation:

start | end | component | sequence | source_gene | epitope_type | linker_before | linker_after

Annotation giúp truy vết từng epitope trong chuỗi cuối, hỗ trợ kiểm tra epitope exposure, mapping trên mô hình 3D và giải thích kết quả docking/immune simulation.

Bước 7. Đánh giá toàn bộ construct

Sau khi ghép xong, phải chạy lại toàn bộ construct thay vì chỉ dùng kết quả epitope riêng lẻ.

Bảng 3. Đánh giá bắt buộc ở cấp construct.

Nhóm đánh giá Công cụ Tiêu chí diễn giải
Antigenicity VaxiJen tumour model Probable antigen, ghi rõ threshold
Allergenicity AllerTOP/AlgPred Non-allergen
Toxicity ToxinPred 3.0 Non-toxic
Physicochemical ProtParam Instability index <40 là lý tưởng; GRAVY âm hoặc gần 0; báo cáo pI và MW
Solubility SOLpro/Protein-Sol Ưu tiên soluble hoặc score >0.5 nếu dùng SOLpro
Population coverage IEDB Population Coverage Ưu tiên >80% nếu đạt được; báo cáo toàn cầu và khu vực quan tâm
Human homology/self-risk BLASTp human proteome Với TAA wild-type, dùng để ghi nhận self-homology, không loại tuyệt đối

Bước 8. Tạo 3-4 biến thể construct

Không nên chỉ tạo một construct. Nên tạo các biến thể có kiểm soát để chọn final candidate.

Bảng 4. Gợi ý biến thể construct.

Variant Cấu trúc Mục tiêu
v1 RS09-CTL-HTL/PADRE-BCL-His6 Khung chính, ưu tiên T-cell response
v2 RS09-HTL/PADRE-CTL-BCL-His6 Kiểm tra ảnh hưởng thứ tự HTL trước CTL
v3 RS09-CTL-HTL/PADRE-BCL rút gọn-His6 Cải thiện instability/solubility nếu B-cell block quá dài
v4 RS09-CTL-HTL/PADRE-BCL, không His-tag Kiểm tra ảnh hưởng tag kỹ thuật lên cấu trúc

Chọn final construct dựa trên toàn bộ tiêu chí, không chọn chỉ vì docking score tốt.

Bước 9. Dự đoán cấu trúc 3D

Dùng AlphaFold/ColabFold hoặc RoseTTAFold để dự đoán cấu trúc 3D của construct. AlphaFold2 đã chứng minh độ chính xác cao trong dự đoán cấu trúc protein [10]. Tuy nhiên, MEV nhân tạo thường có nhiều linker và vùng linh động, nên cần đọc pLDDT/PAE thận trọng. Vùng linker có pLDDT thấp không nhất thiết là lỗi, nhưng domain/epitope quan trọng nếu quá không ổn định thì cần xem lại construct.

Sau khi có mô hình 3D, kiểm tra Ramachandran plot, ProSA/ERRAT/Verify3D nếu dùng, và mapping vị trí epitope để xem các vùng quan trọng có bị chôn lấp hoặc bị kéo vào cấu trúc kém hợp lý hay không.

Bước 10. Docking

Docking nên có mục tiêu sinh học rõ:

Docking Mục tiêu
MEV-TLR4 Kiểm tra tương tác adjuvant/construct với receptor innate nếu dùng RS09/TLR4 agonist
MHC-I epitope-HLA class I Kiểm tra pose của CTL epitope đại diện
MHC-II epitope-HLA-DR/DQ/DP Kiểm tra pose của HTL epitope đại diện
MEV-HLA hoặc MEV-TLR Chỉ dùng khi câu hỏi nghiên cứu phù hợp, không lạm dụng

ClusPro là server docking protein-protein phổ biến, nhưng docking score chỉ là chỉ báo tương đối, không chứng minh hiệu quả vaccine [11]. Với peptide-HLA, docking nên được diễn giải cùng với NetMHC/NetMHCIIpan, không thay thế binding prediction.

Bước 11. Molecular dynamics simulation

Molecular dynamics (MD) simulation có thể dùng để kiểm tra ổn định động học của complex hoặc construct. Các chỉ số thường báo cáo gồm RMSD, RMSF, radius of gyration, hydrogen bonds và MM/PBSA hoặc MM/GBSA nếu có. MD hữu ích để so sánh tương đối giữa các variant, nhưng không chứng minh vaccine có hiệu quả miễn dịch thực tế.

Bước 12. Immune simulation

C-ImmSim hoặc công cụ tương tự có thể dùng để mô phỏng đáp ứng sau prime-boost. Các kết quả cần đọc gồm IgM/IgG, memory B cell, CTL, HTL, IFN-gamma, IL-2 và antigen clearance. C-ImmSim là mô phỏng dựa trên mô hình tính toán, có ích cho so sánh giả thuyết giữa các construct, nhưng không thay thế thí nghiệm PBMC, ELISpot, cytokine ELISA, tetramer staining hoặc mô hình động vật [12].

Bước 13. Codon optimization và in silico cloning

Nếu định hướng sản xuất protein tái tổ hợp, cần tối ưu codon theo hệ biểu hiện dự kiến, ví dụ E. coli, yeast hoặc mammalian cell. Các chỉ số thường báo cáo gồm codon adaptation index (CAI), GC%, vị trí restriction enzymes, vector map và khả năng biểu hiện. Nếu chỉ dừng ở báo cáo immunoinformatics, bước này nên được trình bày như feasibility analysis, không phải bằng chứng thực nghiệm.

8. Tiêu chí chọn construct cuối cùng

Một construct chỉ nên được chọn là candidate cuối nếu đạt các tiêu chí sau:

  1. Antigenicity dương trên VaxiJen tumour model.
  2. Non-allergen trên công cụ allergenicity.
  3. Non-toxic trên ToxinPred 3.0.
  4. Instability index <40 là lý tưởng; nếu >40 phải có lý do và so sánh variant.
  5. GRAVY âm hoặc gần 0, không quá kỵ nước.
  6. Solubility đạt hoặc chấp nhận được.
  7. Population coverage tốt cho HLA class I và class II.
  8. Có số lượng CTL/HTL/B-cell epitope cân đối.
  9. Không có B-cell segment quá dài làm giảm ổn định.
  10. Có annotation rõ từng epitope, linker và nguồn gene.
  11. Docking/MD/immune simulation ủng hộ, nhưng không được dùng như bằng chứng duy nhất.
  12. Có diễn giải rõ rằng đây là vaccine in silico cần validation thực nghiệm.

9. Cách diễn giải đặc biệt với epitope từ wild-type driver genes

Với project hiện tại, câu sau nên được đưa vào phần Methods hoặc Limitations:

Do các epitope được lấy từ protein người wild-type liên quan ung thư tuyến giáp thể nhú, BLASTp chống human proteome không được dùng như tiêu chí loại tuyệt đối. Thay vào đó, bước này được dùng để ghi nhận mức độ self-homology, đánh giá nguy cơ dung nạp miễn dịch/tự miễn, và định vị lại câu hỏi nghiên cứu như một thiết kế vaccine nhắm tumor-associated antigens hơn là neoantigen vaccine.

Đây là điểm khác biệt quan trọng giữa vaccine chống tác nhân nhiễm trùng và vaccine ung thư nhắm TAA. Nếu không ghi rõ, reviewer có thể đặt câu hỏi vì sao epitope giống protein người nhưng vẫn được giữ.

10. Checklist báo cáo

Bảng 5. Checklist tối thiểu trước khi viết kết quả.

Hạng mục Cần có trong báo cáo
Nguồn epitope Gene, protein accession, vị trí peptide, loại epitope
MHC-I HLA allele, %Rank_EL/%Rank_BA, NetChop, TAP/DeepTAP, immunogenicity
MHC-II HLA-DR/DQ/DP, rank, cytokine prediction, promiscuity
B-cell BepiPred3 score/segment, chiều dài sau trim, surface/hydrophilicity nếu có
Safety VaxiJen, AllerTOP/AlgPred, ToxinPred 3.0 cho epitope và construct
Construct FASTA sequence, annotation, linker, adjuvant, PADRE, His-tag
Physicochemical MW, pI, instability index, aliphatic index, GRAVY, solubility
Population coverage Coverage class I, class II, combined nếu có
3D model Tool, confidence score, validation score
Docking/MD Receptor, PDB/model nguồn, score, RMSD/RMSF nếu có
Immune simulation Lịch tiêm mô phỏng, antibody, CTL/HTL, cytokine
Limitation In silico only, TAA/self-antigen, cần validation thực nghiệm

11. Tài liệu tham khảo

  1. Doytchinova IA, Flower DR. VaxiJen: a server for prediction of protective antigens, tumour antigens and subunit vaccines. BMC Bioinformatics. 2007;8:4. DOI: 10.1186/1471-2105-8-4. URL: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-8-4
  2. Reynisson B, Alvarez B, Paul S, Peters B, Nielsen M. NetMHCpan-4.1 and NetMHCIIpan-4.0: improved predictions of MHC antigen presentation by concurrent motif deconvolution and integration of MS MHC eluted ligand data. Nucleic Acids Res. 2020;48(W1):W449-W454. DOI: 10.1093/nar/gkaa379. URL: https://pubmed.ncbi.nlm.nih.gov/32406916/
  3. Clifford JN, Høie MH, Deleuran S, Peters B, Nielsen M, Marcatili P. BepiPred-3.0: improved B-cell epitope prediction using protein language models. Protein Sci. 2022;31(12):e4497. URL: https://orbit.dtu.dk/en/publications/bepipred-30-improved-b-cell-epitope-prediction-using-protein-lang
  4. Rathore AS, Choudhury S, Arora A, Tijare P, Raghava GPS. ToxinPred 3.0: an improved method for predicting the toxicity of peptides. Comput Biol Med. 2024;179:108926. DOI: 10.1016/j.compbiomed.2024.108926. URL: https://pubmed.ncbi.nlm.nih.gov/39038391/
  5. Nielsen M, Lundegaard C, Lund O, Kesmir C. The role of the proteasome in generating cytotoxic T-cell epitopes: insights obtained from improved predictions of proteasomal cleavage. Immunogenetics. 2005;57(1-2):33-41. URL: https://pubmed.ncbi.nlm.nih.gov/15744535/
  6. Bhasin M, Raghava GPS. Analysis and prediction of affinity of TAP binding peptides using cascade SVM. Protein Sci. 2004;13(3):596-607.
  7. Bui HH, Sidney J, Dinh K, Southwood S, Newman MJ, Sette A. Predicting population coverage of T-cell epitope-based diagnostics and vaccines. BMC Bioinformatics. 2006;7:153. DOI: 10.1186/1471-2105-7-153. URL: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-7-153
  8. Jeon D, Hill E, McNeel DG. Toll-like receptor agonists as cancer vaccine adjuvants. Hum Vaccin Immunother. 2024;20(1):2297453. DOI: 10.1080/21645515.2023.2297453. URL: https://pubmed.ncbi.nlm.nih.gov/38155525/
  9. Alexander J, del Guercio MF, Maewal A, et al. Linear PADRE T helper epitope and universal DR-restricted helper epitope design. Immunity. 1994;1(9):751-761.
  10. Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021;596:583-589. DOI: 10.1038/s41586-021-03819-2. URL: https://www.nature.com/articles/s41586-021-03819-2
  11. Kozakov D, Hall DR, Xia B, et al. The ClusPro web server for protein-protein docking. Nat Protoc. 2017;12:255-278. DOI: 10.1038/nprot.2016.169. URL: https://www.nature.com/articles/nprot.2016.169
  12. Rapin N, Lund O, Bernaschi M, Castiglione F. Computational immunology meets bioinformatics: the use of prediction tools for molecular binding in the simulation of immune responses. Bioinformatics. 2010;26(5):668-674.