Lý thuyết dự đoán epitope MHC I

Tài liệu được viết cho workflow thiết kế vaccine đa epitope (multi-epitope vaccine, MEV) trong bối cảnh ung thư tuyến giáp thể nhú (papillary thyroid carcinoma, PTC). Các tiêu chí là sàng lọc in silico, không thay thế xác thực in vitro/in vivo.

1. Vị trí của epitope MHC I trong vaccine đa epitope

Epitope MHC class I là peptide nội sinh được trình diện bởi HLA class I cho tế bào T CD8+. Trong vaccine ung thư, nhóm epitope này thường được xem là lớp ứng viên CTL trọng tâm vì tế bào T CD8+ có khả năng nhận diện và tiêu diệt tế bào mang kháng nguyên ung thư hoặc neoantigen.

Đối với PTC, peptide có thể xuất phát từ protein ung thư liên quan BRAF, HRAS, RET, NTRK3, TP53 hoặc các protein khác trong danh sách nghiên cứu. Tuy nhiên, một peptide chỉ nên được xem là ứng viên MHC I nếu đi qua đủ chuỗi bằng chứng: được tạo ra bởi xử lý nội bào, được vận chuyển vào lưới nội chất, gắn HLA class I, có tính kháng nguyên, không dị ứng, không độc và không tương đồng nguy hiểm với protein người.

2. Cơ sở sinh học

Con đường MHC I bắt đầu từ protein nội bào bị thoái hóa bởi proteasome hoặc immunoproteasome. Các peptide tạo thành được vận chuyển qua TAP vào lưới nội chất, tiếp tục được chỉnh sửa bởi peptidase, sau đó gắn vào rãnh của HLA-A, HLA-B hoặc HLA-C. Phức hợp peptide-HLA class I di chuyển ra bề mặt tế bào để được TCR của tế bào T CD8+ nhận diện.

Chiều dài peptide điển hình của MHC I là 8-11 amino acid, trong đó 9-mer là lựa chọn mặc định phổ biến. Một số allele có thể chấp nhận peptide dài hơn, nhưng 8-11 mer vẫn là vùng thực hành chính trong sàng lọc CTL epitope.

3. Nguyên tắc dự đoán

Dự đoán MHC I không nên chỉ dựa vào IC50 hoặc điểm gắn kết. Một peptide có ái lực HLA tốt nhưng không được proteasome tạo ra hoặc không được TAP vận chuyển vẫn có thể không xuất hiện trên bề mặt tế bào.

  • Bước 1: tạo peptide 8-11 mer từ protein đầu vào hoặc từ vùng đột biến.
  • Bước 2: dự đoán HLA class I binding bằng NetMHCpan hoặc công cụ tương đương.
  • Bước 3: kiểm tra cắt C-terminal bằng NetChop.
  • Bước 4: kiểm tra vận chuyển TAP bằng DeepTAP hoặc công cụ TAP khác.
  • Bước 5: sàng lọc VaxiJen, ToxinPred, AllerTOP và human homology.

4. Tiêu chí phân tích kết quả

Tiêu chí Ý nghĩa Cách diễn giải thực hành
%Rank_EL MHC I Xếp hạng khả năng peptide là ligand tự nhiên Ưu tiên %Rank thấp; strong binder theo mặc định NetMHCpan 4.2 là <0.5%, weak binder là 0.5-2%
Affinity/IC50 Ái lực gắn dự đoán nếu bật BA IC50 thấp hỗ trợ binding, nhưng nên ưu tiên %Rank hơn score thô
NetChop Cắt C-terminal Giữ peptide khi vị trí C-terminal có ký hiệu cắt S hoặc xác suất vượt threshold
DeepTAP Khả năng vận chuyển qua TAP Ưu tiên peptide được dự đoán TAP-binding cao hoặc có nhãn positive theo tool
An toàn Không dị ứng/không độc Chỉ giữ non-allergen và non-toxic

5. Diễn giải trong báo cáo

Một epitope MHC I nên được mô tả theo chuỗi logic: peptide - vị trí trong protein - HLA allele - %Rank_EL/%Rank_BA - mức bind - kết quả NetChop - kết quả TAP - VaxiJen - AllerTOP - ToxinPred - quyết định giữ/loại.

Trong vaccine ung thư, nên ưu tiên epitope vừa là strong binder, vừa qua NetChop và TAP, đồng thời thuộc nhiều HLA allele hoặc allele phổ biến trong dân số mục tiêu. Nếu có dữ liệu HLA cá thể, kết quả cá thể hóa có giá trị hơn panel allele chung.

6. Lỗi thường gặp

  • Chỉ chọn peptide theo VaxiJen trước khi kiểm tra HLA binding.
  • Gộp chung HLA-A, HLA-B, HLA-C mà không ghi allele cụ thể.
  • Dùng score thô thay cho %Rank khi so sánh giữa nhiều allele.
  • Bỏ qua NetChop/DeepTAP làm tăng false positive trong epitope CTL.
  • Không kiểm tra tương đồng với human proteome trong bối cảnh vaccine ung thư.

7. Tài liệu tham khảo

  • Nilsson JB et al. NetMHCpan-4.2: improved prediction of CD8+ epitopes by use of transfer learning and structural features. Front Immunol. 2025; doi:10.3389/fimmu.2025.1616113.
  • Reynisson B et al. NetMHCpan-4.1 and NetMHCIIpan-4.0: improved predictions of MHC antigen presentation. Nucleic Acids Res. 2020;48(W1):W449-W454.
  • DTU Health Tech. NetMHCpan 4.2 server and instructions. Accessed 2026.
  • Nielsen M et al. The role of the proteasome in generating cytotoxic T cell epitopes: insights obtained from improved predictions of proteasomal cleavage. Immunogenetics. 2005;57(1-2):33-41.
  • Kesmir C et al. Prediction of proteasome cleavage motifs by neural networks. Protein Eng. 2002;15(4):287-296.
  • DTU Health Tech. NetChop 3.1 server and instructions. Accessed 2026.
  • DeepTAP: an RNN-based method of TAP-binding peptide prediction in the selection of tumor neoantigens. Comput Biol Med. 2023;164:107247.
  • Zhang GL et al. PREDTAP: a system for prediction of peptide binding to the human transporter associated with antigen processing. Immunome Res. 2006;2:3.
  • DeepTAP GitHub/web server. Accessed 2026.
  • Doytchinova IA, Flower DR. VaxiJen: a server for prediction of protective antigens, tumour antigens and subunit vaccines. BMC Bioinformatics. 2007;8:4.
  • VaxiJen v2.0 official server. Accessed 2026.
  • Dimitrov I et al. AllerTOP - a server for in silico prediction of allergens. BMC Bioinformatics. 2013;14(Suppl 6):S4.
  • AllerTOP official server. Accessed 2026.
  • Rathore AS et al. ToxinPred 3.0: an improved method for predicting the toxicity of peptides. Comput Biol Med. 2024;179:108926.
  • ToxinPred3.0 official server and dataset. Accessed 2026.