Hướng dẫn sử dụng NetMHCIIpan cho epitope MHC II

Tài liệu được viết cho workflow thiết kế vaccine đa epitope (multi-epitope vaccine, MEV) trong bối cảnh ung thư tuyến giáp thể nhú (papillary thyroid carcinoma, PTC). Các tiêu chí là sàng lọc in silico, không thay thế xác thực in vitro/in vivo.

1. Mục tiêu sử dụng

NetMHCIIpan 4.3 được dùng để dự đoán peptide gắn HLA class II, bao gồm HLA-DR, HLA-DQ và HLA-DP. Đây là bước chính để chọn HTL epitope trước khi chạy cytokine prediction và các tiêu chí an toàn.

Phiên bản 4.3 được huấn luyện trên dữ liệu binding affinity và eluted ligand mở rộng, bao phủ cả DR, DQ và DP. Vì vậy tài liệu này ưu tiên NetMHCIIpan 4.3 cho workflow MHC II.

2. Chuẩn bị input

  • Nếu nhập FASTA: công cụ tự chia protein thành peptide chồng lấp, mặc định thường dùng 15-mer cho MHC II.
  • Nếu đã có danh sách peptide MHC II từ pipeline: dùng Peptide input.
  • Nếu cần gán peptide với HLA cụ thể: dùng Peptide-MHC input khi phiên bản web hỗ trợ.
  • Với peptide MHC II, không cắt ngắn chỉ còn core 9 aa trước khi chạy; nên chạy peptide đầy đủ 13-25 aa hoặc 15-mer mặc định.

3. Chọn HLA class II

HLA class II cần được chọn theo mục tiêu nghiên cứu. Với vaccine cá thể hóa, dùng HLA typing của bệnh nhân. Với vaccine phổ quát, dùng panel allele đại diện dân số và sau đó kiểm tra population coverage.

Locus Cách chọn đúng Lưu ý
HLA-DR DRB1 và nếu có DRB3/DRB4/DRB5 Không chỉ dùng một DRB1 nếu bệnh nhân có nhiều DR locus liên quan
HLA-DQ DQA1-DQB1 DQ là dị thể alpha-beta; phải dùng đúng cặp allele được công cụ hỗ trợ
HLA-DP DPA1-DPB1 DP có thể có cơ chế peptide inversion; không bỏ qua khi phân tích phủ rộng
Panel dân số Allele phổ biến theo khu vực Cần ghi rõ nguồn panel và allele đã dùng

4. Phối hợp HLA-DQ và HLA-DP

Khi phối hợp HLA-DQ và HLA-DP, không xem DQ hoặc DP là phụ. Một peptide gắn DQ/DP tốt vẫn có thể là HTL epitope có giá trị, nhất là khi không gắn mạnh DR. Tuy nhiên, cần ghi rõ cặp alpha-beta trong kết quả.

  • Bước 1: tạo danh sách HLA-DR, DQ, DP theo bệnh nhân hoặc panel dân số.
  • Bước 2: chạy NetMHCIIpan cho tất cả locus trong cùng điều kiện threshold.
  • Bước 3: gộp output và đếm số allele/locus mà peptide đạt SB/WB.
  • Bước 4: ưu tiên peptide promiscuous có SB ở ít nhất một HLA và WB/SB ở nhiều HLA khác.
  • Bước 5: đưa danh sách qua IFNepitope2, IL2Pred, IL4Pred2, IL5Pred và IL6Pred.

5. Thiết lập khuyến nghị

Mục Thiết lập
Peptide length 15-mer mặc định hoặc 13-25 aa nếu danh sách peptide có sẵn
Strong binder %Rank_EL <1%
Weak binder %Rank_EL 1-5%
BA prediction Bật nếu cần Affinity(nM); không bắt buộc nếu dùng EL
Output Sort by prediction score, Save XLS, giữ cả Core và %Rank_EL
Filtering Có thể lọc %Rank <5 để giảm file lớn; không lọc quá chặt ở lần đầu

6. Phân tích output

Các cột cần giữ gồm Pos, MHC, Peptide, Core, Core_Rel, Inverted, Identity, Score_EL, %Rank_EL và BindLevel. Với DQ/DP, cột MHC phải giữ nguyên tên cặp allele để tránh mất thông tin alpha-beta.

%Rank_EL là tiêu chí chính. Score_EL cao cho thấy likelihood tốt nhưng không nên dùng score thô để so sánh giữa allele. Core giúp xác định motif 9 aa và hỗ trợ phát hiện peptide trùng core trong các peptide chồng lấp.

7. Diễn giải kết quả

Một peptide HTL được ưu tiên nếu có %Rank_EL <1% ở ít nhất một HLA class II, gắn thêm nhiều allele khác ở mức WB/SB, có core hợp lý, không trùng protein người ở mức nguy cơ, VaxiJen positive, non-allergen, non-toxic và cytokine profile phù hợp.

Khi báo cáo, nên trình bày theo peptide duy nhất chứ không theo số dòng raw output. Một peptide có thể tạo nhiều dòng vì gắn nhiều HLA; cần gom nhóm theo peptide và thống kê số HLA-DR/DQ/DP đạt SB/WB.

8. Lỗi thường gặp

  • Chỉ chạy DRB1 và bỏ toàn bộ DQ/DP.
  • Tự ghép DQA1 với DQB1 hoặc DPA1 với DPB1 không có cơ sở.
  • Chỉ lấy peptide có SB ở mọi HLA, làm mất epitope promiscuous thực tế.
  • Xóa cột Core khiến không phân tích được motif.
  • Không giữ thông tin Inverted trong DP khi phiên bản công cụ báo cáo.

9. Tài liệu tham khảo

  • Nilsson JB et al. Accurate prediction of HLA class II antigen presentation across all loci using tailored data acquisition and refined machine learning. Sci Adv. 2023;9:eadj6367.
  • Reynisson B et al. NetMHCpan-4.1 and NetMHCIIpan-4.0. Nucleic Acids Res. 2020;48(W1):W449-W454.
  • DTU Health Tech. NetMHCIIpan 4.3 server and instructions. Accessed 2026.